ייצוג שפה כתובה בצורה דיגיטלית (ASCII)

כאשר מקישים על מקש בלוח המקשים של המחשב, נשלח למחשב מידע על האות, או הסימן, אותו רצינו להקליד.

מכיוון שהמחשב מסוגל לקלוט רק מידע בצורתו הדיגטלית, יש צורך לתרגם ולקודד את האות לצורתו הדיגיטלית.

על מנת שמידע הנכתב על ידי אנשים שונים, במחשבים שונים, יוכל לשמש את כולם, יש צורך בקביעת תקנים לקידוד האותיות והסימנים שעל לוח המקשים.

כדי לתאר את אותיות הא"ב באנגלית, הוגדר על ידי האגודה האמריקאית לקוד תיקני, קוד שהתקבל באופן בינלאומי. קוד זה נקרא ASCII על פי ראשי התיבות באנגלית:

ASCII = American National Standard Code for Information Interchange

קוד זה החל כקוד בן 7 סיביות, והורחב לאחר מכן לקוד בן 8 סיביות:

EBCDIC= Extended Binary Coded Decimal Interchange Code.

כל מילה (בַּית = Byte) מורכבת מ 8 סיביות (בִּיטים = Bits).

כל סיבית (ביט) היא "0" או "1". כלומר כל מילה מייצגת מספר בינרי בן 8 סיביות.

 

כמה מספרים בינריים שונים, ניתן ליצור באמצעות 8 סיביות?

התשובה לשאלה זו, מאפשרת לקבוע כמה סימנים של שפה כתובה, ניתן לייצג בצורה בינרית בשיטה זו.

כדי לענות על השאלה נתחיל מהספרה השמאלית ביותר. ספרה זו יכולה להיות באחד משני מצבים: "0" או "1".

עבור כל אחת משתי אפשרויות אלו, יכולה הספרה הסמוכה לה, להיות אף היא באחד משני מצבים. כלומר סך הכול: 22=4 מצבים.

עבור כל אחד מהמצבים שתיארנו, יכולה הספרה הבאה, להיות באחד משני מצבים, כלומר סך הכול: 23=8 מצבים שונים.

בצורה דומה, עבור 8 ספרות ניתן ליצור 28=256 מספרים בינריים שונים.

מתכנני הקוד התאימו לכל אחת מ 256 האפשרויות, תו אחד בלבד.

לדוגמא:

לתו A, נקבע ערך בינרי 01000001 (בכתיב עשרוני 65).

לספרה העשרונית 1, נקבע הערך הבינרי 10110001 (בכתיב עשרוני 49).
כאשר מקלידים על מקש A בלוח המקשים, מועבר ליחידת עיבוד המידע במחשב, הקוד הבינרי המתאים לאות זו.

עקב המגבלה של 256 אפשרויות, החלו הבעיות:

כל זמן שהסתפקו באותיות הא"ב האנגלי (אותיות גדולות וקטנות, בתוספת הספרות וסימני הפיסוק) הספיקו 256 אפשרויות.

ברגע שרצו להכניס למחשב קודים של האותיות והסימנים גם בשפות אחרות, לא הספיקו האפשרויות, ולכן נקבעו תקנים שונים, שאינם פועלים ביחד אחד עם השני.

דוגמה בולטת לכך, היא בעיית כתיבת העברית במחשבים הראשונים:

במחשבי ה Apple הראשונים, ניתן היה להשתמש רק ב 7 סיביות, ולכן היו רק 128 אפשרויות.

מחוסר ברירה, בחרו להשתמש באותיות עבריות במקום האותיות הקטנות באנגלית (a,b,c, …). באמצעות מפסק חיצוני, יכול היה המשתמש לבחור אפשרות כתיבה בעברית עם אותיות גדולות באנגלית, או באנגלית עם אותיות גדולות וקטנות.

במחשבי PC החליפו באמצעות הקובץ Hebrew.com, את אותיות ASCII במקומות 128-154, באותיות העבריות (סך הכול 27 אותיות כולל האותיות הסופיות). אותיות אלה באו במקום תווים באנגלית שאינם נמצאים בשימוש רב.

 

לעמוד הקודם לחץ כאןלעמוד הבא לחץ כאן