Тема 5
Представление символов в ПК


Цель

На этом занятии Вы научитесь:

  • ориентироваться в кодовых таблицах;
  • вводить любые символы с клавиатуры.

Содержание

Базовая ASCII-кодировка

Кодовая таблица ANSII

Ввод символов с помощью клавиши

Кодировка Unicode


Вся информация в компьютере представляется в двоичном коде.

Каждому символу соответствует свой индивидуальный набор единиц и нулей, то есть свой персональный код

Именно по этим кодам компьютер и распознает символ, когда читает его из файла или получает с клавиатуры.

 

Базовая ASCII-кодировка

При нажатии алфавитно-цифровых (символьных) клавиш, клавиш , и , а также некоторых их комбинаций с или — генерируются однобайтовые ASCII-коды или двухбайтовые расширенные коды. Исторически сложилось так, что эта система кодировки была первой общепринятой в мире для компьютеров IBM.

Название ASCII представляет собой аббревиатуру английской фразы American Standard Code for Information Interchange  (Американский Стандартный Код для Обмена Информацией). Всего кодов 256 (с 0-го по 255-й). Первые 32 ASCII-кода (с 0 по 31) управляющие и используются для общения с периферийными устройствами или применяются для специальных целей различными программами. Им, как и остальным, присвоены определенные символы, но на экран их можно вывести только прямым обращением в видеопамять.

Чтобы в дальнейшем не было ошибок, запомните, что, например, ASCII 9 относится к клавише , а не к цифре 9, которая имеет по этому стандарту код ASCII 57.

Сначала в системах кодирования было много путаницы. Кодировок гуляло по миру множество. Была основная кодировка, болгарская, КОИ-7, КОИ-8, альтернативная и много других.

Многообразие способов кодирования связано с тем, что при разработке компанией IBM своих первых компьютеров и создании для них компанией Microsoft операционной системы MS DOS, было заложено очень трудно обходимое техническое ограничение на число используемых символов — не более 256. Это количество в то время полностью перекрывали все мыслимые потребности англоязычного пользователя. Странная, на первый взгляд, цифра 256 обусловлена тем, что это максимальное число (2•108), которое может быть записано в двоичной системе в 1-ном байте (8 бит, то есть восемь 0 и 1). А именно 1 байт отводился в MS DOS для хранения любого символа. Последствия этого ограничения со временем и начали проявляться при широком распространении компьютеров не только в англоязычных странах.

В конце концов все же пришли к разумному компромиссу:

  • первые 128 кодов (с 0-го по 127-й) с управляющими символами, некоторыми специальными знаками, цифрами и латинским алфавитом остаются в неприкосновенности;

  • коды со 176-го по 223-й сохранены за символами псевдографики;

  • остальные же коды отданы на откуп потребителям.

У нас наибольшее распространение получила альтернативная ASCII-кодировка, построенная именно по такому принципу: в оставшихся свободными кодах располагаются буквы русского (или другого национального) алфавита. Тем самым обеспечивалась преемственность программного обеспечения, разработанного в других странах, — здесь мы были не "впереди планеты всей...".

В альтернативной ASCII-кодировке:

  • прописные русские буквы:

  • имеют номера со 128 по 159 — (с "А" по "Я"),

  • буква "Ё" стоит особняком под номером 240.

  • строчные русские буквы (чтобы сохранить символы псевдографики) разбросаны:

  • буквы с "а" по "п" имеют номера со 160 по 175,

  • с "р" по "я" занимают позиции с 224 по 239,

  • буква "ё" снова на отшибе и имеет номер 241.

К началу занятия

Кодовая таблица ANSII

Появление Windows вызвало к жизни еще одну систему кодирования символов — ANSI. Это также аббревиатура английской фразы American National Standard Institute (Американский национальный институт стандартов). Кстати, первоначальное название этой кодировки было — OEM.

Система кодирования ANSI стала преемником формата ASCII, сохранив первые 128 символов на своих привычных местах. Все остальные коды также были отданы национальным алфавитам, причем, символы псевдографики из таблицы были изъяты. Варианты национальных кодовых таблиц получили название кодовых страниц с соответствующим номером. Так, например, кодовая страница с кириллицей, используемая в Windows, имеет номер 1251

На кодовой странице номер 1251 русские буквы (кириллица) размещаются следующим образом:

  • Прописные буквы с "А" по "Я" (кроме "Ё") занимают места со 192 по 223.

  • Строчные буквы с "а" по "я" (также кроме "ё") расположены с 224 по 255.

  • Для букв "Ё" и "ё" отведены коды 168 и 184.

К началу занятия

Ввод символов с помощью клавиши

При работе в DOS
все ASCII-коды, начиная с ASCII 32, могут быть выведены на экран с помощью клавиши . Если нажать и, удерживая нажатой клавишу , набрать на дополнительной (малой цифровой) клавиатуре необходимый ASCII-код, то после отпускания соответствующий символ появится на экране в том месте, где перед этим находился текстовый курсор.

При работе в Windows
(здесь речь уже идет об ANSI-кодах) для ввода символов с помощью клавиши нужно поступать точно так же, как в DOS, но перед соответствующим ANSI-кодом символа сначала надо набрать 0 (ноль) и только потом собственно код. Причем, малая цифровая клавиатура должна быть обязательно переключена для ввода цифр (режим NumLock должен быть включен). Например, цифру 9, стоящую на 57-ом месте в таблице кодов, можно ввести с помощью клавиши , набрав код 057.

К началу занятия

Кодировка Unicode

С выходом пакета Microsoft Office 97, легализовалась еще одна система кодирования — Unicode (ранее использовавшаяся в OS UNIX и OS/2). В системе Unicode (другое название ISOInternational Standard Organization) для представления любого символа используется уже не один, а два байта. Поскольку в этом случае число возможных символов равно 2•1016 или 65536, то могут удовлетворяться практически любые потребности всех национальных языков. В настоящее время система Unicode стала “de facto” мировым стандартом. Тем не менее, вряд ли на этом все и остановится. Несмотря на огромное количество возможных кодов (символов), система Unicode все же не способна удовлетворить всем типографским требованиям. Так что, процесс пошел, но “еще не вечер...”

 

ASCII-кодировка, однако, не умерла. Она осталась как базовый формат для представления текстовой информации. Тексты, созданные в этом формате:

  • не имеют различных начертаний шрифта;

  • нет ни курсива, ни полужирного, ни подчеркнутого шрифта — он единый на все случаи жизни;

  • отсутствуют понятия отступов, кеглей и гарнитур;

  • каждая строка представляет собой самостоятельный абзац.

Тем не менее, у ASCII-формата имеется одно очень важное достоинство — он является стандартным, и его понимают абсолютно все программы, работающие с текстами.

 

Предыдущее занятие К началу занятия Следующее занятие

У Ясинский В.Б.