Как сделать кодирование информации
Процесс кодирования информации
Что такое кодирование информации
Кодирование – это процесс преобразования данных из исходной формы представления в коды.
Код – это набор условных символов для представления информации.
К целям использования кодирования относятся:
Виды кодирования информации, какие бывают способы изменения вида
Перевести в систему кодов можно текст, цвета, графическое изображение, числа, звук, видео и т.д.
Кодирование текстовой информации
Выделяют 3 основных вида кодирования текста:
Поскольку вся информация представлена в памяти компьютера в двоичной системе, для работы с текстом в ЭВМ используют числовой способ кодирования.
Изначально кодирование символов осуществлялось по 7-битному стандарту. В этой системе вычислительная машина записывала в свою память 128 разных состояний. Каждому из них соответствовала определенная буква, знак или символ.
7-битной системы было недостаточно для записи всех мировых языков. По этой причине создатели программ перешли на 8-битный стандарт, который позволил преобразовать 256 разных знаков.
Двоичное кодирование предполагает, что каждый знак соответствует уникальному двоичному коду. В стандартном коде информационного обмена ASCII регламентируется присвоение символу такой последовательности. Первые 33 кода – это операции, такие как пробел, ввод и т.п. Коды 33 – 127 соответствуют буквам латинского алфавита, цифрам, арифметическим символам и знакам препинания. Коды 128 – 255 – это буквы национального алфавита.
Впервые русские буквы были закодированы в стандарте КОИ-8 на вычислительных машинах с операционной системой UNIX. На сегодняшний день более широко используется стандартная кодировка Microsoft Windows с обозначением «Кириллица». Русские буквы для операционной системы MS-DOS преобразуются в стандарте СР866. В устройствах серии Macintosh компании Apple – это кодировка Мас. Еще один стандарт для представления русского алфавита – ISO 8859-5.
Неудобство существования разных кодовых языков состоит в том, что они не адаптированы. Следовательно, текст, созданный в одном стандарте, не будет отображаться в другой кодовой системе. Разработчики нашли решение этой проблемы и предусмотрели автоматическую перекодировку текстовой информации при работе с разными кодовыми стандартами.
Для работы в интернете применяют международную кодировку Unicode. В отличие от 8-битного стандарта, для преобразования символов использует 2 байта, а не 1. Это позволяет закодировать 65536 различных символов.
Кодирование цвета
Для управления яркостью вводят еще один бит, и получается модель IRGB (от английского Intensity – интенсивность). При этом образуются 8 дополнительных кодов, соответственно, цветовая гамма расширяется до 16 оттенков. Добавляются серый, ярко-синий, ярко-зеленый, ярко-голубой, ярко-красный, ярко-лиловый, ярко-желтый, ярко-белый.
Создание более богатой палитры осуществляется в 6-битной системе, называемой RrGgBb. Код 00 означает, что цвет выключен, 01 – это слабый цвет, 10 – обычный оттенок и 11 – интенсивный. В этом случае можно закодировать 64 цвета. Несмотря на это, на экране параллельно могут отражаться до 16 оттенков, поскольку кодирование в кадровом буфере происходит в 4-битной системе. Представление цвета в RrGgBb применяется на видеоадаптерах EGA.
Еще более широкая гамма доступна в видеоинтерфейсе VGA. Благодаря отведению 6 байт на шифровку каждого основного цвета, количество тонов увеличилось до 256 тыс. Из них на экране одновременно отражается максимум 256 оттенков, так как видеобуфер использует 8-битное преображение информации.
В принтерах используется иная цветовая модель – CMYK. Она базируется на голубом, фиолетовом, желтом и черном цветах (Cyan, Magenta, Yellow, Key color – обозначение черного цвета). Так как эти тона получены при вычитании из белого основных цветов, модель называется субстрактивной.
Выбор такой цветовой модели для полиграфии объясняется техническим удобством. Так как печать производится на бумаге, нужно учитывать свойство поверхности отражать. В этом случае проще считать, сколько света отразилось, чем поглотилось.
Кодирование графической информации
Представление графической информации в компьютерах подразделяется на два формата:
Растровый формат можно назвать точечным. Расположенные строго по строкам и столбцам точки имеют отдельные координаты нахождения на дисплее, цвет и уровень интенсивности. Качество изображения напрямую зависит от количества точек – чем их больше, тем картинка качественнее. Растровый способ кодирования подходит для фотографий.
Векторная графика опирается на закодированные геометрические фигуры. В числовой формат приведены размеры объектов, координаты вершин, толщина контуров цвет заливки. Векторное кодирование удобно применять при создании рекламной продукции.
Кодирование числовой информации
Числа в памяти вычислительных машин хранятся в двоичной системе счисления. Выделяют два способа представления чисел:
Целочисленные значения в компьютере представлены с фиксированной запятой.
Целое положительное число переводят в двоичную систему счисления. К полученному коду приписывают 2 нуля слева. Крайний разряд слева в положительном числе равен 0.
Целое отрицательное число преобразуется следующим образом. Число без минуса переводят в двоичную систему, дополняют его нулями слева. Образовавшийся код переводят в обратный, заменяя нули единицами, а единицы – нулями. К полученной комбинации чисел прибавляют 1.
Порядок кодирования действительного или вещественного числа выглядит следующим образом. Число десятичной системы счисления переводят в двоичную. Определяют так называемую мантиссу числа: перемещают запятую в нужную сторону, чтобы слева не было ни одной единицы. Далее определяют значение порядка – количество знаков, на которое перемещена запятая для определения мантиссы.
Кодирование звуковой информации
Звук – это волны с постоянно меняющейся частотой и интенсивностью, вызванные колебанием частиц. Человек распознает звук благодаря меняющемуся давлению акустической волны на препятствия. Громкость звука зависит от акустики звуковой волны, а тон – от частоты.
При оцифровке непрерывная акустическая волна временно превращается в прерывистую. Дискретная форма представляет собой короткие отрезки с неизменным сигналом.
Частота дискретизации – количество измерений громкости в секунду.
Глубина кодирования звука – количество данных, необходимое для преобразования прерывистых уровней громкости звукового сигнала.
От частоты дискретизации глубины кодирования звука зависит точность воспроизведения оригинального звука. Чем выше эти показатели, тем корректнее представление звуковой информации.
Кодирование видеозаписи
Видеофайл состоит из звукового элемента и графического изображения, поэтому эти составляющие подвергаются раздельной кодировке.
Принципы преобразования звука видеозаписи в двоичную систему аналогичны с кодированием обычной звуковой информации.
Последовательность кодирования графики также схожа с переводом обычного изображения в двоичный код. В случае с видео шифруется лишь первый кадр. Последующие изображения преобразуются относительно предыдущей картинки посредством записи изменений.
По завершении процесса кодирования звуковой дорожки и графики получается двоичный код для хранения в памяти ПК и других электронных носителях. Синхронность воспроизведения видеозаписи осуществляется путем разделения этих операций.
Информатика
Кодирование информации
Занятия с репетитором ОНЛАЙН от 200 руб / час
Бесплатный подбор репетитора на нашем сайте
Перейти
План урока:
Примеры кодирования информации:
Другими словами, переход сообщения из одной формы ее в другую, согласно определенным правилам, и выражает в чем суть кодирования информации.
Информация проходит кодирование в целях:
История кодирования информации насчитывает сотни веков. Издавна люди использовали криптограммы (зашифрованные сообщения).
В 19 веке с изобретением телеграфа С. Морзе был придуман и принципиально новый способ шифрования. Телеграфное сообщение передавалось по проводам последовательностью коротких и долгих сигналов (точка и тире).
Вслед за ним Ж. Бодо создал основополагающий в истории современной информатики метод бинарного кодирования информации, который заключается в применении всего двух различающихся электрических сигналов. Кодирование информации в компьютере также подразумевает использование двух чисел.
Разработанная в 1948г. К. Шенноном «Теория информации и кодирования» стала основополагающей в современном кодировании данных.
Кодирование информации в информатике, одна из базовых тем. Понимание для чего нужна процедура кодирования передаваемой информации, каким образом она осуществляется, поможет в изучении принципов работы компьютера.
Способы кодировки
Проанализируем разнообразные виды информации и особенности ее кодирования.
По принципу представления все информационные сведения можно классифицировать на следующие группы:
Способы кодирования информации обусловлены поставленными целями, а также имеющимися возможностями,методами ее дальнейшей обработки и сохранения. Одинаковые сообщения могут отображаться в виде картинок и условных знаков (графический способ), чисел (числовой способ) или символов (символьный способ).
Способы кодировки.
Соответственно происходит и классификация информации по способу кодирования:
Чтобы расшифровать сообщение, отображаемое в выбранной системе кодирования информации, необходимо осуществить декодирование – процесс восстановления до исходного материала. Для успешного осуществления расшифровки необходимо знать вид кода и методы шифрования.
Самыми распространенными видами кодировок информации являются следующие:
Различают такие методы кодирования информации как:
Двоичный код
Самый широко используемый метод кодирования информации – двоичное кодирование. Кодирование данных двоичным кодом применяется во всех современных технологиях.
Двоичное кодирование информации применяется для различных данных:
Обработка графических изображений
Кодирование текстовой, звуковой и графической информации осуществляется в целях ее качественного обмена, редактирования и хранения. Кодировка информационных сообщений различного типа обладает своими отличительными чертами, но, в целом, она сводится к преобразованию их в двоичном виде.
Рисунки, иллюстрации в книгах, схемы, чертежи и т.п. – примеры графических сообщений. Современные люди для работы с графическими данными все чаще применяют компьютерные технологии.
Суть кодирования графической и звуковой информации заключается в преобразовании ее из аналогового вида в цифровой.
Кодирование графической информации – это процедура присвоения каждому компоненту изображения определенного кодового значения.
Способы кодирования графической информации подчиняются методам представления изображений (растрового или векторного):
Многим станет интересно: «В чем суть кодирования графической информации, представленной в виде 3D-изображений?» Дело в том, что работа с трехмерными данными сочетает способы растровой и векторной кодировки.
Кодирование и обработка графической информации различного формата имеет как свои преимущества, так и недостатки.
Метод координат
Любые данные можно передать с помощью двоичных чисел, в том числе и графические изображение, представляющие собой совокупность точек. Чтобы установить соответствие чисел и точек в бинарном коде, используют метод координат.
Метод координат на плоскости основан на изучении свойств точки в системе координат с горизонтальной осью Ox и вертикальной осью Oy. Точка будет иметь 2 координаты.
Если через начало координат проходит 3 взаимно перпендикулярные оси X, Y и Z, то используется метод координат в пространстве. Положение точки в таком случае определяется тремя координатами.
Система координат в пространстве
Перевод чисел в бинарный код
Числовой способ кодирования информации, т.е. переход информационных данных в бинарную последовательность чисел широко распространен в современной компьютерной технике. Любая числовую, символьную, графическую, аудио- и видеоинформацию можно закодировать двоичными числами. Рассмотрим подробнее кодирование числовой информации.
Привычная человеку система счисления (основанная на цифрах от 0 до 9), которой мы активно пользуемся, появилась несколько сотен тысяч лет назад. Работа всей вычислительной техники организована на бинарной системе счисления. Алфавитом у нее минимальный – 0 и 1. Кодировка чисел совершается путем перехода из десятичной в двоичную систему счисления и выполнении вычислений непосредственно с бинарными числами.
Кодирование и обработка числовой информации обусловлено желаемым результатом работы с цифрами. Так, если число вводится в рамках текстового файла, то оно будет иметь код символа, взятого из используемого стандарта. Для математических вычислений числовые данные преобразуются совершенно другим способом.
Принципы кодирования числовой информации, представленной в виде целых или дробных чисел (положительных, отрицательных или равных 0) отличаются по своей сути. Самый простой способ перевести целое число из десятичной в двоичную систему счисления заключается в следующем:
Одна из важнейших частей компьютерной работы – кодирование символьной информации. Все многообразие цифр, русских и латинских букв, знаков препинания, математических знаков и отдельных специальных обозначений относятся к символам. Cимвольный способ кодирования состоит в присвоении определенному знаку установленного шифра.
Рассмотрим подробнее самые распространенные стандарты ASCII и Unicode – то, что применяется для кодирования символьной информации во всем мире.
Источник Фрагмент таблицы ASCII
Первоначально было установлено, что для любого знака отводится в памяти компьютера 8 бит (1 бит – это либо «0», либо «1») бинарной последовательности. Первая таблица кодировки ASCII (переводится как «американский кодовый стандарт обмена сообщениями») содержала 256 символов. Ограниченная численность закодированных знаков, затрудняющая межнациональный обмен данными, привела к необходимости создания стандарта Unicode, основанного на ASCII. Эта международная система кодировки содержит 65536 символов. Закодировать огромное количество всевозможных обозначений стало возможным благодаря использованию 16-битного символьного кодирования.
Кодирование символьной и числовой информации принципиально отличается. Для ввода-вывода цифр на монитор или использовании их в текстовом файле происходит преобразование их согласно системе кодировки. В процессе арифметических действий число имеет совершенно другое бинарное значение, потому что оно переходит в двоичную систему счисления, где и совершаются все вычислительные действия.
Выбирать способ кодирования информации – графический, числовой или символьный необходимо отталкиваясь от цели кодировки. Например, число «21» можно ввести в компьютерную память цифрами или буквами «двадцать один», слово «ЗИМА» можно передать русскими буквами «зима» или латинскими «ZIMA», штрих-код товара передается изображением и цифрами.
Преобразование звука
Компьютерные технологии успешно внедряются в различные сферы деятельности, включая кодирование и обработку звуковой информации. С физической точки зрения, звук – это аналоговый сплошной сигнал. Процесс его перевода в ряд электрических импульсов называется кодированием звуковой информации.
Задачи, которые необходимо решить для успешной оцифровки сигнала:
Источник Преобразование звука: а) аналоговый сигнал; б)дискретный сигнал.
Различают следующие методы кодирования звуковой информации:
Обработка текста
Текст – осмысленный порядок знаков. С использованием компьютера кодирование и обработка текстовой информации (набор, редактирование, обмен и сохранение письменного текста) значительно упростилось.
Кодирование текстовой информации – присвоение любому символу текста кода из кодировочной системы. Различают следующие стандарты кодировки:
В задачах на кодирование текстовой информации часто встречаются следующие понятия:
Например, мощность алфавита ASCII составляет 256 символов. При этом один знак занимает 8 бит (или 1 байт) памяти, а Unicode – 35536 символов и 16 бит (или 2 байта) соответственно.
Инструменты пользователя
Инструменты сайта
Боковая панель
Навигация
Загрузки всякие
Связь
Содержание
Кодирование информации
Информация может поступать от передатчика к приёмнику с помощью условных знаков или сигналов самой разной физической природы. Сигнал может быть световым, звуковым, тепловым, электрическим, в виде жеста, слова, движения, другого условного знака.
Кодировать и декодировать информацию человек учится с самого раннего детства.
Письмо Льюиса Кэррола
Льюис Кэррол был невероятный человек, о чем можно судить по одному его письму, которое он послал своей знакомой, совсем маленькой девочке. Вот оно, это письмо:
Кодирование положения в пространстве
Кодирование положения шахматной фигуры на доске
Кодирование звука
Нотная грамота
Музыкальные звуки характеризуются следующими свойствами: высота, тембр и громкость. В музыке также используется такое понятие, как длительность звука.
Строгое определение гласит следующее: «высота звука зависит от частоты колебания вибрирующего тела (струна, голосовые связки и т.д.). Чем чаще колебания, тем выше звук». Представьте рычащего медведя. Рык его грубый, страшный, низкий. А теперь представьте поющую птичку. Песня её будет на более «высоких нотах», нежели низкий рык медведя. На нотном стане более высокие ноты находятся выше, а более низкие ноты расположены ниже.
Звукоряд. В основу музыкальной системы положен ряд звуков. Этих звуков ровно 88, расположены они в порядке возрастания высоты звука.
Давайте посмотрим на фрагмент клавиатуры пианино: всего клавиш, включая и белые, и чёрные, ровно 12. Таким образом, октава состоит из 12-ти звуков. Расстояние между двумя соседними звуками получило название полутона. Такой музыкальный строй называется темперированным. В отличие от натурального строя, в нём все полутоны равны.
Для обозначения длительности ноты (сколько по времени должна звучать нота) используют штили (вертикальная палочка), флажки и рёбра. Флажки и рёбра «крепятся» к штилю.
Нота со штилём: ♩. Нота с одним флажком: ♪. Если у нот, расположенных одна за одной, есть флажки (особенно, если количество флажков одинаково), то их можно сгруппировать. Тогда флажки называются рёбрами: ♫ ♬. То есть такая запись: ♫ и вот такая: ♪♪ равносильны.
Нотный стан состоит из 5 горизонтальных линеек, на которых располагаются ноты и другие знаки нотного письма. Линии нотного стана нумеруются снизу вверх. 5 нотных линий разбиваются на такты с помощью вертикальных палочек. Между двумя вертикальными линиями располагается один такт.
Скрипичный Ключ. Этот ключ указывает положение ноты Соль первой октавы:
Басовый Ключ. Указывает расположение ноты Фа малой октавы. Его начертание напоминает запятую, кружок которой указывает линию ноты фа.
Альтовый ключ. Этот ключ указывает расположение ноты До первой октавы: она находится на средней линии нотного стана:
Может возникнуть вопрос: «Почему нельзя обойтись одним ключом»? Читать ноты удобно, когда основная часть нот располагается на нотном стане без дополнительных линий сверху и снизу. Да и сама мелодия таким образом записывается компактней.
Бекар ♮ отменяет действие диеза или бемоля.
Паузы. Длительность пауз определяется абсолютно также, как и у звуков (нот): она может быть равна целой ноте, половинной, четвертной и т.д.
Штрихкод
QR-код
QR-код (англ. quick response — быстрый отклик) — матричный код (двумерный штрихкод), разработанный в 1994 году.
Огромная популярность штрихкодов в Японии привела к тому, что объём информации, зашифрованной в нём, вскоре перестал устраивать индустрию. Японцы начали экспериментировать с новыми способами кодирования небольших объёмов информации в графической картинке.
В отличие от старого штрихкода, который сканируют тонким лучом, QR-код определяется сенсором как двумерное изображение. Три квадрата в углах изображения и меньшие синхронизирующие квадратики по всему коду позволяют нормализовать размер изображения и его ориентацию, а также угол, под которым сенсор расположен к поверхности изображения. Точки переводятся в двоичные числа с проверкой по контрольной сумме.
Основное достоинство QR-кода — это лёгкое распознавание сканирующим оборудованием (в том числе и фотокамерой мобильного телефона).
Максимальное количество символов, которые помещаются в один QR-код:
Миниатюрное издание А. С. Пушкина «Евгений Онегин» в QR-коде
Наибольшее признание он получил среди пользователей мобильной связи — установив программу-распознаватель, абонент может моментально заносить в свой телефон текстовую информацию, добавлять контакты в адресную книгу, переходить по web-ссылкам, отправлять SMS-сообщения и т. д.
QR-коды активно используются в туризме. Например, во Львове разместили QR-коды более чем на 80 туристических объектах. Это позволяет индивидуальному туристу легко ориентироваться в городе, даже не зная украинского языка, так как QR-коды установлены на нескольких языках.
Самый маленький QR-код (версия 1) имеет размер 21×21 пиксель, самый большой (версия 40) — 177×177 пикселей.
Существует четыре основных кодировки QR-кодов: цифровая, алфавитно-цифровая, байтовая и кандзи.
Для исправления ошибок применяется код Рида-Соломона. Благодаря исправлению ошибок, удаётся нанести на QR-код рисунок и всё равно оставить его читаемым.
Компьютерные системы кодирования
В первых компьютерах использовали перфоленты и перфокарты – бумага или картон с дырочками. Есть дырочка(1) и нет дырочки(0).
На смену перфокартам пришли магнитные диски – намагничено(1), ненамагничено(0), потом лазерные диски – есть луч(1), нет луча(0). Таким образом, любое техническое устройство в котором могут быть два состояния, можно использовать для хранения информации в двоичной системе.
Представление целых чисел. Прямой и дополнительный код
Прямой код
Прямой код – это представление числа в двоичной системе счисления, при котором старший (первый слева) разряд отводится под знак числа. Если число положительное, то в левый разряд записывается 0; если число отрицательное, то в левый разряд записывается 1.
В остальных разрядах записывается двоичное представление модуля числа. Например, число −5 в восьмибитном типе данных, использующем прямой код, будет выглядеть так: 10000101.
Таким образом, в двоичной системе счисления, используя прямой код, в восьмиразрядной ячейке (байте) можно записать семиразрядное число. Например:
При этом в вычислительной технике прямой код используется почти исключительно для представления положительных чисел.
Для отрицательных чисел используется так называемый дополнительный код. Он позволяет заменить операцию вычитания на операцию сложения и сделать операции сложения и вычитания одинаковыми для знаковых и беззнаковых чисел, чем упрощает архитектуру ЭВМ.
Например, у нас два числа, представленных в прямом коде. Одно число положительное, другое – отрицательное и эти числа нужно сложить. Однако просто сложить их нельзя. Сначала компьютер должен определить, что это за числа. Выяснив, что одно число отрицательное, ему следует заменить операцию сложения операцией вычитания. Потом, машина должна определить, какое число больше по модулю, чтобы выяснить знак результата и определиться с тем, что из чего вычитать. В итоге, получается сложный алгоритм. Куда проще складывать числа, если отрицательные преобразованы в дополнительный код.
Обратный код
Прямой код, в котором все биты, кроме знакового, инвертированы
Дополнительный код
Обратный код числа + 1
основывается на ограниченности разрядной сетки. Отрицательное число, равное по модулю заданному положительному, образуется путём его вычитания из минимального выходящего за данную разрядную сетку положительного числа (например, для 8-битного числа это 1 0000 0000)
В дополнительном коде, также как и прямом, старший разряд отводится для представления знака числа. Прямой код используется для представления положительных чисел, а дополнительный – для представления отрицательных.
Далее следует прибавить единицу к получившемуся инверсией числу:
1 1110011 + 1 = 1 1110100
В итоге и получается число, которое принято называть дополнительным кодом числа.
Алгоритм для отрицательных чисел:
Примеры для однобайтого знакового числа:
Дополнение до 1 и дополнение до 2 (англ. Two’s complement):
Дополнительный код для десятичных чисел
Тот же принцип можно использовать и в компьютерном представлении десятичных чисел: для каждого разряда цифра X заменяется на 9−X, и к получившемуся числу добавляется 1. Например, при использовании четырёхзначных чисел −0081 заменяется на 9919 (9919+0081=0000, пятый разряд выбрасывается).
Пример для гипотетического процессора, использующего 10-ичную систему счисления:
Декодирование
Если значение старшего разряда равно 0, то в остальных разрядах записано положительное двоичное число, совпадающее с прямым кодом.
Если в старшем разряде находится 1, то мы имеем дело с дополнительным кодом и с отрицательным числом.
Для декодирования целого положительного числа со знаком нужно просто перевести его в десятичную систему счисления.
Для декодирования целого отрицательного числа со знаком нужно:
Почему дополнительный код
Двоичное вычитание заменяют сложением с отрицательным числом. А в сумме два числа с разными знаками, но с одинаковой абсолютной величиной должны давать 0.
Проверим это для двоичного компьютерного представления этих чисел.
0100 0001+1011 1111 = 1 0000 0000
Перенос единицы в старший разряд выходит за границы байта и теряется. Все 8 бит байта равны 0.
Величину положительного числа определяют биты-единички.
Величину отрицательного числа фактически определяют биты-нолики. Если рассмотреть весовые значения битов-нулей (два в степени номер цифры), как если бы они были 1, сложить и к полученному числу прибавить 1, то получим абсолютное значение отрицательного числа.
Реализация
Недостатки
Умножение и деление
Вычитание выполняется просто: инвертируем число, прибавляем один и получаем это число с минусом, затем просто делаем сложение. Однако умножение с числами, представленными дополнительным кодом, выполнять не всегда оптимально: алгоритм либо слишком медленный (наивный алгоритм работает за O(n^2)), либо слишком сложный. Лучше для умножение использовать прямой код (бит под знак). Тогда можно числа перевести в десятичную систему счисления, выполнить быстрое преобразование Фурье за O(nlogn), затем перевести их обратно в двоичную. Обычно такой алгоритм работает быстрее, чем выполнение операции напрямую с двоичными числами. Для деления обычно тоже лучше использовать прямой код.
Код со сдвигом
По сути, при таком кодировании:
Достоинства представления чисел с помощью кода со сдвигом
Недостатки представления чисел с помощью кода со сдвигом
Из-за необходимости усложнять арифметические операции код со сдвигом для представления целых чисел используется не часто, но зато применяется для хранения порядка вещественного числа.
Представление вещественных чисел
Любое десятичное вещественное число Х может быть представлено в виде: Х = M × 10^p
Мантисса в нормализованном представлении должна удовлетворять условию: 0,1 буква алфавита → точки и тире азбуки Морзе
но нет таблицы, позволяющей выполнить обратное преобразование:
точки и тире азбуки Морзе → буква алфавита.
А ведь при первом знакомстве с азбукой Морзе такая таблица была бы очень кстати. Увы, принципы ее построения уловить ой как непросто. В наборах точек и тире нет ничего такого, что можно было расставить в алфавитном порядке.
Попробуем сгруппировать коды в зависимости от количества точек и тире. Сначала поставим коды, состоящие из единственного значка, — это буквы Е (точка) и Т (тире)
Сочетания двух точек и (или) тире дают четыре буквы — И, А, Н и М.
Из сочетаний трех точек и тире получается уже 8 букв
Используя эти четыре таблицы, расшифровать сообщение, написанное «морзянкой», гораздо легче. Подсчитав число точек и тире в коде буквы, вы сразу возьмете нужную таблицу.
Нетрудно заметить закономерность и в размерах таблиц — каждая следующая таблица вдвое больше предыдущей. Это и понятно: в каждую таблицу включены все коды из предыдущей таблицы с дополнительной точкой и те же коды с дополнительным тире.
От таблицы к таблице число кодов удваивается: в первой 2 кода, во второй 2 · 2, в третьей — 2 · 2 · 2…
Раз уж мы начали умножать числа сами на себя, можно записать эти примеры в виде возведения в степень. Например, 2 · 2 · 2 · 2 есть просто 2 в четвертой степени. Числа 2, 4, 8 и 16 — это степени числа 2. Число доступных кодов есть 2 в степени, равной числу точек и тире.
Для облегчения расшифровки азбуки Морзе нарисуем древовидную диаграмму. На ней показано, как найти букву, соответствующую заданной последовательности точек и тире. Для расшифровки кода нужно идти по направлению, указанному стрелками. Пусть нужно определить, какая буква соответствует коду «точка-тире-точка». Начнем с крайней левой точки: перемещаясь по стрелке вправо, переходим к тире, а затем — к точке. Итак, это буква Р, показанная справа от последней точки.
Схема наглядно показывает, все ли возможные комбинации точек и тире уже использованы, что позволяет избежать введения излишне длинных последовательностей.
Мы можем дополнить схему кодами, состоящими из большего числа точек и тире. Последовательность из пяти точек и тире дает 32 дополнительных кода (2 · 2 · 2 · 2 · 2 = 2^5). Этого вполне хватит для 10 цифр и 16 основных знаков препинания, и цифры в азбуке Морзе действительно кодируются пятью точками и тире.
Чтобы включить все знаки препинания, схему нужно расширить до шести точек и тире, добавив в общий набор символов еще 64 (2 · 2 · 2 · 2 · 2 · 2 = 2 6 ) дополнительных кода, увеличив общее число кодов до 2 + 4 + 8 + 16 + 32 + 64 = 126. Для азбуки Морзе это уже явный перебор, и действительно, многие из длинных последовательностей остались в ней «неопределенными». В данном контексте выражение «неопределенный код» означает, что коду не соответствует никакой символ.
Характерной особенностью азбуки Морзе является переменная длина кода разных букв.
Тактильные коды
Шрифт Брайля
Сначала для записи букв, которые можно читать тактильно, использовали систему рельефных букв. Однако на практике с этой системой было очень трудно работать. Автор системы считал, что буква А — это А и ничто другое и потому должна походить на А даже на ощупь.
Капитан французской армии Шарль Барбье (Charles Barbier) разработал в 1819 г систему кодирования, которую назвал «ночное письмо». В этой системе применялись выпуклые точки и тире на плотной бумаге, и предлагалась она солдатам как средство беззвучной ночной связи в полевых условиях. Солдаты должны были продавливать точки и тире с обратной стороны бумаги пером, похожим на шило. Получатель письма читал эти выпуклости, водя по ним кончиками пальцев. Система оправдывала себя при передаче коротких сообщений, но была совершенно непригодна для длинных текстов, не говоря уже о книгах.
Луи Брайль познакомился с системой Барбье в возрасте 12 лет. Система рельефных точек пришлась ему по душе, так как позволяла не только легко читать с помощью пальцев, но и писать. Ученик, вооружившись картоном и специальным пером, делал в классе заметки, которые мог затем прочитать дома. Совершенствуя в течение трех лет эту систему, Луи Брайль разработал собственный шрифт (ему тогда было 15 лет), основы которого используются и поныне.
В шрифте Брайля символы письменного языка — кодируются комбинациями от одной до шести выпуклых точек, расположенных в ячейке размерами 2 х 3. Точки в ячейке нумеруются с 1 по 6.
Пишется текст справа налево, затем страница переворачивается, и текст читается слева направо. Высоты точки в 0,5 мм достаточно для её распознавания на ощупь. Расстояние между точками занимает около 2,5 мм.
Для нас самое интересное в шрифте Брайля то, что он является двоичным. Любая точка может пребывать в одном из двух состояний: плоская или выпуклая. Это значит, что к шрифту Брайля применимы наши познания об азбуке Морзе. Общее число комбинаций шести точек, каждая из которых может быть плоской или выпуклой, равно 64. Следовательно, система Брайля содержит 64 различных кода.
Вследствие такой ограниченности общего числа различных комбинаций точек, часто используются многоклеточные знаки (состоящие из двух и более знаков, по отдельности имеющих свои функции).
Существуют много версий шрифта Брайля для разных языков.
Код с выпуклой точкой 6 есть признак прописной буквы, указывающий, что следующая за ним буква является прописной.
Многие из кодов несут двойную нагрузку. Особо отметим код-признак числа и отменяющий его код-признак буквы. Эти коды изменяют смысл последующих символов: буквы становятся цифрами и наоборот. Такие коды иногда называют кодами переключения (shift). Код переключения меняет смысл всех следующих кодов, пока его действие не будет отменено.
Признак прописной буквы означает, что следующая за ним буква (и только она) должна интерпретироваться как прописная, а не строчная. Код такого типа называется escape-кодом. Это название происходит от английского слова «escape» (убегать, вырываться): escape-код как бы позволяет «избежать» обыденного восприятия кода и взглянуть на него по-новому.
Обонятельные коды
Обонятельные рецепторы прикреплены к мембране рецепторных клеток, которые выстилают поверхность небольшой области в верхней части носовой полости, образуя обонятельный эпителий. Каждая клетка содержит рецепторы только одного определенного вида. Белок-рецептор образует «карман» для связывания молекулы одоранта (химического вещества, обладающего запахом). Рецепторы разных видов отличаются деталями своей структуры, поэтому «карманы»-ловушки имеют разную форму. Когда молекула попадает в «карман», форма белка-рецептора изменяется, и запускается процесс передачи нервного сигнала. Каждый рецептор может регистрировать молекулы нескольких различных одорантов, трехмерная структура которых в той или иной степени соответствует форме «кармана», но сигналы от разных веществ отличаются по интенсивности. При этом молекулы одного и того же одоранта могут активировать несколько разных рецепторов одновременно.
Такое сочетание разнообразия рецепторов и химических свойств молекул, с которыми они взаимодействуют, генерирует широкую полосу сигналов, создающих уникальный «отпечаток» запаха. Каждый запах как бы получает код (подобно штрих-коду на товарах в супермаркете), по которому его можно безошибочно узнать в следующий раз. Именно благодаря этому коду мы способны распознавать и запоминать около 10 тысяч запахов.
КАК ВОСПРИНИМАЕТСЯ ЗАПАХ
При вдохе через нос воздух вместе с молекулами пахучего вещества (называемого обонятельным стимулом или одорантом) проходит в каждой из двух носовых полостей по щелевидному каналу сложной конфигурации. Здесь воздух очищается от пыли, увлажняется и нагревается. Затем часть воздуха поступает в расположенную в верхней задней зоне канала обонятельную область, имеющую вид щели, покрытой обонятельным эпителием.
Основная функция обонятельного рецептора состоит в выделении, кодировании и передаче информации об интенсивности, качестве и продолжительности запаха в обонятельную луковицу и специальным центрам в головном мозге.
Обонятельная система использует комбинаторную схему для идентификации одорантов и кодирования сигнала. Согласно ей один тип обонятельных рецепторов активируется множеством одорантов и один одорант активирует множество типов рецепторов. Различные одоранты кодируются различными комбинациями обонятельных рецепторов, причем увеличение концентрации стимула приводит к возрастанию числа активируемых рецепторов и к усложнению его рецепторного кода. В этой схеме каждый рецептор выступает в качестве одного из компонентов комбинаторного рецепторного кода для многих одорантов и как бы выполняет роль буквы своеобразного алфавита, из совокупности которых составляются соответствующие слова-запахи.
Остается еще множество вопросов, касающихся механизмов и видов воздействия запахов на эмоциональное, психическое и физическое состояния человека. В последнее время на эту тему появилось немало спекуляций, чему поспособствовал вышедший в 1985 году роман П. Зюскинда «Парфюмер», более восьми лет прочно занимавший место в первой десятке бестселлеров на западном книжном рынке. Фантазии на тему чрезвычайной силы подсознательного воздействия ароматов на эмоциональное состояние человека обеспечили этому произведению огромный успех.
Классификация запахов
Хеннинг различает такие виды запахов: 1. фруктовый; 2.пряный; 3. цветочный; 4. смолистый; 5. горелый; 6. гнилостный.
Вкусовые коды
Сколько вкусов чувствует наш язык? Все знают сладкий вкус, кислый, соленый, горький. Сейчас к этим четырем основным официально добавили еще и пятый — вкус умами (от японского слова «умаи» — вкусный, приятный). Этот вкус характерен для белковых продуктов: мяса, рыбы и бульонов на их основе. Обсуждаются сегодня и новые вкусы, пока не входящие в классификацию: например, металлический вкус (цинк, железо), вкус кальция, лакричный, вкус жира, вкус чистой воды.
Язык человека покрыт более 5000 сосочков разной формы. Грибовидные занимают в основном две передние трети языка и рассеяны по всей поверхности, желобовидные (чашевидные) расположены сзади, у корня языка, — они большие, их легко увидеть, листовидные — это тесно расположенные складки в боковой части языка.
Каждый из сосочков содержит вкусовые почки. Немного вкусовых почек есть также в надгортаннике, задней стенке глотки и на мягком нёбе, но в основном они, конечно, сосредоточены на сосочках языка. Почки имеют свой специфический набор вкусовых рецепторов. Так, на кончике языка больше рецепторов к сладкому — он чувствует его гораздо лучше, края языка лучше ощущают кислое и соленое, а его основание — горькое. Некоторые рецепторы расположены в желудке и отвечают за чувство удовольствия от пищи.
Рецепторные клетки обновляются примерно каждые десять дней, поэтому если обжечь язык, то вкус теряется только на время.
Молекула вещества, вызывающего определенное вкусовое ощущение, может связаться только со своим рецептором. Если такого рецептора нет или он или сопряженные с ним биохимические каскады реакций не работают, то вещество и не вызовет вкусового ощущения.
Вкус и запах, температура, текстура пищи
Почему при насморке теряется вкус? Воздух с трудом проходит в верхнюю часть носовых ходов, где расположены обонятельные клетки. Временно пропадает обоняние, поэтому мы плохо чувствуем и вкус тоже, поскольку эти два ощущения теснейшим образом связаны (причем обоняние тем важнее, чем богаче пища ароматами). Пахучие молекулы высвобождаются во рту, когда мы пережевываем пищу, поднимаются вверх по носовым ходам и там распознаются обонятельными клетками. Насколько важно обоняние в восприятии вкуса, можно понять, зажав себе нос. Кофе, например, станет просто горьким. Кстати, люди, которые жалуются на потерю вкуса, на самом деле в основном имеют проблемы с обонянием.
Теперь о температурных рецепторах, которые также очень важны. Почему мята дает ощущение свежести, а перец жжет язык? Ментол, входящий в мяту, активирует рецептор TRPM8, который начинает работать при падении температуры ниже 37С — то есть он отвечает за формирование ощущение холода. Капсаицин, один из компонентов жгучего перца, наоборот активирует рецепторы тепла TRPV1, которые активируются при повышении температуры выше 37С. Именно поэтому капсаицин вызывает ощущение жгучести. Кстати, температура пищи имеет огромное значение — вкус выражен максимально, когда она равна или чуть выше температуры полости рта.
Как ни странно, зубы тоже участвуют в восприятии вкуса. О текстуре пищи нам сообщают датчики давления, расположенные вокруг корней зубов. В этом принимают участие и жевательные мускулы, которые «оценивают» твердость пищи. Доказано, что, когда во рту много зубов с удаленными нервами, ощущение вкуса меняется.
Сладкое
Члены семейства кошачьих проявляют равнодушие к сладкому. Это связано с тем, что у них неактивен рецептор к сладким веществам — в гене, кодирующем этот рецептор, найдена специфическая для кошек мутация. Возможно, у этих хищников в процессе эволюции отпала необходимость в поиске высокоэнергетичных углеводов, что и привело к изменению вкусовой системы. Ведь она должна соответствовать диете.
Горькое
Горький вкус — это сигнал опасности, поскольку такой вкус имеют большинство ядовитых веществ. Видимо, по этой причине «горьких» рецепторов больше: умение вовремя различить опасность может быть вопросом жизни и смерти.
Соленое
У человека ощущение соленого вызывают несколько солей, но, пожалуй, хлорид натрия действует сильнее других. Ионы натрия принципиально важны для жизнедеятельности клеток и не могут быть заменены никакими другими, а при этом теряются они постоянно.
Кислое
Вкус кислого не связан со специфической группой питательных веществ и ассоциируется лишь с содержанием протонов. Вероятно, этот вкус эволюционировал как индикатор спелости — чтобы сразу понять, созрел ли фрукт и можно ли его есть. Многим нравится кисловатый вкус, но мы избегаем сильной кислоты, поскольку она может повредить зубы и пищеварительную систему.
Умами
Вкус умами вызывают аминокислоты и некоторые пептиды, он может служить интегральным показателем содержания белков в пище. Специфическое свойство вкуса умами — синергизм, то есть существенное усиление вкуса в присутствии некоторых других веществ.
Задача вкусовых клеток — не только распознавать и усиливать вкусовые сигналы, но и кодировать их, преобразуя в тот вид, который удобен для дальнейшего анализа в мозгу. Хотя принципы кодирования вкусовой информации не вполне ясны, но по совокупности данных практически нет сомнений в том, что все пять вкусов индивидуально представлены в мозгу и информация о них передается от специализированных вкусовых клеток по нервным волокнам вкусового нерва.