единицы информации и информационные отношения
Информационные отношения
Между различными объектами, свойствами объектов и объектами существуют всевозможные объективные отношения, определяемые предметной областью (пространственные, временные, функциональные и т. п.). При информационном отображений объектов и присущих им свойств эти отношения переносятся на отношения между составными единицами информации, с помощью которых представляются объекты и их свойства.
Для установления связи между составными единицами информации используется понятие «групповое отношение». Групповым отношением называется бинарное отношениеSk⊂ Gi×Gj, заданное на двух множествах групп Gi и Gj.
Групповое отношение позволяет устанавливать связи между группами и тем самым выражать отношения между объектами. Групповые отношения различаются прежде всего тем, как связаны между собой конкретные представители множеств групп Gi и Gj в групповом отношении. Часто основные виды групповых отношений называют отношениями 1:1, 1:n, n:1 и n:m, а указанные пары чисел-коэффициентом группового отношения. Рис. 11.
В отношении с коэффициентами группового отношения вида 1:1, 1: n и n : m группа qi называется родительской, a qj – подчиненной. В отношении n:1,наоборот, qj – родительская, a qi – подчиненная.
Иерархическим называется групповое отношение, в котором каждая подчиненная группа может быть связана только с одной родительской. Отношения вида 1:1, 1:n, n:1 являются иерархическими.
Неиерархическое отношение, напротив, позволяет соотносить каждую подчиненную группу с произвольным числом родительских групп. Иногда групповые отношения вида1:1, 1:n, n:1
Рис. 11. Групповое отношение
Графически группы и групповые отношения удобно изображать в виде диаграмм, используя следующие соглашения. На диаграммах группы изображаются прямоугольником, над левым верхним углом которого помещается имя группы. Внутри прямоугольника могут быть показаны имена реквизитов. Групповые отношения обозначаются стрелками, проведенными от родительского к подчиненному типу группы с возможным указанием коэффициента группового отношения(1:1, 1:n, n:1 и n:m) и имени группового отношения.
Если диаграмму трактовать как ориентированный граф и группы в диаграмме отождествлять с вершиной графа, а отношения – с дугой графа, то путем в диаграмме называется такая последовательность групповых отношений (дуг), что конец каждой предыдущей дуги совпадает с началом следующей. Рис. 12.
Единицы информации и информационные отношения
Во многих научных направлениях применяют: базовые элементарные частицы, атомарные объекты, элементы и т.п., для построения теорий или объяснения явлений и процессов окружающего мира. Обобщенно можно обозначить их термином базовые элементы теории. В науках об информации и науках, которые используют информацию (языкознание, лингвистика, когнитивная семантика, искусственный интеллект, управление и др.) такими базовыми элементами теории часто являются информационные единицы [1]. Следует отметить, что термин «науки об информации» является более адекватным, чем термин «теория информации». С одной стороны он включает информатику и различные науки об информационных технологиях. С другой стороны теория информации до настоящего времени не сформирована и существует два разных ее направления.
Первое направление можно условно назвать статистической теорией информации. Оно основано на работе К.Э. Шеннона «математическая теория связи» [2]. Под «информацией» в этой теории понимают «нечто», что уменьшает неинформированность и неопределенность, а именно уменьшает «незнание». Количеством информации в этой теории называют информационную емкость носителя информации, сообщения или иной информационной конструкции безотносительно к содержанию. Ее измеряют в байтах и битах, безотносительно к тому, что в этих байтах содержится или не содержится ничего.
Второй подход развит в работах Н. Виннера [3], Р. Карнапа [4], Л. Флориди [5]. В этом подходе под информацией понимают содержание информационной конструкции безотносительно к ее объему и часто рассматривают это в аспекте семантики. Эта теория часто называется семантической теорией информации. Под «информацией» в этой теории понимают «нечто», что содержит знание и увеличивает в итоге знание получателя.
Однако общим для обеих теорий является использование информационных единиц, хотя в разных аспектах рассмотрения. Поэтому исследование информационных единиц представляет интерес как для наук об информации, так и для наук, в которых осуществляется построение картины мира [6, 7].
Основная часть. Информационные единицы – это единицы, которые переносят порции информации безотносительно к содержанию или характеризуют содержание порции информации безотносительно к информационному объему. Как базовые элементы теории, информационные единицы (ИЕ) обладают свойством неделимости по какому-либо признаку [8]. Информационные единицы служат основой построения сложных: языковых описаний, информационных конструкций или информационных объектов [1].
Как многие информационные понятия, информационные единицы являются полисемическим, многоаспектным понятием. Поэтому для разграничения и уточнения видов информационных единиц необходимо указывать аспект их рассмотрения и область применения.
В аспекте формирования структуры ИЕ выделяют составные и простые информационные единицы. Простые ИЕ не включают в свой состав другие единицы. Составные информационные единицы включают в свой состав другие информационные единицы. Например, информационная единица «предложение» включает информационные единицы «слова» [9]. Информационная единица «слово» включает информационные единицы «символы».
Для многих составных информационных единиц имеет место характеристика – структурная вложенность. Структурная вложенность информационных единиц – это не структура, а отношение иерархии компонент единицы и ее окружения.
Для многих составных информационных единиц имеет место характеристика – окружение информационной единицы. Окружение информационной единицы – это другие, связанные с ней информационные единицы и характеристики, необходимые для однозначной интерпретации информационной единицы и ее информационной определенности. Информационное окружение единицы проявляется при ее непосредственном использовании. Например, информационным окружением информационной единицы «слово» в предложении или во фразе, будут все связанные с этим словом символы и другие слова, а также такие информационные характеристики как позиция слова и вид его написания.
Для многих составных информационных единиц имеет место характеристика – информационная определенность [10]. Информационная определенность – это совокупность параметров ИЕ, полностью определенных на основе измерений или сбора информации. Информационная единица вместе с окружением является уникальной и обладает свойством эмерджентности. Эмерджентность составной информационной единицы означает несводимость свойств ИЕ к свойствам ее частей.
В аспекте применения выделяют: формальные, логические, физические – информационные единицы. Примером физической информационной единицы являются бит, байт, кластер. Бит (байт) характеризует информационную емкость носителя информации, а не количество информации. Эти единицы являются аналогами физических единиц измерения емкости литр, кубический сантиметр и др. Кластер характеризует физическую единицу дисковой памяти [11]. Эти характеристики применяют в компьютерных технологиях.
В аспекте отражения свойств внешнего мира, для любой предметной области, выделяют: субстанциональные, процессуальные, атрибутивные и комбинированные – информационные единицы. Субстанциональные информационные единицы характеризуют сущности, процессуальные – процессы, а атрибутивные единицы описывают свойства.
Субстанциональные информационные единицы можно рассматривать как элементарные описания объектов, фактов, явлений – окружающего мира.
Примером атрибутивной информационной единицы является реквизит в базах данных. Реквизиты – логически неделимые элементы, соотносимые с определением свойств отображаемого объекта или процесса [10].
Процессуальная информационная единица – это единица, которая описывает динамику: процесс или его часть. Примером процессуальных информационных единиц являются транзакция и бод, битрейт. Транзакцией называют неделимую последовательность операций манипулирования данными в БД. Это свойство информационной единицы.
Бод (boud) – единица скорости передачи сигнала, количество изменений информационного параметра несущего периодического сигнала в секунду. Названа по имени Эмиля Бодо, изобретателя кода Бодо – кодировки символов для телетайпов. Зачастую, ошибочно считают что бод это количество бит (переданное в секунду). В действительности же, это верно лишь для двоичного кодирования, которое используется не всегда. Бодами выражают полную емкость канала, включая служебные символы (биты), если они есть. Эффективная же скорость канала выражается другими единицами, например, битрейтами.
Битрейт (bitrate) –скорость прохождения битов информации. Битрейт принято использовать при измерении эффективной скорости передачи информации по каналу, то есть скорости передачи «полезной информации». Онтологии [12] также можно рассматривать как сложные процессуальные информационные единицы
В аспекте информационного объема и структуры информационных объектов выделяют структурные информационные единицы. Структурные информационные единицы – это единицы, рассматриваемые в аспекте структуры информационного объекта и обладающие свойством неделимости по структурному признаку безотносительно к смысловому содержанию единицы.
Структура информационного объекта, в отличие от структурной вложенности, представляет собой схему со связями между компонентами информационной конструкции или информационного объекта, которая включает информационные единицы как компоненты. Характеристика «структура» является более полным описанием по сравнению с характеристикой «структурная вложенность».
Примером структурной единицы является символ. Он не носит смысл, а является элементом структуры текста. Символ – информационная единица, обладающая неделимостью по структурному признаку. Символ, это атомарный объект на который может быть поделен фрагмент теста или иная информационная конструкция. Как самостоятельный объект символ – формальное обозначение, которое выступает либо как представитель другого предмета, явления, действия, либо отражает самого себя. Символ не имеет смыслового значения, а является носителем информации. Главным назначением символов в информационных технологиях является определение информационного объема той информационной конструкции или информационного объекта, которые они образуют.
В аспекте содержательности выделяют семантические информационные единицы. Семантические информационные единицы – это единицы, рассматриваемые в аспекте семантической содержательности [8, 9] безотносительно к физическому объему и обладающие свойством неделимости по какому-либо смысловому признаку. Примерами таких единиц являются: слово, предложение, фраза. Семантические информационные единицы характеризуются топологией семантических значений [13].
Слово – информационная единица, обладающая неделимостью по сигнификативному смысловому признаку, способная непосредственно соотноситься с предметом отражения и указывать на него. В информационной конструкции слово – предельная смысловая составляющая, имеющая семантическое окружение, вследствие этого слово приобретает дополнительные смысловые свойства. Слово минимальная единица информации, имеющая смысловое значение. Согласно Поланьи «слова несут в себе только ранее вложенное в них значение, и, и несмотря на то, что в предложении или во фразе их значение модифицированно, оно, как правило, не открывается впервые» [14]. Слово характеризуется возможностью изменения словоформы. Это влечет изменение смысла слова в предложении в определенных пределах. Слово – сигнификативно неделимая информационная единица.
Предложение – информационная единица, обладающая неделимостью по предикативному смысловому признаку. Предложение – смысловая совокупность связанных слов, выражающая законченную мысль. В отличие от слова, для предложений представляется возможность проверки их на истинность. Это возможно за счет использования свойства предикации. Предикация – отношение содержания сообщения к действительности, осуществляемая в предложении. Предложение – предикативно неделимая информационная единица.
Фраза – информационная единица, обладающая неделимостью по контекстуальному смысловому признаку. Фраза смысловая совокупность предложений, выражающая законченную мысль. Фраза – ИЕ информационной конструкции, обладающая максимальной смысловой содержательностью. Для фразы смысловое содержание дополняется контекстом [8] и ассоциативностью. Предложение в составе фразы может обладать свойством ассоциативности, т.е. соотносится по смыслу с другим предложением. Такое свойство приводит к появлению в предложении ассоциативных связей с другими предложениями или объектами. Это свойство дополняет фразу ассоциативным смысловым содержанием. Информационная конструкция, содержащая фразы, несет максимальную смысловую нагрузку. Она включает сигнификативный смысл, предикативный смысл, ассоциативный смысл и контекстный смысл.
Информационные конструкции характеризуются также зависимостью смысла от позиции информационных единиц. Семантическая сущность информационных единиц связана с наличием признаков релятивности, референциальности и ситуативности [15]. Например, изменение формы написания информационной единицы (курсив) означает референцию, то есть ссылку на ее подробное разъяснение.
Для информационных единиц существует характеристика «позиция», которая определяет их дополнительное смысловое значение. Выделяют следующие виды позиций: препозиция, интерпозиция и постпозиция. Позиция информационных единиц влияет на смысл информационной конструкции. Например, «флажковый знак» в кодах переменной длины [16] занимает постпозицию и символизирует о конце информационной единицы – предложения.
Характерным представителем интерпозиции является семантическая информационная единица «and». В текстовых выражениях она связывает другие семантические единицы (слова, предложения). В логике выполняет функции оператора связывающего логические переменные [17]. Слово, стоящее в начале предложения, начинается с заглавного символа. Это признак препозиции.
В лингвистическом аспекте выделяют: лингвистические, паралингвистические – информационные единицы. Определим традиционные (языковые) информационные единицы термином «лингвистические». К таким информационным единицам относятся: слово, предложение, фраза.
Паралингвистические информационные единицы не входят в систему лингвистических информационных единиц данного языка. Паралингвистические информационные единицы выполнять паралингвистические функции: дополнение, замещение, сочетание, потоковое воздействие [18]. Первые три функции изучают в традиционной паралингвистике, четвертая имеет место только в информационных технологиях, в частности в мультимедийных образовательных технологиях.
Функция «Дополнение» означает внесение дополнительной информации к лингвистическим информационным единицам. Например, голосовая окраска аудиосообщения.
Функция «Замещение» означает замещение лингвистических информационных единиц паралингвистическими. Например, использование мигающего восклицательного знака, окрашенного в красный цвет как символ сбоя или аварийной ситуации в компьютерной программе. Эта функция не языковая и одинаково понятна лицам, говорящим на разных языках для пользователей разных стран.
Функция «Сочетание» означает сочетание паралингвистических информационных единиц с лингвистическими информационным единицам в информационном сообщении для ускорения восприятия или усиления смысла информационного сообщения. Например, выделение в большеразмерной таблице значений цифр красным цветом, может служить дополнительным сигналом о качестве – критическом режиме или критической ситуации.
Рассмотренные три функции являются «внеязыковыми». Они не привязаны к конкретному языку, что дает основание использовать их как инструмент межъязыкового общения или сопровождения программных средств и информационных образовательных технологий.
Функция «потоковое воздействие» проявляется в мультимедийных технологиях и в первую очередь в интенсифицированных информационных потоках [19]. Например, можно показывать отдельные рисунки и дополнять показ вербальными средствами, но можно показать фильм без звукового сопровождения который будет намного понятней.
По аспекту прикладной области выделяют информационные единицы: сбора, хранения, обработки, представления, коммуникации. Например, при информационном поиске информационной единицей запроса является слово, логическая единица, микро информационная единица. В информационно-поисковых системах – словарная единица информационно-поискового языка, выраженная словом называется дескриптор. Единицей представления информационного поиска является не отдельное слово, документ произвольных форматов, то есть информационная конструкция.
В образовании применяют информационные образовательные единицы. В психолингвистике, в частности, в контент-анализе, применяют информационные единицы анализа. Информационная единица анализа – лингвистическая единица речи или элемент содержания, служащие в тексте индикатором интересующих исследователя явления [20]. При многих видах анализа и декомпозиции применяют дихотомические или оппозиционные информационные единицы [21].
Информационная единица имеет определенный смысл, если существует ее интерпретация. Интерпретировать информационную единицу – это значит связать с ней семантическое окружение, т.е. конкретизировать локальную область, называемую также областью интерпретации. С точки зрения когнитивной семантики интерпретация может включать субъективные когнитивные процедуры.
Формальное описание информационных единиц позволяет осуществлять их морфологический анализ. Морфологический анализ включает идентификацию формы информационной единицы (в простейшем случае словоформы) и приписывание форме соответствующего комплекса морфологической информации.
Заключение. В настоящее время информационные единицы представляют собой совокупность групп единиц, применяемых в различных направлениях. Пока отсутствует общая теория информационных единиц и общие принципы их построения и сопоставления. Все информационные единицы можно рассматривать как элементы информационного поля. Общим для всех ИЕ является признак неделимости информационной единицы по какому-либо критерию. Общим является то, что все информационные единицы являются инструментом отображения внешнего мира и инструментом создания научной картины мира.
Лекция 1 Место и назначение лингвистического обеспечения в информационных системах. Понятие информационной системы
Главная > Документ
Информация о документе | |
Дата добавления: | |
Размер: | |
Доступные форматы для скачивания: |
Информационные единицы бывают элементарными и составными. Рассмотрим их на примере накладной. В качестве элементарных единиц информации выступают реквизиты — логически неделимые элементы, соотносимые с определенным свойством отображаемого объекта или процесса. Форма реквизита определяет полное его наименование, тип, описание множества допустимых значений и другие характеристики. Рис. 7.
Существует ряд типов реквизитов в зависимости от значений, которые они могут принимать.
Наиболее распространенными являются числовой и текстовый реквизиты.
Числовые реквизиты характеризуют количественные свойства экономических явлений, полученные в результате подсчета натуральных единиц, измерения, взвешивания, вычисления и т. п. Значениями таких реквизитов являются числа. Примерами служат числовые реквизиты.
Рисунок : Пример накладной
Текстовые реквизиты отражают качественные свойства экономических явлений, дают характеристику тем обстоятельствам, при которых протекало то или иное экономическое явление или процесс и были получены те или иные числовые значения. Текстовые реквизиты называют так же реквизитами-признаками, их использование позволяет однозначно трактовать тот или иной хозяйственный процесс, не допуская смыслового искажения или смещения различных процессов или явлений. В качестве текстовых реквизитов в примере выступают СКЛАД, НАИМЕНОВАНИЕ ПОЛУЧАТЕЛЯ, АДРЕС ПОЛУЧАТЕЛЯ. Над числовыми реквизитами, как правило, в процессе обработки выполняются арифметические операции, а над текстовыми — логические. Кроме текстового и числового типов, часто применяется также логический тип, который определяет, какое из двух значений имеет величина — истину или ложь.
Каждый из наблюдаемых объектов или процессов характеризует ряд присущих ему свойств. Изолированно взятый реквизит, характеризующий одно из свойств, не может служить полной информацией о наблюдаемом объекте или процессе. Для воспроизведения некоторого сообщения об объекте, определенной информации о процессе требуется некоторая взаимосвязанная совокупность реквизитов.
Хотя во многих случаях она рассматривается как один реквизит. Следует отметить, что существуют и другие реквизиты, кроме даты, которые могут быть составными. К таким реквизитам относятся множественные реквизиты, отражающие тот факт, что отображенное свойство объекта может, иметь несколько значений при представлении объекта, процесса или явления. В качестве множественного реквизита может выступать реквизит ЗНАНИЕ ИНОСТРАННЫХ ЯЗЫКОВ в кадровой анкете.
Отдельная личность может владеть несколькими иностранными языками.
В составных единицах информации выделяют промежуточные единицы — группы. Группа, состоящая только из реквизитов, называется простой, а группы, имеющие в своем составе другие группы, называются составными. Различают повторяющиеся и неповторяющиеся группы. Повторяющиеся группы допускают, как и множественные реквизиты, определенное количество реализаций:
повторяющиеся группы C2 ;
неповторяющиеся — остальные (кроме C2 ).
Из возможных структурных образований — групп, особого внимания заслуживает группа, называемая показателем. Показатель — это составная единица информации, состоящая из одного реквизита числового типа, именуемого основанием показателя и отражающего тот или иной факт в количественной оценке, и ряда характеризующих его и связанных с ним реквизитов-признаков текстового типа (времени, места действия, действующих лиц, предметов, продуктов труда и т. д.).
Одной из причин выделения показателей в особую разновидность составных единиц информации является то, что показатель, по существу, служит минимальной по составу информационной совокупностью, достаточной для образования самостоятельного документа. Этот документ может существовать изолированно.
Особый интерес представляют показатели со значением основания, равным 1. Такие показатели внешне выступают с составом, включающим одни признаки. При основании, равном 1, количество информации будет больше в том показателе, который содержит большее число признаков, поскольку он дает более разностороннюю характеристику данному экономическому хозяйственному процессу или явлению.
Можно ввести условие, что форма показателя с минимальным составом, включающая одно основание и один признак, содержит единичное количество информации. Это позволяет ввести логарифмическую меру и выразить количество информации, содержащейся в показателе в следующем виде: ∑ I(P ) = log2 (1 + Q) log2 (1 + n q), где n — число реквизитов-признаков в показателе q=1.
В литературе часто показатели подразделяются по единице измерения основания на абсолютные и относительные. К абсолютным отнесены показатели, основания которых получают прямым счетом, измерением, взвешиванием, алгебраическим суммированием других абсолютных показателей, различные средние абсолютные показатели. В число относительных входят показатели, значения оснований которых получены отношением двух других показателей (удельный вес, отношение двух частей и т. д.)
Между различными объектами, свойствами объектов и объектами существуют всевозможные объективные отношения, определяемые предметной областью (пространственные, временные, функциональные и т. п.). При информационном отображений объектов и присущих им свойств эти отношения переносятся на отношения между составными единицами информации, с помощью которых представляются объекты и их свойства.
Иерархическим называется групповое отношение, в котором каждая подчиненная группа может быть связана только с одной родительской. Отношения вида 1 : 1, 1 : n, n : 1 являются иерархическими.
Рисунок : Групповое отношение
Графически группы и групповые отношения удобно изображать в виде диаграмм, используя следующие соглашения. На диаграммах группы изображаются прямоугольником, над левым верхним углом которого помещается имя группы. Внутри прямоугольника могут быть показаны имена реквизитов. Групповые отношения обозначаются стрелками, проведенными от родительского к подчиненному типу группы с возможным указанием коэффициента группового отношения (1 : 1, 1 : n, n : 1 и n : m) и имени группового отношения.
Если диаграмму трактовать как ориентированный граф и группы в диаграмме отождествлять с вершиной графа, а отношения — с дугой графа, то путем в диаграмме называется такая последовательность групповых отношений (дуг), что конец каждой предыдущей дуги совпадает с началом следующей. Рис. 9.
Рисунок : Диаграмма группы
Формальные языки и грамматики
Языки и цепочки символов. Способы задания языков
Грамматики и распознаватели
Цепочкой символов (или строкой) называют произвольную упорядоченную конечную последовательность символов, записанных один за другим. Понятие символа (или буквы) является базовым в теории формальных языков и не нуждается в определении.Далее цепочки символов будем обозначать греческими буквами: a, b, g.
Цепочка символов — это упорядоченная последовательность символов. Это значит, что для цепочки символов имеют значение три фактора: состав входящих в цепочку символов, их количество, а также порядок символов в цепочке. Поэтому цепочки “а” и “аа”, а также “аб” и “ба” — это различные цепочки символов. Цепочки символов a и b равны (совпадают), a = b, если они имеют один и тот же состав символов, одно и то же их количество и одинаковый порядок следования символов в цепочке. Количество символов в цепочке называют длиной цепочки. Длина цепочки символов a обозначается как |a|. Очевидно, что если a = b, то и |a| = |b|. Основной операцией над цепочками символов является операция конкатенации (объединения или сложения) цепочек. Конкатенация (сложение, объединение) двух цепочек символов — это дописывание второй цепочки в конец первой. Конкатенация цепочек a и b обозначается как ab. Выполнить конкатенацию цепочек просто: например, если a = аб, а b = вг, то ab = абвг.
Также очевидно, что конкатенация обладает свойством ассоциативности, то есть (ab)g = a(bg). Любую цепочку символов языка можно представить как конкатенацию составляющих ее частей — разбить цепочку на несколько подцепочек. Такое разбиение можно выполнить несколькими способами произвольным образом. Например, цепочку g = абвг можно представить в виде конкатенации цепочек a = аб и b = вг (g = ab), а можно — в виде конкатенации цепочек u = а и w = бвг (g = uw). Чем длиннее исходная цепочка, тем больше вариантов разбиения ее на составляющие подцепочки.
Если некоторую цепочку символов разбить на составляющие ее подцепочки, а затем заменить одну из подцепочек на любую произвольную цепочку символов, то в результате получится новая цепочка символов. Такое действие называется заменой, или подстановкой, цепочки. Например, возьмем все ту же цепочку g = абвг, разобьем ее на три подцепочки: a = а, w = б и b = вг (g = awb), и выполним подстановку цепочки u = аба вместо подцепочки w. Получим новую цепочку g’ = аабавг (g’ = aub). Любая подстановка выполняется с помощью разбиения исходной цепочки на подцепочки и операции конкатенации.
Понятие языка. Формальное определение языка
В общем случае язык — это заданный набор символов и правил, устанавливающих способы комбинации этих символов между собой для записи осмысленных текстов. Основой любого естественного или искусственного языка является алфавит, определяющий набор допустимых символов языка.
Алфавит — это счетное множество допустимых символов языка. Будем обозначать это множество символом V. Интересно, что согласно формальному определению, алфавит не обязательно должен быть конечным множеством, но реально все существующие языки строятся на основе конечных алфавитов.
Цепочка символов a является цепочкой над алфавитом V: a(V), если в нее входят только символы, принадлежащие множеству символов V. Для любого алфавита V пустая цепочка l может как являться, так и не являться цепочкой l(V). Это условие оговаривается дополнительно.
Если V — некоторый алфавит, то:
V + — множество всех цепочек над алфавитом V без 1;
V * — множество всех цепочек над алфавитом V, включая 1.
Справедливо равенство: V* = V+И
Языком L над алфавитом V: L(V) называется некоторое счетное подмножество цепочек конечной длины из множества всех цепочек над алфавитом V. Из этого определения следует два вывода: во-первых, множество цепочек языка не обязано быть конечным; во-вторых, хотя каждая цепочка символов, входящая в язык, обязана иметь конечную длину, эта длина может быть сколь угодно большой и формально ничем не ограничена. Все существующие языки подпадают под это определение. Большинство реальных естественных и искусственных языков содержат бесконечное множество цепочек. Также в большинстве языков длина цепочки ничем не ограничена (например, этот длинный текст — пример цепочки символов русского языка). Цепочку символов, принадлежащую заданному языку, часто называют предложением языка, а множество цепочек символов некоторого языка L(V) — множеством предложений этого языка.
Для любого языка L(V) справедливо: L(V)НV*.
Язык L(V) включает в себя язык L'(V): L'(V)НL(V), если «aОL(V): aОL'(V). Множество цепочек языка L'(V) является подмножеством множества цепочек языка L(V) (или эти множества совпадают). Очевидно, что оба языка должны строиться на основе одного и того же алфавита.
Два языка L(V) и L'(V) совпадают (эквивалентны): L'(V) = L(V), если L'(V)Н L(V) и L(V)НL'(V); или, что то же самое: «aОL'(V): aОL(V) и «bОL(V): bОL'(V). Множества допустимых цепочек символов для эквивалентных языков равны.
Два языка L(V) и L'(V) почти эквивалентны: L'(V)@L(V), если L'(V)И