Как сделать структуру документа pdf
Расширенная предпечатная проверка (Acrobat Pro)
某些 Creative Cloud 应用程序、服务和功能在中国不可用。
Просмотр проблем предпечатной проверки в PDF-структуре
Подробная информация о структуре PDF представлена на веб-сайте Adobe PDF Technology Center по адресу www.adobe.com/go/learn_acr_pdftechnology_en (только на английском языке). Если вы достаточно глубоко разбираетесь в вопросах формата PDF, исследуйте внутреннюю структуру документа PDF и его шрифтов для поиска технических проблем несовпадений при предпечатной проверке. Предпечатная проверка включает три параметра для тщательной проверки файла PDF. Технически грамотные пользователи могут использовать эти инструменты для анализа объектов и шрифтов, вызвавших несоответствие.
Для этого необходимы глубокие познания в области внутренней структуры шрифтов, спецификаций шрифтов Type 1, TrueType и OpenType. Спецификации шрифтов перечислены в указателе в «Справочном руководстве».
Можно просматривать файл PDF и шрифты в появляющихся окнах, но нельзя редактировать структуру файла PDF или шрифты.
Просмотр внутренней структуры файла PDF
Просмотр структуры документа PDF, как и отображение потоков содержания и объектов cos, производится с помощью древовидной структуры. (Потоки содержимого представленных страниц, форма XObjects, символы шрифта Type 3, оформление комментариев и полей форм. Объекты Cos включают такие элементы как цветовые пространства, изображения и XObjects.)
Не путайте внутреннюю структуру с логической структурой в документе PDF с тегами, предоставляющем дополнительные возможности для людей с плохим зрением или незрячих людей. Внутренняя структура — надмножество всех объектов документа, включая теги.
Перед просмотром внутренней структуры файла PDF необходимо произвести предпечатную проверку.
В окне «Предпечатная проверка» меню «Параметры» выберите Просмотр внутренней структуры PDF-файла.
В открывшемся окне просмотра внутренней структуры PDF-файла отобразится дерево обзора сведений о документе и каталог документа (корневой каталог иерархии объектов документа).
Отображает потоки содержимого как последовательность операторов содержимого страницы. Для просмотра операндов разверните поддерево каждого оператора. Этот режим установлен по умолчанию.
Группирует все операторы в потоке содержимого, принадлежащие одному и тому же вложенному уровню графического состояния внутри пары q/Q операторов. Для просмотра находящихся внутри оператора и параметров разверните поддерево q/Q пары.
Похож на Q, но размещает потоки содержимого вложенными уровнями маркированного содержимого (BMC/EMC).
Размещает потоки содержимого текстовыми блоками, вложенными в BT и ET операторы.
Отображает потоки содержимого как последовательность фрагментов. Фрагмент — смежная группа объектов, использующих одно и то же графическое состояние. Таким образом, каждый фрагмент представляет тип операции рисования (например, область закрашивания) и ее графическое состояние.
Просмотр внутренней структуры шрифтов
Вы можете просмотреть внутреннюю структуру встроенных шрифтов файла PDF более детально, чем графический обзор результатов предпечатной проверки, отображающий контуры и координаты каждого глифа. Можно определить источник различных проблем предпечатной подготовки, таких как несовпадения, вызванные несовместимой шириной глифа.
Перед просмотром внутренней структуры шрифта необходимо произвести предпечатную проверку.
В окне «Предпечатная проверка» меню параметров выберите Просмотр внутренней структуры всех шрифтов документа.
Отображает оригинал координатной плоскости глифа, обозначенной зелеными ортогональными линиями.
Отображает область, используемую выбранным глифом и максимальную область, используемую всеми глифами, с помощью синих линий, соответствующих верхней и нижней границам.
Отображает области заполненного глифа серым цветом.
Отображает все точки, используемые для задания контура глифа. Черные точки определяют контур. Красные точки определяют кривые Безье и смещены относительно контура.
Создание документов PDF с расширенным доступом
某些 Creative Cloud 应用程序、服务和功能在中国不可用。
Инструмент Полная проверка переименован в Проверка на доступность в Acrobat DC (выпуск за май 2020 г.)
Процесс создания документов PDF с расширенным доступом
На высшем уровне процесс создания документов PDF с расширенным доступом состоит из нескольких основных этапов.
Эти этапы представлены в порядке, подходящем для большинства задач. Однако можно выполнять задачи и в другом порядке или повторять некоторые этапы. В любом случае сначала необходимо просмотреть документ, определить его предполагаемое назначение и использовать этот анализ для определения ряда операций, которые нужно выполнить.
Дополнительные ресурсы
Дополнительные сведения о создании файлов PDF с расширенным доступом представлены в следующих ресурсах:
Руководство по созданию электронных документов с расширенным доступом, включая файлы PDF:
http://www.section508.gov/content/build/create-accessible-documents/
Обеспечение поддержки функций расширенного доступа перед преобразованием документа в формат PDF
По возможности следует обеспечить поддержку функций расширенного доступа для документов PDF во время создания исходных файлов в каком-либо приложении, например в текстовом приложении или в приложении для создания макетов страниц.
Типичные этапы обеспечения такой поддержки в исходном приложении включают добавление дополнительного текста к графике, оптимизацию таблиц и применение стилей абзацев или других элементов структуры документа, которые можно преобразовать в теги. Дополнительные сведения представлены в разделе Создание документа PDF с тегами из исходного приложения.
Добавление заполняемых полей форм и описаний, установка порядка следования
Воспользуйтесь инструментами «Формы» для создания полей форм, например кнопок, флажков, всплывающих меню и текстовых окон. При создании поля введите его описание в текстовом окне «Всплывающая подсказка» диалогового окна «Свойства». Программа чтения с экрана прочитает этот текст вслух. Дополнительная информация представлена в разделе Создание полей форм.
Можно также использовать инструмент «Порядок чтения» в Acrobat Pro для добавления описаний в поля форм.
Сведения о задании порядка табуляции в структуре документа представлены в разделе «Установка навигации по полям формы».
Добавление других функций расширенного доступа в документ PDF
В Acrobat Pro этот этап включает настройку языка документа, проверку того, что настройки защиты не мешают работе программ чтения с экрана, создание ссылок с расширенным доступом и добавление закладок. Дополнительные сведения см. в разделах Настройка языка документа, Изменение параметров защиты, препятствующих работе программ чтения с экрана, Добавление ссылок с расширенным доступом и Сведения о закладках.
В Acrobat Standard этот этап включает настройку языка документа, проверку того, что параметры защиты не мешают работе программ чтения с экрана и добавление закладок. Дополнительные сведения см. в разделах Настройка языка документа, Изменение параметров защиты, препятствующих работе программ чтения с экрана и Сведения о закладках.
Создание тегов в документе PDF
Можно обеспечить расширенный доступ документов PDF, добавляя в Acrobat теги. Если документ PDF не содержит теги, то Acrobat может выполнить попытку их автоматической расстановки при прочтении или перекомпоновке документа, при этом результаты могут быть неудовлетворительными. Дерево логической структуры в документах PDF с тегами представляет содержимое программе чтения с экрана или другому вспомогательному программному или аппаратному обеспечению в соответствующем порядке.
Расстановка тегов в документе во время преобразования в формат PDF требует, чтобы исходное приложение поддерживало расстановку тегов в PDF. Расстановка тегов в документе во время преобразования позволяет приложению получить сведения о стилях абзацев или другую информацию о структуре исходного документа для создания дерева логической структуры. Дерево логической структуры отражает точный порядок чтения и соответствующие уровни тегов. При таком способе расстановки тегов легче выявить структуру сложных макетов, таких как встроенные врезки, близко расположенные столбцы, неоднородное выравнивание текста и таблицы. При расстановке тегов во время преобразования в формат PDF можно также пометить ссылки, перекрестные ссылки, закладки и дополнительный текст (при его наличии), которые находятся в файле.
Команда Добавить теги в документ правильно расставляет теги в большинстве стандартных макетов. Однако она не может всегда правильно интерпретировать структуру и порядок чтения сложных элементов страниц. Это могут быть такие элементы, как близко расположенные колонки, необычное выравнивание текста, незаполняемые поля форм и таблицы без границ. Расстановка тегов на таких страницах с помощью команды Добавить теги в документ может привести к неправильной компоновке элементов или беспорядочному расположению тегов. Эти ошибки могут привести к проблемам при чтении файла PDF вслух.
О водяных знаках и программах чтения с экрана
Добавить водяной знак к документу PDF с тегами можно без добавления его в дерево тегов. Отсутствие водяного знака в дереве тегов полезно для людей, использующих программы чтения с экрана, потому что водяной знак не будет прочитан как содержимое документа.
Наилучшим способом добавления водяного знака, не мешающего программам чтения с экрана, является вставка водяного знака без тегов в документ PDF с тегами.
Оценка документа PDF и исправление проблем с тегами (Acrobat Pro)
После расстановки тегов нужно оценить документ на наличие проблем с порядком чтения, ошибок с тегами и ошибок расширенного доступа, а затем исправить их.
Создание документа PDF с тегами из веб-страницы
Созданный из веб-страницы документ PDF обладает расширенным доступом настолько, насколько им обладает HTML-источник. Например, если макет веб-страницы основан на таблицах, HTML-код может идти не в том логическом порядке чтения, который требуется документу PDF с тегами, даже несмотря на полную структурированность HTML-кода для правильного отображения всех элементов в браузере.
В зависимости от сложности веб-страницы может потребоваться выполнение в программе Acrobat Pro значительных исправлений при помощи инструмента Порядок чтения или редактирования дерева тегов в Acrobat.
На панели инструментов Adobe PDF в Microsoft Internet Explorer нажмите на стрелку Вниз на кнопке «Преобразовать» и выберите «Установки».
Редактирование структуры документа на панелях «Содержимое» и «Теги» (Acrobat Pro)
某些 Creative Cloud 应用程序、服务和功能在中国不可用。
Устранение проблем перекомпоновки на панели «Содержимое»
На панели «Содержимое» представлена иерархическая структура объектов документа PDF, включая сам объект PDF. Каждый документ содержит одну или несколько страниц, набор аннотаций (таких как комментарии и ссылки) и объектов содержимого этой страницы. Объекты содержимого включают контейнеры, текст, контуры и изображения. Объекты представлены в том порядке, в котором они появляются на странице, аналогично тегам в дереве логической структуры. Однако наличие тегов в документе PDF не является обязательным для того, чтобы просматривать или менять структуру объектов.
Перетащите его в необходимое местоположение.
В меню «Параметры» выберите пункт «Вырезать», выберите тег выше того места, где необходимо разместить вырезанный тег, и выберите пункт «Вставить» в меню «Параметры».
Элементы контейнеров нельзя напрямую вставить в элементы страниц. Чтобы переместить контейнер на другую страницу, вырежьте его. Выделите контейнер на странице, на которую нужно переместить вырезанный контейнер, и выберите команду «Вставить» в меню «Параметры». Затем перетащите контейнер в нужное место.
Параметры панели «Содержимое»
На панели «Содержимое» воспользуйтесь меню «Параметры», нажмите правой кнопкой мыши объект, чтобы выбрать один из следующих вариантов:
Используется для добавления объекта контейнера в конец указанной страницы или контейнера.
Изменить словарь контейнеров
Позволяет указать словарь для контейнера. Ошибки в данном диалоговом окне могут повредить документ PDF. Эта функция доступна только для контейнеров со словарями.
Вырезает и копирует выделенный объект (несвязанное содержимое страницы).
Вставляет содержимое сразу под выделенным объектом на том же уровне иерархии.
Вставляет содержимое в выделенный объект как дочерний элемент содержимого.
Удаляет из документа объект (несвязанное содержимое страницы).
Найти содержимое в выделенном фрагменте
Выполняет поиск объекта на панели «Содержимое», которое содержит объект, выделенный в окне документа.
Выполняет поиск немаркированных (без тегов) артефактов, элементов содержимого, комментариев и ссылок. Параметры позволяют выполнять поиск по странице или по всему документу и добавлять теги к найденным элементам.
Показать на панели тегов
Автоматически переходит на панель тегов и выбирает тег, соответствующий элементу содержимого.
Удаляет определение артефакта для выделенного объекта.
Используется для создания подсветки в окне документа вокруг содержимого, которое соответствует выделенному на панели «Содержимое» объекту.
Позволяет просматривать и редактировать метаданные изображения или объекта.
Сведения о панели «Теги»
Панель Теги позволяет просматривать и редактировать теги в дереве логической структуры или дереве тегов документа PDF. На панели «Теги» теги представлены в виде иерархической структуры, которая соответствует порядку чтения документа. Первый элемент в данной структуре — это корневой тег. Все остальные элементы являются дочерними тегами корневого тега. В тегах используются кодированные типы элементов, которые заключаются в угловые скобки ( ). Каждый элемент, включая структурные элементы, такие как разделы и статьи, представлен в порядке логической структуры по типу; за ним дается название и содержимое элемента или описание его содержимого. Структурные элементы обычно представлены в качестве заключающих, или родительских, тегов. Они включают несколько более мелких (или дочерних) элементов в свой состав.
Подробные сведения о структуре документов PDF представлены в PDF Reference Sixth Edition: Adobe Portable Document Format Version 1.7 на странице PDF reference (только на английском языке) на веб-сайте Adobe.
Просмотр тегов на панели «Теги»
Разверните тег для нужного раздела.
Удерживая клавишу Ctrl, нажмите знак «плюс» (+) (Windows) или, удерживая клавишу Option, нажмите треугольник ( Mac OS ) рядом с корневым тегом, чтобы отобразить все теги в дереве логической структуры.
Изменение тегов на панели «Теги»
Можно изменить название тега, его месторасположение или тип тега для элемента. Все содержимое страницы должно содержать теги, должно быть маркировано как артефакт или удалено из дерева логической структуры.
Редактирование заголовка тега
Перемещение тега
Перетащите тег в необходимое местоположение. При перетаскивании в местах, доступных для размещения тега, будет появляться линия.
Изменение типа элемента
Параметры панели «Теги»
На панели «Теги» используйте меню «Параметры» или нажмите правой кнопкой мыши тег в дереве логической структуры, чтобы выбрать один из следующих параметров:
Добавляет тег в дереве логической структуры сразу после выделенного элемента. Укажите тип и заголовок для нового тега.
Удаляет выделенный тег из его текущего местоположения и помещает его в буфер.
Помещает тег, который находится в буфере, в выбранное местоположение, замещая выделенный тег.
Помещает тег, который находится в буфере, в выбранное место как дочерний для выделенного тега.
Удаляет выделенный тег.
Найти в выделенном фрагменте
Выполняет поиск тега на панели «Теги», который содержит текст или объект, выделенный в окне документа.
Создать тег в выделенном фрагменте
Создает тег в дереве логической структуры сразу после элемента, выделенного в окне документа. Укажите тип и заголовок для нового тега.
Ищет артефакты, сомнительные слова и непомеченное содержимое (без тегов), комментарии, ссылки и аннотации. Параметры позволяют задать поиск по странице или по всему документу, а также добавлять теги к найденным элементам.
Изменить тег на артефакт
Заменяет выделенный тег на артефакт и удаляет содержимое с тегами из дерева структуры.
Копировать содержимое в буфер обмена
Копирует все содержимое в рамках выделенных тегов.
Изменить карту классов
Позволяет добавлять, изменять и удалять карту классов или словарь стилей для документов. В карте классов хранятся связанные с элементами атрибуты.
Изменить карту ролей
Позволяет добавлять, изменять и удалять карты ролей для документов. Карты ролей позволяют определять для каждого документа уникальный набор тегов. Сопоставляя такие пользовательские теги с тегами, предустановленными в Acrobat, можно облегчить их идентификацию и редактирование.
Все новые комментарии и поля формы добавляются к дереву тегов после указанного элемента тега. Существующие комментарии и поля форм к дереву тегов не добавляются. Комментарии «Выделение» и «Подчеркивание» автоматически помечаются тегами и связываются с текстом, к которому они относятся, поэтому не требуют применения этой функции.
Документ является документом PDF с тегами
Помечает документ PDF как документ с тегами. Отмените выделение, чтобы снять флажок.
Этот параметр не означает, что документ PDF соответствует рекомендациям PDF, поэтому его необходимо использовать с должной осмотрительностью.
Включает подсветку в окне документа вокруг содержимого, связанного с тегом, выбранным на панели «Теги».
Открывает диалоговое окно только для чтения, в котором содержится справочная информация о выбранном теге.
Добавление дополнительного текста и вспомогательных сведений к тегам
Некоторые документы PDF с тегами могут не содержать всех данных, необходимых для полного использования расширенного доступа. Например, если необходимо обеспечить доступность документа для программы чтения с экрана, PDF должен содержать дополнительный текст для рисунков, свойства языка для тех разделов, где используется язык, отличный от языка, выбранного для данного документа по умолчанию, а также расшифровки сокращений. Назначение правильного языка для различных элементов текста позволяет гарантировать то, что когда документ будет повторно использован в иных целях, символы будут отображаться корректно, а для проверки орфографии будет использован нужный словарь.
Постарайтесь сделать его максимально кратким.
Добавление дополнительного текста к ссылкам
Программы чтения с экрана могут прочитывать вслух URL-адреса веб-ссылок, однако пояснения к таким ссылкам могут оказаться очень полезными для пользователя. Например, если добавить к ссылке дополнительный текст, программа чтения с экрана сообщит пользователю «Перейдите на страницу расширенного доступа Acrobat на сайте adobe.com», а не просто «Перейдите на http://www.adobe.com/products/acrobat/solutionsacc.html».
Добавляйте дополнительный текст только к тегам, не имеющим дочерних тегов. Если дополнительный текст добавлен к родительскому тегу, программа чтения с экрана не прочитает комментарии к дочерним тегам.
Добавление дополнительного текста к рисунку
Добавление дополнительного текста к сокращению термина
Разверните дерево тегов, чтобы найти элемент, содержащий сокращение.
При помощи инструмента Редактирование текста или инструмента «Выделение» выделите в документе сокращение, затем в меню «Параметры» выберите «Найти тег в выделенном фрагменте», чтобы определить месторасположение текста в дереве тегов.
Создание нового дочернего тега
Добавление тегов к комментариям
При разметке тегами документа PDF содержащиеся в нем комментарии также помечаются тегами. Однако при добавлении комментариев к уже размеченному тегами документу PDF, чтобы новые комментарии размечались тегами, сначала необходимо разрешить разметку комментариев тегами.
Чтобы разрешить разметку комментариев тегами в документе PDF, на панели «Теги» в меню «Параметры» выберите «Комментарии тега». Комментарии или пометки, добавляемые к документу PDF, размечаются тегами автоматически.
Если документ содержит комментарии, не размеченные тегами, их можно найти в дереве логической структуры и разметить тегами при помощи команды «Найти» на панели «Теги».
Исправление тегов таблицы на панели «Теги»
Проверка элементов таблицы
Выберите тег таблицы
Если таблица содержит строки, которые объединяют два или более столбцов, в структуре тегов установите для них атрибуты ColSpan и RowSpan.
Повторно создайте таблицу в исходном приложении, а затем преобразуйте ее в документ PDF с тегами.
Установка атрибутов ColSpan и RowSpan
Стандартные теги PDF
В этом разделе описываются стандартные типы тегов, которые используются в документах PDF с тегами. Эти стандартные теги предоставляют вспомогательному программному обеспечению и устройствам семантические и структурные элементы, которые используются для интерпретации структуры документа и представления содержимого нужным образом.
Архитектура тегов PDF очень обширна, поэтому документ PDF может содержать любой набор тегов, который использовался исходным приложением. Например, документ PDF может содержать теги XML из XML-схемы. Теги, определяемые пользователем (такие как имена тегов, создаваемые из стилей абзацев исходного приложения) требуют наличия карты ролей. Карта ролей сопоставляет каждый пользовательский тег со стандартным тегом. Когда вспомогательное программное обеспечение встречает пользовательский тег, оно обращается к карте ролей и интерпретирует его надлежащим образом. Разметка документа PDF тегами одним из описанных здесь методов, как правило, обеспечивает формирование правильной карты ролей для документа.
Посмотреть и изменить карту ролей документа PDF можно, выбрав меню «Параметры» > «Изменить карту ролей» на панели «Теги».
Элементы уровня блока — это элементы страницы, которые содержат текст, представленный в виде абзацев. Элементы уровня блока являются частью логической структуры документа. Такие элементы в дальнейшем классифицируются как элементы контейнеров, элементы заголовков и абзацев, элементы меток и списков, элементы специального текста и элементы таблиц.
Элементы контейнеров
Элементы контейнеров — это элементы самого высокого уровня, которые обеспечивают иерархическое группирование других элементов уровня блока.
Элемент документа. Корневой элемент дерева тегов документа.
Элемент части. Большой раздел документа. Он может включать в себя единицы содержимого меньшего размера, такие как элементы фрагментов, элементы статей или элементы разделов.
Элемент фрагмента. Общий элемент уровня блока или группа элементов уровня блока.
Элемент статьи. Самостоятельный текст, который рассматривается как законченное повествование.
Элемент раздела. Общий тип элемента контейнеров, сравним с фрагментом ( DIV >) в HTML, который, как правило, является компонентом элемента части или статьи.
Элементы заголовков или абзацев
Элементы заголовков или абзацев представляют собой похожие на абзацы элементы уровня блока, которые включают теги заголовков определенных уровней и стандартные теги абзацев ( P ). Заголовок ( H ) должен быть первым дочерним элементом любого раздела более высокого уровня. Шесть уровней заголовков(от H1 до H6 ) доступны для использования в приложениях, которые не используют иерархическое вложение разделов.
Элементы меток и списков
Элементы меток и списков представляют собой элементы уровня блока, которые используются для структурирования списков.
Элемент списка. Любая последовательность сходных по значению или иным параметрам единиц; первым дочерним элементом должен быть элемент элемента списка.
Элемент элемента списка. Любая единица списка; может иметь элемент метки (необязательно) и элемент содержимого списка (обязательно) в качестве дочернего.
Элемент метки. Маркер, название или число, указывающее и отделяющее один элемент от остальных элементов того же списка.
Список элементов тела списка. Содержимое элемента списка.
Специальные элементы текста
Специальные элементы текста определяют текст, который не используется как стандартный абзац ( P ).
Элемент цитаты блока. Один или несколько абзацев текста, которые принадлежат автору, отличному от автора остального текста.
Элемент сопроводительной подписи. Краткий текст, описывающий таблицу или рисунок.
Элемент предметного индекса. Последовательность записей, содержащих текст и элементы ссылок, которые указывают на появление текста в основном документе.
Элемент оглавления. Элемент, который содержит структурированный список единиц и идентифицирующих их меток; имеет свою собственную дискретную иерархию.
Элемент заголовка оглавления. Элемент, содержащийся в списке, связанном с элементом оглавления.
Элементы таблицы
Элементы таблицы предназначены специально для структурирования таблиц.
Элемент таблицы. Двухмерная структура данных или текста в ячейках, которая подразумевает наличие элементов строк в качестве дочерних; первым или последним дочерним элементом при этом может быть элемент сопроводительной подписи.
Элемент строки таблицы. Одна строка заголовков или данных в таблице; может содержать элементы ячеек заголовков таблицы и элементы ячеек данных таблицы.
Элемент ячейки данных таблицы. Ячейка таблицы, которая содержит данные, не являющиеся заголовком.
Элемент ячейки заголовка таблицы. Ячейка таблицы, которая содержит текст заголовка или данные, описывающие одну или несколько строк или столбцов таблицы.
Элементы вложенного уровня
Элементы вложенного уровня определяют область текста с особым форматированием или функцией. Они отличаются от элементов уровня блока. Элементы вложенного уровня могут содержать элементы блочного уровня или входить в их состав.
Элемент библиографии. Указание на расположение упомянутых сведений.
Элемент цитаты. Встроенная часть текста, не принадлежащая автору остального текста; отличается от цитаты блока, которая представляет собой один или несколько абзацев, в отличие от внутреннего текста.
Элемент диапазона. Встроенный сегмент текста; как правило, используется для разграничения фрагментов текста с разными стилями.
Специальные встроенные элементы
Аналогично встроенным элементам, специальные встроенные элементы описывают внутреннюю часть текста, отличающуюся форматированием и функцией.
Элемент кода. Текст компьютерной программы, встроенный в документ.
Элемент рисунка. Элемент графики или графического изображения, связанного с текстом.
Элемент формы. Комментарий заполненной или подлежащей заполнению PDF-формы.
Элемент формулы. Математическая формула.
Элемент ссылки. Гиперссылка, встроенная в документ. Указываемое место может быть как в том же самом документе, так и в другом документе PDF или на веб-сайте.
Элемент примечания. Пояснительный текст или документация, например сноски внизу страницы или концевые сноски, относящиеся к основному тексту.
Элемент сноски. Сноска к тексту или данным в другой части документа.