PDF2DTP (IDD/QXD)
Производитель: Markzware
Оценка: 4,5 из 5
Заключение: если нужно подготовить исправленную версию публикации, а её исходный макет потерялся, но сохранилась версия в PDF, считайте, вам крупно повезло: теперь восстановление оригинала займёт считанные минуты. Утилита справляется с макетами любой сложности (таблицы, векторные объекты), восстанавливаются даже эффекты прозрачности, не говоря уже о стилях текста, ссылках и цветах.
Цена: 199 евро.
Давно прошли те времена, когда для комфортной работы с пакетом для вёрстки требовалось стороннее ПО в виде дополнительных модулей. InDesign, например, разросся до размеров многофункционального комплекса, решающего практически все вопросы штатными средствами. Но для узкоспециализированных задач без сторонних решений по-прежнему не обойтись. Как правило, они реализуются в виде скриптов или дополнительных модулей.
Разработчиков таковых для InDesign по сравнению с Photoshop гораздо меньше, однако решаемые ими задачи гораздо сложнее. Взять, к примеру, WoodWing — компания замахнулась сначала на систему управления издательским процессом, затем успешно вышла на рынок цифрового издательства, опередив саму Adobe. Американская Markzware хорошо известна ещё с первых версий издательского ПО (её Flight Check входил в «пакет выживания» каждого верстальщика, самостоятельно сдающего макеты в типографии). Компания разработала множество утилит различного калибра (для работы с электронными книгами; открытия в QuarkXPress документов, созданных в InDesign и наоборот; и проч.).
Недавняя их разработка Markzware PDF2DTP заслуживает отдельного разговора. Она конвертирует документы формата PDF в полностью редактируемую публикацию (InDesign либо QuarkXPress), т. е. выполняет операцию, обратную традиционной. Ситуация, когда исходник по каким-то причинам утерян, а нужно внести в него изменения, встречается чаще, чем можно себе представить. Подобными объявлениями пестрят сайты фриланса, но человеческий фактор присутствует везде и особенно это заметно на объёмных документах.
Ещё недавно решение без повторной вёрстки было единственным: распечатка документа с последующим распознаванием OCR-программами типа FineReader. Однако способ имеет массу недостатков. Самый главный — время (представьте, что документ на 80% состоит из таблиц, да ещё переходящих с полосы на полосу) плюс невозможность восстановления иллюстраций, потеря качества, заметная на логотипах. А полученный полуфабрикат приходилось ещё долго доводить до ума, чтобы повторить исходный внешний вид.
Принципиально другой подход состоит в анализе PDF: векторные объекты (текст, графика) восстанавливаются в полном объёме, причём такими, как были изначально. Я уже не говорю о скорости обработки: поскольку текст в PDF сохраняется, основная задача — правильно собрать слова в строки, а строки в абзацы. В большинстве случаев можно восстановить даже растровые эффекты (тени/свечения). Таким образом, при обработке PDF теоретически можно полностью воссоздать потерянную публикацию.
Мне удалось внести лепту в совершенствование продукта, поскольку первая его версия не выдерживала никакой критики. В результате плодотворного сотрудничества с разработчиками Рональдом Крэнделлом и Дэвидом Диллингом, основными владельцами компании (кстати, Рональд — автор легендарной утилиты Preflight Check), я смог всесторонне протестировать продукт, мои многочисленные замечания были учтены, и сейчас это надёжное и полезнейшее решение.
Первая версия была рассчитана на офисные документы и несложно отформатированные таблицы, новинка поддерживает профессионально подготовленные файлы: сложные таблицы, изображения с обтравочными контурами и трансформированные. Восстановление полностью автоматизировано, ручные правки сведены к минимуму.
Для всестороннего тестирования я создал несколько тестовых файлов. В одних упор делался на восстановление текстовой информации (текст с вылетами, сложные таблицы), в других проверялось восстановление графики (всякие «навороты» вроде прозрачности, повёрнутых обтравочных контуров, эффектов наложения и их комбинации).
Изображения
Взгляните на рисунок. В макете было повёрнутое изображение с обтравочным контуром, повёрнутым относительно контейнера, ко всей конструкции применён эффект Drop Shadow. В результате обработки PDF макет восстановился практически полностью. Единственное замечание: не все параметры эффекта были корректно воспроизведены, но это мелочь — главное, утилита обозначила, что эффекты присутствуют и приблизительно их показала. Ситуация с другими эффектами не такая радужная. Например, Outer Glow конвертируется в группу из трёх объектов, причём результирующий вид абсолютно не совпадает с оригиналом. Почему такая разница — судить не берусь, авторы утверждают, что более глубокий анализ PDF оставлен для следующих версий утилиты.
Изображения же корректно извлекаются из исходного файла и даже с информацией о профилях. Если одно изображение используется несколько раз, ссылка в панели Links создаётся лишь одна, что очень удобно при работе с готовой публикацией.
Текст
С ним всё несколько иначе. Текстовые объекты гораздо сложнее изображений, и в PDF текст записывается в виде отдельных независимых фрагментов (чтобы убедиться в этом, достаточно разобрать документ PDF в Illustrator).
Например, пробелы в PDF не записываются — просто указывается положение следующего текстового фрагмента, поэтому понять, что скрывается за этим, сложно: то ли множество пробелов, то ли один зато с трекингом или вообще табулятор. Если изменялся кернинг внутри слова, текстовый фрагмент снова разбивается. Чтобы воссоздать его, необходимо связать сначала фрагменты в строку, строки — в абзац, абзацы — в текстовый материал. Определить, где закончился один абзац и начался новый, тоже не просто, поскольку в PDF этой информации нет. Если вёрстка была небрежной, то уже не разберёшь, где что…
Утилита имеет несколько патентованных алгоритмов распознавания текста и качественно объединяет разрозненные строки в один блок. Сложности возникают, когда меняются параметры абзаца (например, межстрочное расстояние или же используется сложное форматирование), что мешает утилите понять, к чему относится текст. Если абзацы отличаются только отступами, она корректно собирает их в один блок. Но если следующий абзац — нумерованный список, сочтёт, что это отдельный текстовый блок (правда, иногда угадывает неверно).
Я намеренно сделал небольшое техническое отступление, чтобы было понятно: задача восстановления вовсе не тривиальна. Несмотря на описанные нюансы, утилита справляется превосходно: полностью восстанавливается 95% объёма макета при сложной вёрстке, а для офисных документов никакой дополнительной работы обычно не требуется.
Разумеется, никаких проблем с кириллицей и разными начертаниями текста. Специальные режимы (All Caps, superscript, subscript) воспроизводятся все, кроме первого, поэтому тут нужно быть внимательным.
Отмечу абсолютное соответствие восстановленного текста исходному, даже переносы будут в нужном месте. Также превосходна работа со списками: независимо от сложности они восстанавливаются в полном объёме (сохраняются уровни вложенности, локальное форматирование).
Утилита очень неплохо справляется с обработкой текста даже в сложных случаях, а в простых вообще никаких нареканий.
Таблицы
Их форматирование даже в InDesign — задача непростая, поэтому в процессе тестирования я не рассчитывал на более-менее пристойный результат. Однако он превзошёл все ожидания! Программа на 100% точно воспроизводит структуру таблицы (количество столбцов, строк), распознаёт выравнивание текста по высоте в ячейке. Такое ощущение, что она занимается не reverse engineering, а просто читает правильный файл. Толщина окантовки ячеек, цвет заливки, расчёт необходимой высоты таблицы, точное воспроизведение сложного оформления (например, если некоторые ячейки окантовки не имеют) — буквально всё воспроизводится идеально! Не хочу углубляться в детали, но чтобы получить такой результат, пришлось даже обходить собственные «баги» InDesign, которых, к сожалению, ещё хватает. Понятно, что многостраничные таблицы восстанавливаются как отдельные объекты (без перетекания между страницами), — это если уж чересчур придираться.
Структура
Публикация — это не просто набор строк или абзацев, но использованные стили и цвета, нумерация страниц и т. п., что отличает её от простого текста. Поэтому разработчики позаботились, чтобы утилита выполняла безукоризненно не только визуализацию объектов, но и восстанавливала внутренние связи. В результате ворох разбросанных по страницам элементов превращается в полноценную публикацию.
Например, она воссоздаёт стили абзацев и отдельных символов, сразу же размечает ими текст. Это очень удобно (особенно если в оригинале локальное форматирование использовалось редко) — на выходе имеем фактически исходную публикацию, т. е. документ, с которым приятно иметь дело. Но если в оригинале локальное форматирование было частым, список стилей будет огромным и попросту бесполезным, даже мешающим работать. В таких ситуациях функцию автоматического создания стилей абзацев (Markzware/PDF2DTP/Preferences) рекомендуется отключить.
Корректно восстанавливаются и номера страниц. Если в начале публикации шла нумерация в стиле «i, ii, iii», то в результирующем файле всё полностью сохранится. Мне было интересно, как программа справится с цветами… Приятно удивило, что в палитре Swatches появились все задействованные в документе. Уже этого я никак не ожидал! Поразила программа и всеядностью — корректно воспроизводила цвета даже в экзотическом пространстве Lab, редко используемом в макетах.
Настройки
Среди них — восстановление только заданного диапазона страниц (Convert Page Range), включение элементов, расположенных за пределами страницы (Include Pasteboard Items and Reg.marks), создание стилей абзацев и символов (ParaStyles, CharStyles), нумерация страниц (Page Numbering). Если в оригинале обнаружился сложный векторный объект (логотип или иллюстрация), программа может надолго задуматься… Во избежание этого задаётся предельное количество объектов в группе, которое она будет обрабатывать. По умолчанию — 1200, чего с головой хватает для восстановления объекта.
Скорость работы вполне достойная — восстановление 36-страничной публикации формата А4 с большим количеством таблиц заняло буквально пару минут. Безусловно, на скорость влияет сложность публикации, но разница лишь в секундах.
Резюме
Честно говоря, я не ожидал такой качественной разработки. Серьёзно. Я сам программирую для приложений Creative Suite и прекрасно представляю объём выполненной работы. Какие бы файлы я ей не скармливал, результат всегда поражал. Радует высокая скорость обратной связи с компанией — это вам не Adobe, даже в российский офис которой нужно долго стучаться, здесь любая проблема сразу находит отклик.
Утилита — просто находка, когда нужно восстановить потерянную публикацию. Особенно отмечу её способности по восстановлению эффектов, что существенно экономит время даже с ярко выраженными дизайнерскими макетами. Пока утилита не претендует на полноценный «разборщик» PDF (обработка сложных PostScript-заливок и т. п. не её конек, как и восстановление в полном объёме всех параметров заданных эффектов), по заверениям авторов, это дело времени и спроса на продукт.
Утилита существует в вариантах для InDesign (PDF2IDD) и QuarkXPress (PDF2QXD) для Windows и Mac OS. При покупке будьте внимательны, поскольку каждой версии издательского ПО (CS 5, CS 5.5, CS 6) соответствует своя версия продукта. Цена немаленькая, но гораздо ниже стоимости переделки всего одного макета средней степени сложности (если считать по средней ставке 20х25 долл./ч).
Удачи в восстановлении и не забывайте делать резервные копии — как говорится, на Бога надейся, а сам не плошай!
Об авторе: Михаил Борисов (bmike68b@gmail.com), независимый автор, пишет для Publish статьи на тему допечатной подготовки и обзоры ПО.