Если вы хотите объединить разорванный текст, сохранив как можно больше форматирования, размещения, абзацев и другой типографии существующего текста, вместо вставки во вновь созданную текстовую область в виде простого текста, вы можете попробовать John Wundes ' Удивительный сценарий Join Text Frames .
Он делает именно то, что говорит о банке: он объединяет фрагменты текста в один фрагмент текста, делая разумные суждения, основываясь на том, где они относительно друг друга:
- Он объединяет примыкающие фрагменты текста (например, из прерывистых строк текста из PDF-файлов) в одну строку с определенным контролем того, насколько близко считается та же строка.
- Он объединяет отдельные строки текста в один многострочный текстовый объект с текстом в правильном порядке (сверху вниз), исправляя поврежденные абзацы.
- Затем есть возможность восстановить исходное форматирование всего объединенного текста. Это может занять некоторое время, но полезно дать вам довольно точные оценки того, сколько времени это займет, и возможность пропустить, если оно того не стоит.
Это действительно хорошо!
Обратите внимание, что он работает только с точечным текстом, а не с областным текстом (здесь хорошо, поскольку PDF-файлы почти всегда являются точечным текстом). Если по какой-либо причине вы пытаетесь объединить текст области, вы можете преобразовать его с помощью сценария Kelso Cartography 'Make point text'
Это также удобно использовать в сочетании с AjarProductions' Преобразовать в текст Область сценария (Келсо Картография также есть подобный сценарий, см ссылку выше), если вы хотите превратить сломанный текст обратно в в соответствующие текстовые поля с авто-протекающий пунктов:
- Выделите фрагменты неработающего текста, запустите сценарий объединения текстовых фреймов.
- Скопируйте и вставьте текст в текстовый редактор, который позволит вам найти / заменить символы абзаца (например, InDesign, простой текстовый редактор кодера или, может быть, что-то вроде ( шепотом ) Word ...)
Найдите / замените нежелательный конец строки. Если есть много отдельных абзацев, которые вы хотите сохранить, 1) вы уверены, что лучше не использовать InDesign? 2) вы можете сделать это так:
- Найдите / замените два последовательных маркера абзаца на какой-нибудь текстовый заполнитель, который больше нигде в тексте не отображается (например
\|\C.L.O.W.N.H.O.R.R.O.R/|/
)
- Найти / заменить маркеры абзаца ничем или пробелами: превратить его в одну длинную строку текста с редкими всплесками
\|\C.L.O.W.N.H.O.R.R.O.R/|/
- Найти / заменить
\|\C.L.O.W.N.H.O.R.R.O.R/|/
для нового символа абзаца - который помещает один абзац, где два были раньше.
Скопируйте текст обратно и запустите на нем сценарий «Преобразовать в текстовую область». Теперь это одна плавная текстовая область с разрывами абзацев в нужных местах.
К сожалению, ничто не может исправить выделенный текст, кроме как помешать ему обрисовать в общих чертах, перепечатать его или доверять потенциально хитрому программному обеспечению OCR.