Золотой принцип: текст отдельно, оформление отдельно!

Посмотрите на этот трэш! это три примера отображения примерно одного и того же места в документе (документ - распознали в файнридере скан и сохранили в ворд) в трех разных читалках на разных виндах.

всё поплыло 1

 

 

 

 

 

 

 

 

 

 

 

 

Как такое получилось? А получилось это из-за нарушения золотого принципа. Распознавалка текста создаёт документ с фреймами, они же блоки, они же прямоугольнички. В этих фреймах текст. Всякие традосы и прочие автоматизированные системы перевода после перевода создают такой же документ, только тексты меняют на перевод. А исходный документ был на китайском, при переводе на русский каждый иероглиф превратился в несколько букв. Вот оно и поплыло.

 

Так какой принцип? А принцип такой — текст отдельно, оформление отдельно. Распознанный текст нужно сохранять просто в виде текста, а оформление в ворде воссоздавать с нуля.

<< Вернуться на предыдущую страницу

Мессенджеры: