Здравствуйте, Гость

Автор Тема: Из pdf в doc с возможностью копирования текста  (Прочитано 1284 раз)

Оффлайн Sar

  • Частый гость
  • **
  • Сообщений: 110
    • Просмотр профиля
Товарищи нужен совет! Задача такая: необходимо повырезать куски текста из формата pdf в doc, обычные конвертировщики меняют только формат и перенося текст из pdf в doc получаются картинки на всю страницу и вырезать из них текст не представляется возможным. Как можно это решить?
Пишу тут так как уважаемые создатели игровых систем и переводчики наверняка должны знать...

Оффлайн Dekk

  • Старейшина форума
  • *****
  • Сообщений: 4 305
  • Meh Warrior
    • Просмотр профиля
Re: Из pdf в doc с возможностью копирования текста
« Ответ #1 : Сентября 02, 2013, 20:36 »
А что происходит, когда ты просто удаляешь картинку из сконвертированного дока?

Оффлайн Nutzen

  • Illuminated Order of GURPS
  • Завсегдатай
  • *
  • Сообщений: 836
    • Просмотр профиля
Re: Из pdf в doc с возможностью копирования текста
« Ответ #2 : Сентября 02, 2013, 20:45 »
Даже Adobe Acrobat не помог?
пдф распознаный или оеф/окр?
« Последнее редактирование: Сентября 02, 2013, 20:46 от Nutzen »

Оффлайн Witcher

  • Eternal Order
  • Старожил
  • *
  • Сообщений: 1 669
    • Просмотр профиля
Re: Из pdf в doc с возможностью копирования текста
« Ответ #3 : Сентября 02, 2013, 20:56 »
зависит от PDF.
текст внутри PDF может быть в виде картинок, а может быть в виде текста, а может быть и третьей форме (ни то ни сё - да, так бывает, pdf- очень хитровывернутый формат).
Попробуйте выделить кусоче текста в ридере - если получится скопировать его как текст, можно выдрать разными конверторами типа ghostscript. Если нет - то нет.

Оффлайн Sar

  • Частый гость
  • **
  • Сообщений: 110
    • Просмотр профиля
Re: Из pdf в doc с возможностью копирования текста
« Ответ #4 : Сентября 02, 2013, 21:19 »
Цитировать
А что происходит, когда ты просто удаляешь картинку из сконвертированного дока?
Просто удаляется картинка, фишка в том что там все страницы в виде картинок а текст идет как уже элемент этой картинки.

Цитировать
Даже Adobe Acrobat не помог?
пдф распознаный или оеф/окр?
Хм, про Acrobat как то вылетело из головы... Да, распознанный.

В общем с некоторыми pdf канает внаглую когда сохраняешь как формат txt, но у некоторых при таком сохранении идет жуткая каша...

Цитировать
Попробуйте выделить кусоче текста в ридере - если получится скопировать его как текст, можно выдрать разными конверторами типа ghostscript. Если нет - то нет.

Ага, получилось! Понял как в Fine Readere текст выделять)) Всем спасибо за оперативные ответы!

« Последнее редактирование: Сентября 02, 2013, 21:27 от Saruman »