Страницы: 1
RSS
Получение внешних данных из PDF
 
В excel возможно получить внешние данные  из Access, из интернета, а возможно ли это сделать из файла PDF?  
 
И что на это вам ответил гугл, поиск по сайту?
Какой вариант и почему вы отсеяли, какой наиболее привлекательный?.. ;)
"Ctrl+S" - достойное завершение ваших гениальных мыслей!.. ;)
 
Z, предлагают с помощью конвертера, хотелось бы без посторонних программ
 
Цитата
serg1606 написал:... хотелось бы без посторонних программ
Включите поиск. HUGO в свое время предлагал варианты, но их результативность оговорена, имхо, многими условиями.
ps PDF - по сути картинка, и как с ней напрямую, по-вашему, сможет работать XL?!
"Ctrl+S" - достойное завершение ваших гениальных мыслей!.. ;)
 
Z,спасибо сейчас поищу
 
Я бы воспользовался или finereader ом либо онлайн конверторами. Но из екселя вы не откроете PDF.
Если автоматизировать бардак, то получится автоматизированный бардак.
 
wowick,спасибо за инфу
 
Поиск, вторая ссылка
 
Юрий М,огромное спасибо
 
Я без всяких акробатов делал на полуавтомате - сперва вручную текстовый слой сохраняется в txt, далее его макросом парсим на лист.
Но правда этот текст не всегда бывает стабильным по структуре, ну и парсить его ещё та морока...
Это от бедности - нет акробатов. Но и с ними помнится тоже стабильности может не быть, "коллеги" эти pdf бывает генерят как попало... Может даже текст парсить проще.
 
Если есть 2013 офис, то это все можно автоматизировать через binding с Word'om. Работает вполне неплохо. Таблицы, если они даны в явном виде, то есть не в варианте "фотокопия", вполне сносно копируются с исходным форматированием в excel. Я уже даже такое реализовывал: скачиваю пдф-файл из интернета, открываю его с помощью Word, Word распознает и выдает таблицу, которая потом копируется в Excel.
Есть еще один вариант - через интернет-ресурсы, используя POST-запросы для загрузки искомого файла, но это очень и очень муторно.

Можно также сделать надстройку с помощью Tesseract OCR, но это уже далеко не тривиальная задача.
С уважением,
Федор/Все_просто
Страницы: 1
Читают тему
Наверх