Страницы: 1
RSS
Вытащить значения из таблицы в формате pdf
 
Добрый день!
Можно ли вытащить значения "Номер договора страхования" и "Страхователь" из файла PDF (файл всегда одна страница, тип файла - "только изображение",  содержимое файла бывает разное, но таблица есть всегда и всегда есть указанные строки)и поместить, например, в ячейки A1 и B1?
Пример файла во вложении.
Спасибо.
 
Доброе время суток
Цитата
whateverlover написал:
только изображение
Вы предполагаете существование в Excel встроенного распознавания текста в изображениях, в том числе в файлах Adobe PDF? Насколько мне известно, такого готового нет. Поэтому
Цитата
whateverlover написал:
Можно ли вытащить значения "Номер договора страхования" и "Страхователь"
следует задавать на форуме по инструменту, который предоставляет такую возможность распознавания. И если у этого инструмента есть средства com-автоматизации, то возможно стоит задать вопрос уже на нашем форуме - скорее всего в курилке. Но я не на чём не настаиваю. Просто прошу немножечко думать... :)
 
PDF-Transformer-12.0.104 конвертируйте в xls
 
В своей работе для чтения данных из pdf я пользуюсь утилитой xpdf. Но если в вашем pdf  изображение (скан), то вам надо смотреть в сторону ocr систем и пытаться сдружить их (ocr) с помощью vba. Практического опыта связки ocr + vba у меня нет, поэтому не подскажу больше...
 
Цитата
Андрей VG написал:
Вы предполагаете существование в Excel встроенного распознавания текста в изображениях, в том числе в файлах Adobe PDF?
Скрин

Данная идея пришла на основе комментария Николая в статье про извлечение данных с PDF:-)

Друзья, сторонний софт установить нет возможности.
Изменено: whateverlover - 12.07.2020 01:26:29
 
Цитата
whateverlover написал:
Данная идея пришла на основе комментария Николая
Ну, так и открывайте Pdf в Word и не забывайте про упомянутое там же
Цитата
Для сложных PDF с графикой Word как замена FineReader не очень
. Ну, а затем, пользуясь объектной моделью Word вытягивайте то, что вам нужно. Excel то здесь с какого боку?
Изменено: Андрей VG - 12.07.2020 08:52:43
 
whateverlover, OCR хоть и присутствует но качество его так себе. Будут ошибки и серьезные, даже одно то что сходные кирилические и латинский буквы будут некорректно определены. Так, для разовой обработки, можно использовать, а для пакетной - себе дороже.
По вопросам из тем форума, личку не читаю.
 
БМВ, привет, Михаил.
Вы же вроде в отпуске? Или просто - ни дня без поста? :)
 
Цитата
Андрей VG написал:
Вы же вроде в отпуске?
Ну вдруг оторвусь от компа на пару дней, вопросы пойдут, куда пропал, на радостях что счетчик вернули :-)
По вопросам из тем форума, личку не читаю.
 
Андрей VG, да уж, распознал ужасно)
у меня на работе просто вообще Word 2010, а на домашнем компе открыл какой-то другой PDF файл, распознал довольно сносно для моих задач) наверное, там качество скана намного лучше
Спасибо)
 
OCR в VBA: распознавание текста с картинки
«Бритва Оккама» или «Принцип Калашникова»?
Страницы: 1
Наверх