Страницы: 1
RSS
Копирование данных из формата PDF в Excel, реально?
 
У меня счет-фактура находтся в формате PDF. Но мне эти данные надо скопировать в Excel, для того, чтобы можно было вести расчеты. Таблица большая и вводить в ручную данные долго. Как можно проще?
 
При помощи ABBYY FineReader.
Я сам - дурнее всякого примера! ...
 
Или ABBYY PDF Transformer
 
Можно и иначе - сохранить pdf в текст, его импортнуть в Эксель. Там обработать. Или обработать скриптом текст, и уже только нужное вставить в Эксель.
 
Ну это уж совсем гемор...
Я сам - дурнее всякого примера! ...
 
Да ну - толково батник написать, и хоть 100 пдфок одним махом :) Делал.
 
{quote}{login=KuklP}{date=17.06.2010 04:49}{thema=}{post}При помощи ABBYY FineReader.{/post}{/quote}  
Спасибо
 
Hugo, Вы сейчас автора в ступор введете. Прочитайте внимательно вопрос. У меня такое подозрение, что автор наш диалог считает китайским языком:-)
Я сам - дурнее всякого примера! ...
 
Вот, нашёл - тут правда ещё 2 программы нужны. И вроде там в Foxit_Reader.exe надо было saveas сделать.  
Зато сразу все пдфки папки засасываются Экселем, там по нажатию кнопки приводятся в порадок.  
Естественно, не для разовой работы городил.  
 
 
@echo off  
 
del out.txt  
del out.pdf  
 
pdftk *.pdf cat output firstout.out  
del *.pdf  
 
ren firstout.out out.pdf  
 
call Foxit_Reader.exe out.pdf  
 
start VIEW.xls
 
В ступор? :)  
Да ладно, зато может кого другого на мысль натолкнёт.  
У нас тут годами кучу мелких отчётов глазами просматривали и на калькуляторе считали, потому что нормально загнать в Эксель не могли, и так казалось проще. А пдфок под сотню за месяц.  
Теперь в два клика сводка готова.
 
Hugo, дружище! Ну разве так можно?  Прочитайте внимательно вопрос(повторяюсь).  
И попробуйте соотнести со своим постом от 17.06.2010, 17:08. Не будьте так жестоки к автору.:-) С уважением, Сергей.
Я сам - дурнее всякого примера! ...
 
Ну если принять в расчёт "счет-фактура" то да, рамочки потеряются скорее всего. Но с другой стороны - "для того, чтобы можно было вести расчеты". Может, рамочки и не нужны, а важны данные? И если таких фактур по например одной фирме много, то вполне мой путь годится - в два клика сводная по всем фактурам готова.  
Хотя может и лучше купить ABBY. Не пробовал. Только начальство скажет - твои проблемы.
 
{quote}{login=Hugo}{date=17.06.2010 05:08}{thema=}{post}Вот, нашёл...{/post}{/quote}  
А не подскажете, как этим можно воспользоваться?  
 
Например, есть вот такой файл (в архиве). Их на самом деле около сотни и хотелось бы как-то автоматизировать процесс переноса данных в Excel. Подскажите, пожалуйста.
Hello! My blog: TRADING WAY
 
Этот скрипт.bat делает вот что - объединяет все пдфки папки в один файл (с помощью pdftk), затем этот итоговый файл открывается в Foxit_Reader.  
Там его нужно вручную сохранить в текстовый файл с определённым названием, который затем открывается макросом в VIEWMC.xls.  
Вам нужно скачать pdftk.exe и положить его в папку с этим батником.  
Хотя в общем достаточно выполнить такую одну строку:  
 
pdftk *.pdf cat output out.pdf  
 
Всё остальное - это чтоб очистить место до работы (чтоб out.pdf и файлы прежней сесии не мешали в текущей)  
Далее просто сохраните out.pdf в текст любым просморщиком, который это позволяет, а затем импортируйте этот текст стандартным способом в Эксель.  
С Вашим файлом всё нормально получается - там корректный текстовый слой.
 
Спасибо за столь подробное объяснение. Чуть позже попробую.
Hello! My blog: TRADING WAY
 
Добавлю - я это делал 3 года назад для коллеги, чтоб ей  нужно было только закинуть все полученные исходные файлы в одну папку, запустить батник, сохранить открывшуюся одну пдфку в текст.  
После процесса получала открытый и уже обработанный макросом из/в VIEWMC.xls результат обработки всех этих пдфок.  
Т.е. минимальный ручной труд остался, но очень минимальный :)
 
прошу прощенья за непонятливовсть, но что и где есть файл VIEWMC.xls ?
 
А если в исходнике картинки?  
В текстовом формате они не сохраняются.  
Как быть?  
(Или не быть?)
 
<<<А если в исходнике картинки?>>>  
Можно перевести в tif и используя MODI(Microsoft Office Document Imaging)  
( http://msdn.microsoft.com/en-us/library/aa167614%28office.11%29.aspx )  
распознать текст и вывести его куда надо
Спасибо
 
VIEWMC.xls - это обычный файл, где на открытие был прописан макрос по импорту определённого текстового файла.  
Можно как угодно написать этот макрос, можно его вообще не писать, а каждый раз импортировать текст мастером, ну или просто открыть его в Экселе - это смотря по задаче, в общем это к вопросу не относится.
 
случайно наткнулся: http://excel.software.informer.com/download-excel-macro-to-convert-pdf-to-xls/
фрилансер Excel, VBA - контакты в профиле
"Совершенствоваться не обязательно. Выживание — дело добровольное." Э.Деминг
 
По указанной ссылке обратная процедура.  
PDF Converter позволяет создавать и конвертировать любой файл в формат PDF.
 
я дико извиняюсь, запостил и не прокомментировал.  
чуть ниже, наа этой же страничке  
 
office Convert Pdf to Excel for xls 4.9    
Officeconvert Software, Inc.  
Extract data from almost any type of PDF to Excel.  
 
Okdo Pdf to Xls Converter 3.4    
Okdo Software, Inc.  
The program allows to convert pdf to xls format files.  
 
ну и другие есть...  
 
даже мое паршивое знание английского подсказывает мне, что вроде бы "по теме" программки.  
другое дело - понятия не имею ни о платности, ни о качестве работы, ни о прочих характеристиках.
фрилансер Excel, VBA - контакты в профиле
"Совершенствоваться не обязательно. Выживание — дело добровольное." Э.Деминг
Страницы: 1
Читают тему
Наверх