Страницы: 1
RSS
Автоматическое заполнение таблицы Excel из Word
 
Добрый день господа, давно пользуюсь данным форумом и всегда он мне помогал находить ответы на интересующие вопросы. За это вам всем говорю: - Большое спасибо!

Сегодня на меня свалилась проблема которая заставила меня зарегистрироваться и задать вам вопрос.
На меня свалилось несколько тысяч PDF договоров с однотипным текстом (основные фразы в них идентичны, к примеру: аванс в 2014 году составляет 5%)
Мне необходимо составить таблицу по ряду числовых параметров из этого массива договоров.
Сейчас они все конвертируются в Word.
То есть я ищу способ задать некий алгоритм который сможет вычленять опираясь на текст значения и вносить их в соответствующие столбцы таблицы.

Еще раз в кратце:
Текст в Word: Аванс в 2014 году составляет 5%, аванс в 2015 году составляет 10%, общая цена договора 234 000
Задача получить значения 5%, 10%, 234 000 и внести в соответствующие столбцы

Заранее хочу выразить благодарность за отзывы и идеи!
 
Цитата
Сейчас они все конвертируются в Word.
как? вручную???

у меня есть готовое решение для парсинга файлов Word в папке, с вычленением нужных данных (текстовых, а не таблиц целиком),
с выводом результата в Excel
http://excelvba.ru/programmes/Parser
(решение платное, программа стоит 2500 + настройка под файлы 1000, итого 3500 руб)

если хотите бесплатно, - подождите, наверняка форумчане чего предложат
 
Нет, общим пакетом.
Как я понял ваша система собирает данные с сайта, мне-же нужно собирать данные из Word в общую сводную таблицу, чтобы одно конвертирование одного документа добавляло одну строчку.
Вопрос не в бесплатно, хотя это было-бы намного проще, вопрос в том чтобы работало.
Изменено: Filipp18 - 25.08.2015 15:13:40
 
моя программа и файлы Word из папки умеет парсить
(просто пример для подобной задачи на сайте пока не опубликован)
если устраивает - выкладывайте в архиве примеры исходных файлов Word и пример результата в файле Excel (1 строка заголовка + 1 строка с данными)
 
Игорь, надстройка, конечно крутая - спору нет. Но если нужно что-то попроще...с функционалом "вычленить и занести в базу" из однотипных файлов", как в этом примере?... Или же (чтобы не возиться с открытием каждого файла) скопировать всё на 1 (или по разным) лист(ам) Excel и "повыдёргивать" уже в одной среде. Ваши надстройки FillDocuments и Super ВПР спасают мириады моего времени, при этом достаточно просты в настройке и МЕГАМУЛЬТИУНИВЕРСАЛЬНЫ (что я очень люблю и ценю)...можно сделать отдельную надстройку под вот такие нужды?
Во всех делах очень полезно периодически ставить знак вопроса к тому, что вы с давних пор считали не требующим доказательств (Бертран Рассел) ►Благодарности сюда◄
 
Алгоритм решения Вашей задачи примерно такой
Циклом перебор файлов Word в папке
Открываем последовательно каждый файл Word  
Используя стандартный поиск по документу находим нужные позиции и считываем данные
Заносим полученные данные в массив или в коллекцию или сразу в итоговый файл Excel. Сохраняем данные.

Без файлов примеров в Word  и желаемой итоговой таблицы в Excel больше помочь нечем.
 
Изменено: TSN - 25.08.2015 16:51:00
 
Jack_Famous, «вычленить и занести в базу» - не такая простая задача, если делать универсальное решение.
Вот в парсере движок в этом плане очень гибкий - потому я и приспособил его для парсинга файлов Word
(и отдельную надстройку для этого делать не планирую, - парсер более чем справляется с задачей)

Для обработки таблиц Excel обычно надо копировать строки / диапазоны ячеек, - там еще сложнее
для файлов Excel есть бесплатный макрос: http://excelvba.ru/code/combinefiles
Да и у моих коллег есть несколько подобных решений в составе их универсальных надстроек
Страницы: 1
Читают тему
Наверх