Страницы: 1
RSS
Парсинг.
 
Добрый день. Ребят скажите в личку во сколько встанет код для парсинга  одного  сайта, либо на vba либо на PQ.
НО! На сам сайт вам не зайти с глобалки, сайт закрыт. Я буду делать скрины и и копировать нужный код страницы.

ТЗ:
1) Вводимая информация ИНН, дата начала периода и дата конца периода.
2) На листе эксель создается заголовок.
3) При превышении лимита страницы экселя (1млн строк) создавать еще один лист, ну или предупреждать и останавливать цикл (буду уменьшать период)

От стартовой страницы до нужной (где я вижу необходимую информацию) 3 или 4 ссылочных перехода (если это важно)
Информация НЕ табличной формы. Имеют Div контейнеры (я не вижу в коде ту информацию которая отображается на страцце сайта).

 
 
Может чем то дополнить пост, пишите.
 
Здравствуйте
Если есть возможность подключиться у этому компьютеру через Anydesk (удаленный доступ), то по цене около 7000 руб, если же подключиться никак, и придётся делать как вы описали (вслепую, глядя на скриншоты), то от 18 т.р.
 
, Только приехал с работы. Пока ехал подумал, что написал глупость.
Не нужно вводить ни ИНН ни даты. Это все вводится в ручную и руками прохожу до страницы меня интересующей.
Тоесть ни каких переходов.
Прикрепляю скрин того куска страницы. В левой части визуально отображен документ, почти каждый атрибут нужен в таблице, ну и с права код этого документа. НА этой странице много таких доков и их надо прогнать циклом, отличия документа от документа является коды после надписи информация. Что скажете?
Код я вам просто могу скопировать весь, но думаю что Вам нужен небольшой отрезок в несколько документов чтоб понять как прописать цикл и к чему цеплятся по уникальности.
 
Если вы будете сами открывать нужную страницу, потом нажимать Ctrl + U, Ctrl + A, Ctrl + C для копирования исходного кода страницы, - то тогда задача сильно упростится, - макрос по нажатию кнопки в Excel может взять содержимое из буфера обмена, и всё это дело обработать.
Либо в качестве браузера нужно использовать Internet Explorer - тогда макрос может подключиться к открытой странице в IE, и взять данные
(другие браузеры сильно усложнят задачу)
Страницы: 1
Читают тему
Наверх