Страницы: 1
RSS
Парсинг сайта kad.arbirt.ru, Парсинг сайта kad.arbirt.ru по номеру дела средствами PQ (или VBA)
 
Нужно по имеющейся ссылке URL, которой соответствует один уникальный номер дела, получать таблицу-выгрузку событий в этом деле.
Возможные столбцы - Инстанция, Номер дела в Инстанции, Дата события, Вид события, Автор события, Название события (документа), Дата и время публикации, ссылка на pdf, Имя pdf файла, Доп.характеристика события (дата и время заседания, зал, Дата и номер вх.документа, срок оставления без движения).
На скриншоте постарался показать, где какая информация есть на примере (в плане моей терминологии):
1 - URL (вставляет пользователь или берем из готовой таблицы)
2 - Инстанция. 3 - Номер дела в инстанции. Любого вида их может быть несколько, причем апелляционные и кассационные возможны в множественном количестве и уникальными номерами, а первая тоже может существовать как несколько групп, но номер у них один и нумеровать группы первой инстанции лучше счетчиком (как правило она одна, в процессе работы могу подсветить пример, где их несколько)
8 и 9 - не отрисовывал, но если событие помечено пиктограммой pdf, то при наведении мышью видна ссылка, она открывает пдф файл
10 - могут нести информацию о дате и времени заседания (не всегда), тогда желательно в отдельный столбец, часто при это бывает информация о зале заседания (в этом случае тоже надо в отдельный столбец).

Бюджет 2000 р.

Сроки не горят, можно сказать неделя точно есть.
Если в целом таблица извлекается, но что-то незначительное из ТЗ невозможно или неправильно описано, бюджет не уменьшается.
Для разработки и тестирования можно взять любое рандомное дело по поиску на сайте kad.arbitr.ru
P.S. У меня каптчи не бывает, когда вхожу под своей учеткой, ее создание беспроблемное.
P.P.S. Сейчас на сайт, кажется, только из РФ можно подключиться (при включенном VPN не пускает)
Страницы: 1
Читают тему (гостей: 1)
Наверх