Страницы: 1
RSS
Парсинг сайта по названию организаций
 
Добрый день, не нашел данного парсера. Что нужно? есть список организаций. Например:
Муниципальное   общеобразовательное бюджетное учреждение «Средняя общеобразовательная школа   с. Аркадьевка»
Муниципальное общеобразовательное автономное учреждение средняя   общеобразовательная школа №1 с.Возжаевки
Муниципальное общеобразовательное автономное учреждение средняя   общеобразовательная школа с.Пригородного
Нужно найти их ИНН на сайте list-org.com или другом
Изменено: vikttur - 18.07.2021 23:14:34
 
Цитата
QASDER написал:
Нужно найти их
Здравствуйте!
Так в чем проблема? Если нужно найти, то вбиваете название организации на указанный сайт и ищете  :D
Скрытый текст
 
Добавил несколько усовершенствованный вариант, с некоторой защитой от выдачи неоднозначного результата.
Скрытый текст
 
А как бы сделать всё тоже самое только списком и проставлять найденную информацию рядом
 
Чуть переделал файл от aequit
 
а ОКПО зацепить оттуда можно?
 
Именно этот сайт не отдаёт ОКПО в результатах запроса. Соответственно, в XMLHTTP.responseText сведений про ОКПО нет.
 
а если более одного ИНН находит чем уточнять тогда в названии?
 
Допустим, нет макроса и программы.
Например, вводите неточный запрос
Сайт отдаёт более одной организации. Макрос определяет или один ИНН (тогда выводится результат), или их больше одного (выводится сообщение об этом). Что именно выводить в ответ на запрос - на стороне сайта.
 
А что нужно поменять в коде функций, чтобы парсер работал "наоборот": по ИНН (или ОГРН) выдавал название и адрес организации?
 
Примерно так:
Скрытый текст


P.s. Паттерн для адреса, если кому нужно:
Код
.Pattern = "(<i>адрес</i>: )([\S\s]*?)(</span></label></p>)"
 
Здорово! Спасибо
 
Цитата
New написал:
Чуть переделал файл от  aequit
выдает только 13 результатов
 
sabotajue, вам лучше спросить у aequit. Это его код. Я лишь переделал его код в функцию, которая должна по названию компании выдавать 1 ИНН (показывать 1 ИНН в ячейке).

P.S. Или вы имеете ввиду, что макрос находит ИНН только для 13-ти компаний, а для большего числа не находит? Возможно на сайте, к которому обращается макрос (путь к сайту прописан в макросе) стоит защита и не выдаёт больше результатов для 1 IP адреса. (то есть с 1 компьютера можно сделать только 13 запросов). Но это лишь мои предположения.
 
Я протянул функцию, но после добавления 158 названий у меня закрывается excel
 
а ранее вы писали про 13 результатов, сейчас про 158. А сколько в вашем файле компаний? Можете выложить файл?  
 
443
 
а сейчас появлется либо #ЗНАЧ! либо 0 появлется в столбце ИНН
 
У меня вообще перестал этот сайт открываться, пишет:
Не удается получить доступ к сайту
Превышено время ожидания ответа от сайта www.list-org.com.
 
Цитата
sabotajue написал:
а сейчас появляется либо #ЗНАЧ! либо 0 появляется в столбце ИНН
Посмотрел Ваш файл. Вероятно, Вы делали слишком много запросов. Сработала защита сайта.
При попытке сделать запрос напрямую с сайта, без макроса и вообще без Excel
получил сообщение "Вы слишком часто обращались к сайту и мы хотим убедиться, что вы не робот.
Повторите русские прописные буквы с картинки и сможете дальше работать".
 
Добрый день, подскажите пожалуйста, сейчас парсер не работает, ввожу названия компаний, везде пишет ИНН не обнаружен.
Страницы: 1
Наверх