Страницы: 1
RSS
Парсинг с помощью VBA. Какими способами возможно выделять необходимые данные с HTML страницы? 
 
Все доброе время суток! Интересует такой вопрос. Я знаю только с помощью команд Instr, Mid и регулярными выражениями, но они имеют существенные минусы. Возможно имеются какие-то библиотеки, позволяющие работать со страницей сайта?
 
Здравствуйте. Эту тему я считаю не из простых. Вот ссылка на видео-уроки по этой теме, видео №47-49. Это видео на английском языке, я по коду понял, что он говорит.
Изменено: DANIKOLA - 04.07.2020 07:31:42
 
DANIKOLA, спасибо! Сейчас попробую посмотреть
 
Цитата
Anton Anton написал:
Я знаю только с помощью команд Instr, Mid и регулярными выражениями, но они имеют существенные минусы.
Видимо вы плохо владеете регулярными выражениями. С их помощью возможно многое. Остальное можно "допилить" обычными функциями обработки строк.
 
Андрей_26, вы меня видимо не совсем поняли. Я имею ввиду существует такой способ в VBA, благодаря которому я могу сразу обращаться к значению нужного класса в HTML, а не выстраивать шаблоны. Я прекрасно понимаю что регулярка - это мощный инструмент
 
Доброе время суток
Цитата
Anton Anton написал:
существует такой способ в VBA, благодаря которому я могу сразу обращаться к значению нужного класса в HTML
Да, в библиотеке Microsoft HTML Object Library для объектов Html страницы существуют методы: querySelector, querySelectorAll, которые позволяют выполнить требуемое, передавая методу CSS Selector. Правда, поддерживается только первая верся.
 
Вы бы пример страницы показали и какие данные вас интересуют. А то ходите вокруг да около..
 
Вот функция для извлечения тегов на базе регулярных выражений:
https://excelvba.ru/code/html
 
Спасибо всем огромное! Понял, что практически ничего не знаю. Буду учиться
Страницы: 1
Наверх