Страницы: 1
RSS
Импорт данных из Web с помощью PowerQuery, Импорт одной таблицы с разных листов
 
Добрый день!

Есть сайты на которых данные выводятся по 20,50 и т.д. строк и получается несколько страниц. Например, http://www.almaty-marathon.kz/ru/results/2016/42km на котором результаты выводятся в таблицу по 100 строк (внизу мы видим, что получается 6 стр). Запрос из PowerQuery импортирует только первые 100 строк. Как можно импортировать всю таблицу сразу?
Как вариант через Данные - Получение внешних данных - Из Интернета. Но это неудобно и долго (сколько страниц, столько запросов). И к тому же, в основной таблице возрастная группа не указана и чтобы ее привязать нужно будет делать такие же манипуляции по импорту отдельно по каждой группе. А еще есть мужчины и женщины. В общем долго.

Скорее всего для знающих PowerQuery решается задачка просто.

Спасибо за помощь!
 
Можно и без PowerQuery, если написать макрос, который перебирает ссылки (на страницы результатов поиска, или ссылки на группы),
и потом делает запрос к каждой из страниц

здесь есть образец такого макроса
http://excelvba.ru/code/WebQueryRange
на примере парсинга страниц этого форума
 
Игорь, я не силен в макросах и Ваш образец к сожалению мне не поможет.

Кроме того, делая запрос из PowerQuery я могу сразу провести некоторые манипуляции с данными, например, удалить лишние столбцы, заменить ошибочные значения и т.д. (не знаю возможно ли это с помощью предложенного подхода).

Поэтому запрос в силе - решение с помощью PowerQuery - возможно или нет?
 
Цитата
Учащийся написал: Как можно импортировать всю таблицу сразу
Загружать каждую страницу и брать с неё данные.
 
Нет. Не получится. Но можно сделать папку "42 км мужчины" и сохранить туда все 6 страниц. Например 42км.html, 42 км2.html. и так далее. А потом  в PQ сделать запрос к указанной папке.
Изменено: Sertg - 10.10.2016 09:57:39
 
Хотя есть и другой вариант. Делаем запрос как обычно. Потом в окне запросов щелкаем правой кнопкой мыши на запросе выбираем вариант дублирования запроса. Потом открываем дублированный запрос и идем на шаг источник. Щелкаем на значок шестеренки  и в строе url меняем 1 на двойку в самом конце строки. И так делаем шесть раз. Потом выбираем добавить запрос больше чем три таблицы и добавляем с первого по шестой запросы. Так получаем сводную таблицу из 6 страниц.  
 
Sertg, спасибо, оба варианта работают. Редактировать источник пробовал раньше, но видимо с ошибкой URL дописывал что ли. С папкой хороший вариант.
Страницы: 1
Читают тему
Наверх