Страницы: 1
RSS
Парсинг набора файлов xml из директории локального диска в базу данных MS Access на Python, Парсинг кучи Xml файлов из папки на локальном диске в базу данных MS Access на Python
 

Добрый день!

1) Необходим рабочий скрипт парсинга набора файлов xml из директории локального диска в одну таблицу базы данных MS Access.
Путь к директории (папка):   C:\Users\User\Desktop\Nezavisimai osenka\O_Rezultatax_Ozenki\data-20200525T213536-structure001-20151020T000000.xml
В папке есть xml файлы, которые скачены с URL:

https://bus.gov.ru/pub/open-passport-data?passportId=501

В поле (теге) ns2:RATING_YEAR  выбрать значение  = 2019, т.е.  в базу данных сохранялись данные только за 2019 год.

Необходимо предоставление рабочего скрипта.

Бюджет 700 рублей.

Написал скрипт, но он не рабочий.

 

 

Код
pip instal lxml
from lxml import objectifypath = 'C:\Users\User\Desktop\Nezavisimai osenka\O_Rezultatax_Ozenki\data-20200525T213536-structure001-20151020T000000.xml/
parsed = objectify.parse(open(path))
root = parsed.getroot()
data = []
skip_fields = ['ns2:PPO_NAME', 'ns2:OPF_NAME'
'ns2:SCOPE_CODE, 'ns2:SCOPE_NAME', ns2:RATING_YEAR]
for elt in root.ns:INDEPENDENT_RATING_ROLLOUTel:
el_data = {}
In [1]: perf = pd.DataFrame(data)
In [1]: perf.head()
Out[2]
Empty DataFrame
columns: []
Index: []

2) Принимается также возможность решения данной задачи не только средствами Python, но и PHP.
Тогда необходим рабочий скрипт парсинга набора файлов xml из директории локального диска в одну таблицу базы данных MySQL.Путь к директории (папка):   C:\Users\User\Desktop\Nezavisimai  osenka\O_Rezultatax_Ozenki\data-20200525T213536-structure001-20151020T000000.xml
В папке есть xml файлы, которые скачены с URL:

https://bus.gov.ru/pub/open-passport-data?passportId=501

В поле (теге) ns2:RATING_YEAR  выбрать значение  = 2019, т.е.  в базу данных сохранялись данные только за 2019 год.
Также необходимо предоставление рабочего скрипта.

Изменено: Spec - 14.09.2020 15:44:14
 
О, цены выросли с 500 до 700 руб
Подождём еще несколько дней)

PS: какое отношение этот скрипт имеет к MS Excel?
 
Игорь,
1. Куча XML файлов в одной папке
далее
2. Одна таблица в базе данных MS Access
далее
3. Экспорт в одну таблицу Excel.
Все дороги ведут в Рим, все скрипты ведут к экспорту в Excel.
Изменено: Spec - 07.09.2020 09:45:39
 
Т.е., если вы носите бензин в ведре для воды, то машина и на воде поедет?  :)
 
В каждой шутке есть доля правды  :)

А у Вас про бензин - не шутка, а конкретный вопрос, хоть и в шуточной манере.
 
Видимо любители python редко заходят в форумы посвященные MS Excel))
 
В ТЗ добавил возможность применения сценария PHP.
 
Для
Цитата
Spec написал:
сценария PHP.
бюджет совсем никакой.
PHP  на локальном компе развернут?
 
doober,По книге PHP и MySQL, 2-издание, Бретт Маклафлина только устанавливаю WAMP на Windows 10.
 
Могу написать скрипт, тестирую у себя на хостинге его работу, показываю, что в базу данных все зашло.
Проще денвер установить, в комплекте все есть.
Но бюджет должен соответствовать задаче
 
doober,1000 рублей, Но только в скрипте должны быть комментарии:
1) где вставлять путь папки;
2) где вставлять теги между которыми искомые значения столбца (столбцы в MySQL, я  XML открываю через Excel, и там столбwы, если через браузер, то там Теги в виде дерева)/
3) где ставить необходимое значение, 2019 год на столбце (теге) RATING_YEAR         Т.е. Фильтр
4) где ставить необходимое значение, для пропуска 2018, 2017 и т.д. годов.  Также Фильтр.
Я и другие папки на локальном диске буду парсить с XML.
Универсальный скрипт нужен, для многоразового использования.

Согласны на бюджет?
Изменено: Spec - 14.09.2020 16:08:25
 
Зачем такие сложности в скрещивании ужа и ёжика.
Пишите скрипт на vbs  и будет вам счастье.
Не согласен
 
doober,Я не программист по образованию. VBA также толком не понимаю, как функционирует. Я на хлеб не программированием зарабатываю. В ручную все перелопатить такой большой объем информации невозможно.. Что гугл выдает, тот инструментарий и выбираю. Про парсинг на Python и PHP много информации. На VBA ничего вразумительного на просторах интернета нет, либо глубоко запрятан. Первые 8-9 страниц выдачи гугл только ведь обычные юзеры используют))
 
doober, PHP бюджет 1500 рублей, согласны?
 
Надо правильно вопрос гуглу задать.
Я в личку скинул  Вам скайп.
Хочу кое что пояснить о методах сбора и хранения информации..
Бюджет потом обсудим.
 
doober провел ликбез по XML, PHP и Python, после которого решил, что лучше отказаться от этой затеи)))
Тему можно закрыть.

 
Страницы: 1
Наверх