Парсинг набора файлов xml из директории локального диска в базу данных MS Access на Python, Парсинг кучи Xml файлов из папки на локальном диске в базу данных MS Access на Python
1) Необходим рабочий скрипт парсинга набора файлов xml из директории локального диска в одну таблицу базы данных MS Access. Путь к директории (папка): C:\Users\User\Desktop\Nezavisimai osenka\O_Rezultatax_Ozenki\data-20200525T213536-structure001-20151020T000000.xml В папке есть xml файлы, которые скачены с URL:
В поле (теге) ns2:RATING_YEAR выбрать значение = 2019, т.е. в базу данных сохранялись данные только за 2019 год.
Необходимо предоставление рабочего скрипта.
Бюджет 700 рублей.
Написал скрипт, но он не рабочий.
Код
pip instal lxml
from lxml import objectifypath = 'C:\Users\User\Desktop\Nezavisimai osenka\O_Rezultatax_Ozenki\data-20200525T213536-structure001-20151020T000000.xml/
parsed = objectify.parse(open(path))
root = parsed.getroot()
data = []
skip_fields = ['ns2:PPO_NAME', 'ns2:OPF_NAME'
'ns2:SCOPE_CODE, 'ns2:SCOPE_NAME', ns2:RATING_YEAR]
for elt in root.ns:INDEPENDENT_RATING_ROLLOUTel:
el_data = {}
In [1]: perf = pd.DataFrame(data)
In [1]: perf.head()
Out[2]
Empty DataFrame
columns: []
Index: []
2) Принимается также возможность решения данной задачи не только средствами Python, но и PHP. Тогда необходим рабочий скрипт парсинга набора файлов xml из директории локального диска в одну таблицу базы данных MySQL.Путь к директории (папка): C:\Users\User\Desktop\Nezavisimai osenka\O_Rezultatax_Ozenki\data-20200525T213536-structure001-20151020T000000.xml В папке есть xml файлы, которые скачены с URL:
В поле (теге) ns2:RATING_YEAR выбрать значение = 2019, т.е. в базу данных сохранялись данные только за 2019 год. Также необходимо предоставление рабочего скрипта.
Игорь, 1. Куча XML файлов в одной папке далее 2. Одна таблица в базе данных MS Access далее 3. Экспорт в одну таблицу Excel. Все дороги ведут в Рим, все скрипты ведут к экспорту в Excel.
Могу написать скрипт, тестирую у себя на хостинге его работу, показываю, что в базу данных все зашло. Проще денвер установить, в комплекте все есть. Но бюджет должен соответствовать задаче
doober,1000 рублей, Но только в скрипте должны быть комментарии: 1) где вставлять путь папки; 2) где вставлять теги между которыми искомые значения столбца (столбцы в MySQL, я XML открываю через Excel, и там столбwы, если через браузер, то там Теги в виде дерева)/ 3) где ставить необходимое значение, 2019 год на столбце (теге) RATING_YEAR Т.е. Фильтр 4) где ставить необходимое значение, для пропуска 2018, 2017 и т.д. годов. Также Фильтр. Я и другие папки на локальном диске буду парсить с XML. Универсальный скрипт нужен, для многоразового использования.
doober,Я не программист по образованию. VBA также толком не понимаю, как функционирует. Я на хлеб не программированием зарабатываю. В ручную все перелопатить такой большой объем информации невозможно.. Что гугл выдает, тот инструментарий и выбираю. Про парсинг на Python и PHP много информации. На VBA ничего вразумительного на просторах интернета нет, либо глубоко запрятан. Первые 8-9 страниц выдачи гугл только ведь обычные юзеры используют))