Страницы: 1
RSS
Из большого количества файлов выбрать суммы уплаченных налогов по критерию - ИНН
 
Есть набор xml-файлов из открытых данных ФНС. Я воспользовался идеей с форума, написал макрос и конвертировал данные в xlsx. Получилось 25 файлов с количеством записей от 600 до 800 тысяч. Нужные данные на листе "Сбор". Теперь необходимо выбрать суммы уплаченных налогов в разбивке по видам, но только для компаний, ИНН которых указан в списке (файл Сборка.xlsx). Проблема в том, что компании платят разные налоги и записаны они в нескольких строках файлов (макрос1...-24.xlsm - не заморачивался с именами), т.е. количество строк разное. Файлы большие - каждый около 60 Мб. Мне порекомендовали поработать со словарями, но я абсолютно не представляю - что это и как работает.
Поиск по форуму результатов не принёс(. Хотя было рассмотрено множество вариантов сбора данных, но под мой случай они не подходят. Были бы данные для выборки не большими, собрал бы с помощью PLEX в одну книгу и применил СУММЕСЛИМН. Но для 15 млн записей это не реально.
 
Копайте в сторону Power Query, задача прям для него и там это проще будет сделать.
 
Хорошее задание. Я правильно понял что в конечном итоге надо заполнить файл Сборка Лист Сбор данными СуммУплНал из файла МакросПример.
Если так и  если заполнять прямо в Excel то можно обойтись без словарей. Правда какая скорость получиться не знаю.
 
anlalema, А Вы попробуйте сводную таблицу
 
В итоге нужно все отобразить в файле "Сборка.xlsx"?
"Все гениальное просто, а все простое гениально!!!"
 
Спасибо всем за попытки и советы. К сожалению сделать надо было быстро, поэтому пришлось тупо открывать по 2 файла (больше комп не осиливал) и применять СУММЕСЛИМН.

Со словарями так и не разобрался. Power Query попробовал попозже (когда сдал задачу)). Решение неплохое, но если бы копал в ту сторону - то не успел бы. Зато теперь есть опыт - смогу подобные задачи решать.

Сводная таблица не подойдёт - файлов 23)).
Страницы: 1
Наверх