Страницы: 1
RSS
Поиск уникальной пары значений по двум столбцам
 
Добрый день!
Сейчас занимаюсь вопросом проверки такого обыденного вопроса как пара ИНН - организация. У каждой организации есть свой ИНН и он всегда один (по крайней мере в моем случае), но возникает ошибка когда ИНН "перепрыгивают", или сбиваются, в общем, происходит так что одна и та же организация уже имеет два ИНН (но одинаковое название при этом), файлов много, вручную проверять каждый очень затруднительно и ресурсоемко. Я подумал что можно вытянуть в другой файл все уникальные парные (ИНН + организация) значения и посмотреть если есть два ИНН значит в этом файле ошибка, в примере к данной теме есть сводная, это тот результат который хотелось бы видеть, но только в другом файле проверочном и с помощью формул (чтобы можно было навязать на все файлы в папках.
Для поиска уникальных значений ранее использовал формулу массива:

Код
={ИНДЕКС(C$5:$C$10000;ПОИСКПОЗ(0;СЧЁТЕСЛИ(C$30:C30;$C$5:$C$10000);0));0)}
Она успешно ищет все уникальные значения по одному столбцу и вытягивает их.
Но я не могу ее понять как ее настроить на поиск в двух столбцах, или, возможно стоит использовать иную формулу?
Спасибо!
 
Добрый день! Попробуйте с помощью УСЛОВНОГО ФОРМАТИРОВАНИЯ выделить ячейки которые вам нужны
Изменено: msi2102 - 15.05.2020 13:33:03
 
msi2102, задача именно в том чтобы вытянуть уникальные значения в другой файл.
 
А Сводная таблица, которую Вы сделали, Вам чем не подходит?
Изменено: msi2102 - 15.05.2020 13:41:34
 
msi2102,Смотрите поэтапно
Я создаю файл проверки и хочу навязать формулы на названия файлов (их около 200) если делать в другом файле сводные нужно каждый раз менять источник данных в каждой сводной чтобы навязать на файлы. С формулами проще, плюс формулы надежнее когда речь идет о внешних источниках. В общем сводные таблицы не рассматриваю, нужна формула.
 
Попробуйте почитать про POWER QUERY, например ЗДЕСЬ
Изменено: msi2102 - 15.05.2020 14:17:34
 
msi2102, Спасибо большое за желание помочь, но еще раз повторюсь нужна формула, так как у меня уже файл есть с многими другими проверками, его нужно дополнить теперь этой проверкой и он будет совершенен)  
 
У Вас полный перечень организаций есть или его нужно будет составлять из этих 200 файлов?
 
msi2102,нет, нужно организации вытягивать из каждого файла.
Например есть:
ИСходный файл1.xlsx
ИСходный файл2.xlsx
ИСходный файл3.xlsx
...
ИСходный файл10.xlsx
...
ИСходный файл100.xlsx

Я вытягиваю из файла ИСходный файл1.xlsx на лист пары ИНН + Организация (уникальные) если вижу что название организаций дублируется (из-за того что есть два ИНН на одну организацию) значит в ИСходный файл1.xlsx содержит ошибку, и ее нужно исправить.
И так навязать формулы на все эти файлы для лучшей видимости, так как название однотипное то я заменой по формулам могу поменять ИСходный файл1.xlsx на ИСходный файл2.xlsx и все проверочные формулы поменяются и я смогу проверить следующий файл, и тд и тп, смысл таков
 
Если никто не ответит в понедельник посмотрю
 
Смотрите вариант
уникаты организаций
Код
=IFERROR(INDEX($B$4:$B$500;MATCH(TRUE;INDEX((COUNTIF($F$3:F3;$B$4:$B$500)=0);0);0));"")
ИНН
Код
=IFERROR(INDEX($A$4:$A$500;MATCH(1;INDEX((COUNTIF($F4:F4;$A$4:$A$500)=0)*($B$4:$B$500=$F4);0);0));"")
Когда ИНН исправите останется заполненным один столбец.
Изменено: jakim - 15.05.2020 17:19:13
 
jakim,Интересный вариант, спасибо!
Я еще подумал что можно сцепить два столбца и вытянуть все уникальные, так тоже по идее должно сработать, осталось придумать как оператором & правильно сцепить их)
 
100+ файлов проинспектировать формулами?
Я бы вероятно делал на словаре в словаре.
Т.е. для каждого ключа ИНН есть словарь названий, где у каждого его адрес в файле.
Просматриваем в цикле все файлы, заполняем словарь словарей.
В конце выгрузка из первого словаря, выгружаем правее ключи вложенного словаря с их адресами.
Если Count словаря в словаре >1 то по строке будут выгружены все названия одного ИНН с координатами.
Сразу видны разные названия, можно глазом оценить что где нужно править, и на что.
Скрытый текст
Изменено: Hugo - 18.05.2020 13:14:13
 
День добрый. Вчера не смог помочь если ещё актуально то могу предложить такой вариант. В архиве файл для сбора данных "Сводная_3.xlsm" и в папке "База" три файла с данными. Нажмите кнопку и выберите файлы в которых нужно искать.
Важное замечание: имена листов с данными в файлах для поиска должны совпадать с именем листа в файле "Сводная_3.xlsm" (например: в базах лист на котором находятся данные называется "Лист1" значит в файле "Сводная_3.xlsm" лист в котором будут собираться данные должен тоже называться "Лист1"). Если в базах имена листов разные, то нужно раскомментировать / закомментировать подписанные строки в коде и все листы в базах переместить на первое место.
Номер строки только для информации, так как неверные ИНН могут повторяться и после добавления. Формат баз данных должен совпадать с форматом примеров.
И все таки с PQ было бы и проще и быстрее.
PS перед началом обработки, желательно, что бы все открытые базы были закрыты или если открыты то сохранены.
Изменено: msi2102 - 19.05.2020 09:06:41
 
оп ни туда
Изменено: msi2102 - 19.05.2020 14:08:16
Страницы: 1
Наверх