Страницы: 1
RSS
Поиск совпадений в двух списках с разными форматами ФИО, Поиск совпадений в двух списках с разными форматами ФИО
 
Всем доброго времени суток,
Уважаемые, очень нужна Ваша помощь.
У меня есть 2 очень больших списка. Из которых я должен найти совпадение только с ФИО. Но проблема в том что ФИО в обоих списках подтянуто с разных платформ. И идут различия, могут быть ошибки в имени либо не быть мягкого знака в фамилии и тп.
На пример:
ФИО на 1 списке - Романов Леон Григорьевич
а ФИО на 2 списке - Романов Лео Григоревич либо Романовс Лео Григорьевич или вообще может быть Романовс Леонс Григорьевичс.

Задача заключается в том чтобы найти одних и тех же клиентов с помощь ФИО и объединить доп данные с обеих список.
Создал файл пример с измененными данными и в малым количестве.

Очень был бы признателен любой помощи в решение данной задачи, так как придётся раз в 3 дня делать такую сверку, а там в самом файле как минимум 500-1000 ФИО для сверки с такой проблемой :(  
 
Схожие вопросы ходят косяками )
Аналогично соседней теме можно использовать надстройку нечеткого поиска Fuzzy Lookup (64-битная версия тоже работает).
Приложил результат ее использования для данной задачи
Изменено: ZVI - 24.03.2024 03:11:05
 
Лет много назад занимался выверкой списка и методология была простая . Если есть четкой совпадение - то даже это не гарантия правильного результата. То есть нужно что было единственное совпадение. И так постепенно "снимая слой за слоем" получал  данные. Это не просто ,но возможно

1. Берем только фамилию*, считаем, если одно совпадение, то используем это
2. Если несколько то добавляем фамилию имя*,  если одно совпадение, то используем это
3. Если нет , то берем часть фамилии и тоже самое.
...

Однако Формульное исполнение в одной ячейке получается весьма длинным, и если это не разовая аналитика, которую можно делать в отдельных столбцах, то конечно в се говорит в пользу решений на VBA.
По вопросам из тем форума, личку не читаю.
 
Можно с помощью Power Query, создать свою функцию на основе функции отсюда:
Нечёткий текстовый поиск в Power Query
Получаются неплохие результаты
 
Забыл написать, спасибо большое за предоставленную Вами информацию. Очень помогло, хотя 100 процентного решения не нашлось но кое как сократили время для выполнения данной задачи.
 
Цитата
FearesT написал:
... спасибо большое ... Очень помогло, хотя 100 процентного решения не нашлось...
Добрый день!
Приятно, что информация помогла и спасибо, что написали об этом! Тема сама по себе интересная, прорабатывал когда-то и свои варианты.
Надстройка Fuzzy Lookup - хороший компромисс между качеством и скоростью обработки. Проверка и корректировка результата в любом случае потребуется. Очень удобно, что эта надстройка может предлагать несколько вариантов на выбор с их точностями.
Радует, что и в PQ есть нечеткий поиск. Но только в версиях Excel [2021 и 365[/COLOR] (спасибо за уточнение Алексею Nilske), и тормозит на больших массивах, а также не даёт выбора вариантов совпадения (автовыбор не всегда оптимален).
И, кстати, в Plex добавлена возможность вызова GPT для подобных целей, пока это экзотика, медленная, немного платная, но перспективная.
Изменено: ZVI - 13.05.2024 14:54:35
 
del
Изменено: nilske - 13.05.2024 12:34:42
 
Цитата
nilske написал: в 2021-Power Query тоже есть нечёткий текстовый поиск,
Алексей, спасибо за уточнение! Исправлю выше на Excel 2021+
 
ZVI, это было ни в коем случае не замечание, а небольшое дополнение или уточнение (365, +2021), но поскольку теперь оно внесено в сам текст, то не имеет значения и я его пожалуй удалю )
 
Цитата
nilske написал: ...и я его пожалуй удалю )
🙄🙂
Страницы: 1
Наверх