Страницы: 1
RSS
Сравнение схожести слов, Нужно как-то выявить схожесть слов.
 
Не могу придумать как можно такое реализовать с помощью екселя, есть вот такой список фамилий:
Мардимасов
Мордимасов
Модимасов
Нординасов

Динасорвон

Первые 4 слова, видно что допущены опечатки в фамилии, но в целом они очень похожи друг на друга, последняя фамилия включает в себя все те же символы что и другие, но это явно другая фамилия, думал может разложить все фамилии на символы и сравнить количество вхождений, но тогда и последняя фамилия тоже подцепляется, а это не правильно. Нужно еще как-то учитывать и порядок символов в слове.

Задача объединить под один ID первые 4 фамилии, но чтоб в это объединение не попала последняя 5я.
 
Здравствуйте, возможно ТУТ ваше решение.
Изменено: Adamm - 12.08.2022 10:22:34
 
Цитата
написал:
Здравствуйте, возможно  ТУТ  ваше решение.
Да принцип тот, что нужен однако данный функционал ищет одно совпадение из множеств, а тут задача множества объединить в одну связку.
 
А вот у нас в школе одновременно учатся Онищенко, Анищенко, Анищинко, Аникеенко, все люди разные...
 
Цитата
написал:
А вот у нас в школе одновременно учатся Онищенко, Анищенко, Анищинко, Аникеенко, все люди разные...
Процентом вхождения можно поиграться, интересует сам подход решения.
 
Наберите в поисковой строке браузера "Нечеткий поиск".
Владимир
Страницы: 1
Наверх