Не могу придумать как можно такое реализовать с помощью екселя, есть вот такой список фамилий:
Мардимасов
Мордимасов
Модимасов
Нординасов
Динасорвон
Первые 4 слова, видно что допущены опечатки в фамилии, но в целом они очень похожи друг на друга, последняя фамилия включает в себя все те же символы что и другие, но это явно другая фамилия, думал может разложить все фамилии на символы и сравнить количество вхождений, но тогда и последняя фамилия тоже подцепляется, а это не правильно. Нужно еще как-то учитывать и порядок символов в слове.
Задача объединить под один ID первые 4 фамилии, но чтоб в это объединение не попала последняя 5я.
Мардимасов
Мордимасов
Модимасов
Нординасов
Динасорвон
Первые 4 слова, видно что допущены опечатки в фамилии, но в целом они очень похожи друг на друга, последняя фамилия включает в себя все те же символы что и другие, но это явно другая фамилия, думал может разложить все фамилии на символы и сравнить количество вхождений, но тогда и последняя фамилия тоже подцепляется, а это не правильно. Нужно еще как-то учитывать и порядок символов в слове.
Задача объединить под один ID первые 4 фамилии, но чтоб в это объединение не попала последняя 5я.