Страницы: 1
RSS
сравнение текстов на подобие (английский и русский)
 
Друзья, привет!!!

Задача:
Есть имя и фамилия человека на банковской карте. Есть имя по паспорту. Нужно их сравнить.
Все казалось бы просто!!! Но:
Имя на карте написано английскими буквами...
Я нашла наиболее точную транслитерацию на сайте https://www.calc.ru/transliteratsyya.html. (Все транслитерации с английского в ексель очень некачественные)

Теперь нужно сравнить 2 текста.
Воспользовалась формулой coincidence в plex. Но точность все равно низкая.
Может кто сталкивался с данной задачей? Как можно улучшить точность ?  
 
Имхо, все банки ипользуют одинаковую транслитацию. (у меня карты разных банков, фамилия для транслитации сложная - на всех картах одинаково)
Нужно ее найти.
 
Цитата
Михаил С. написал:
все банки ипользуют одинаковую транслитацию
это было раньше, сейчас это не так, к примеру, некоторые банки допускают написание буквы "ц" как "ts" так и "c" (имею несколько карт с разным написанием данной буквы)
 
тогда вариант - использовать, по-возможности, все транслитации, и сравнивать все варианты.
Другого не вижу.
Изменено: Михаил С. - 13.01.2019 15:24:48
 
Anton555, соглашусь. Даже использование загранпаспорта не дает единого стандарта, так как он менялся со временем.
По вопросам из тем форума, личку не читаю.
 
Так как сравнивать то?))) Можно ли поправить функцию coincidence, чтобы на похожесть проверялось не только группа символов но и отдельные знаки?  
Изменено: katelob - 14.01.2019 10:33:04
 
Знакома ли Вам эта возможность: Нечеткий текстовый поиск с Fuzzy Lookup в Excel ?
Кроме того, вероятно, повысить точность поиска совпадений поможет параллельная транслитерация разными способами и/или обратная транслитерация... Хотя кажется, что 100% результата добиться не получится...
 
katelob, надо переводить в латиницу имя и фамилию в соответствии с правилами, установленными для банковских карт, и сравнивать с данными карты.
Правила должны быть Вам известны (или Вы можете получить их легче, чем большинство здесь) - макс. число символов, как сокращаются излишние символы, правила транслитерации букв и т.д.
В таблице например макс. число символов на карте - 21 (KONSTAN SHAPOSCHNIKOV), при этом EKATERINA MELNICHENKO тоже имела бы 21 символ, но сокращена до E MELNICHENKO - почему?
Есть еще T SILVANOVSKAYA, V TYSHCHENKO - сокращенное имя идет первым? Но вот PISMENNIKOVA E - сокращенное имя после фамилии.
Если нет четко установленных правил и разные организации пишут на картах как вздумается - без ручного труда не обойтись.
Изменено: Казанский - 16.01.2019 22:19:43
 
через гугл транслейт переводите. Намного точнее переводит. Прикрепил файл. Попробуйте Вашей штучкой через plex проверить.
Разделить имя и фамилию на разные столбцы, сравнивать по отдельности.  
Изменено: zlipse - 17.01.2019 07:13:46
 
спасибо!
 
кателоб,Fuzzy lookup Читаем тут , скачиваем тут , используем гугл транслей как подсказал товарищ злипсе, из поста #9.
Сравнение в PLEX не подойдёт т.к. там сравнивается 100% совпадение.
Страницы: 1
Наверх