Коллеги, помогите с таким вопросом. Есть база клиентов, большая. С ошибками. 1. Как можно перевести ФИО с русс на укр? 2. Как можно исправить неправильное написание адреса (Например, встречаются "пр. Победы, пр. Перемогы, проспект Пообедать" и тд, а нужно чтобы был один вариант. ) 3. Как можно исправить грам. ошибки?
Где-то слышал, что есть некие эталонные справочники для таких целей. Спасибо.
вообще, это задача из разряда нерешаемых в частности, пункты 2 и 3 Это задачи для искусственного интеллекта, который еще не изобретён
Цитата
встречаются "пр. Победы, пр. Перемогы, проспект Пообедать" и тд, а нужно чтобы был один вариант
вот для меня, например, совсем неочевидно, что эти 3 варианта адреса - одно и то же Если даже что-то найдете готовое (типа нечеткого поиска, - тут есть на сайте в Приёмах), то потом все равно надо будет исправлять косяки после автоматического исправления (и не факт, что косяков меньше станет)
+1 потому что если бы это было возможно, то все издательства Не нанимали бы Корректоров... и эта должность исчезла бы из ЕКДС (нормативный документ для кадровика)... пока же с этими задачами работает человек (не машина)
чтобы не гадать на кофейной гуще, кто вам отвечает и после этого не совершать кучу ошибок - обратитесь к собеседнику на ВЫ - ответ на ваш вопрос получите - а остальное вас не касается (п.п.п. на форумах)
lstrike написал: 2. неправильное написание адреса 3. Как можно исправить грам. ошибки?
буквально сегодня встретился фильм Игра в имитацию - по фильму прозвучал очень филосовский для IT'шников вопрос - "Может ли машина думать, как человек?"... и по фильму прошёл очень однозначный ответ - "люди думают по-разному..."... p.s. да, думаю, составить 1 алгоритм для нахождения всех возможных ответов человека(ов) - невозможно (в разделе "вопросы по xl" точно)... особенно если включить в алгоритм и все возможные ошибки человека(ов)... машина не будет думать, как человек!... - пока человек не вложет в неё весь свой (и не свой) ход мыслей (и ошибок, чтобы их просчитать)... и даже после этого остаётся игра вероятностей и лишь статистика от неё... в которой лишь часть может стать истиной (другая часть ложью)... поскольку ошибок может быть больше, чем вы сможете придумать и вложить в код... p.p.s если вы готовы собственноручно составить весь полный список возможных ошибок и правильных от них значений, то машина вам потом выполнит ИНДЕКС(ПОИСКПОЗ... - но думается мне, даже это - будут лишь вероятности ... т.н. p-values... *** напомнил фильм вашу проблему ... для меня он стал ответом на ваши вопросы... хоть и философским ответом
чтобы не гадать на кофейной гуще, кто вам отвечает и после этого не совершать кучу ошибок - обратитесь к собеседнику на ВЫ - ответ на ваш вопрос получите - а остальное вас не касается (п.п.п. на форумах)
С адресами может что-то придумать, хоть и не обязательно корректно, например с помощью https://tech.yandex.ru/maps/doc/geocoder/desc/examples/geocoder_examples-docpage/ Перевод с русского на украинский можно автоматизировать с помощью api гугл переводчика. Опять же все это лишь приближение, но никак не решение, как правильно писали предыдущие постеры.