Страницы: 1
RSS
Эталонные справочники ФИО, адресов
 
Коллеги, помогите с таким вопросом.
Есть база клиентов, большая. С ошибками.
1. Как можно перевести ФИО с русс на укр?
2. Как можно исправить неправильное написание адреса (Например, встречаются "пр. Победы, пр. Перемогы, проспект Пообедать" и тд, а нужно чтобы был один вариант. )
3. Как можно исправить грам. ошибки?

Где-то слышал, что есть некие эталонные справочники для таких целей.
Спасибо.
Изменено: lstrike - 27.01.2017 18:15:26
 
вообще, это задача из разряда нерешаемых
в частности, пункты 2 и 3
Это задачи для искусственного интеллекта, который еще не изобретён

Цитата
встречаются "пр. Победы, пр. Перемогы, проспект Пообедать" и тд, а нужно чтобы был один вариант
вот для меня, например, совсем неочевидно, что эти 3 варианта адреса - одно и то же
Если даже что-то найдете готовое (типа нечеткого поиска, - тут есть на сайте в Приёмах), то потом все равно надо будет исправлять косяки после автоматического исправления (и не факт, что косяков меньше станет)
 
+1
потому что если бы это было возможно, то все издательства Не нанимали бы Корректоров... и эта должность исчезла бы из ЕКДС (нормативный документ для кадровика)... пока же с этими задачами работает человек (не машина)
Изменено: JeyCi - 27.01.2017 18:36:36
чтобы не гадать на кофейной гуще, кто вам отвечает и после этого не совершать кучу ошибок - обратитесь к собеседнику на ВЫ - ответ на ваш вопрос получите - а остальное вас не касается (п.п.п. на форумах)
 
Цитата
lstrike написал:
2. неправильное написание адреса
3. Как можно исправить грам. ошибки?
буквально сегодня встретился фильм Игра в имитацию -
по фильму прозвучал очень филосовский для IT'шников вопрос - "Может ли машина думать, как человек?"... и по фильму прошёл очень однозначный ответ - "люди думают по-разному..."...
p.s.
да, думаю, составить 1 алгоритм для нахождения всех возможных ответов человека(ов) - невозможно (в разделе "вопросы по xl" точно)... особенно если включить в алгоритм и все возможные ошибки человека(ов)...
машина не будет думать, как человек!... - пока человек не вложет в неё весь свой (и не свой) ход мыслей (и ошибок, чтобы их просчитать)... и даже после этого остаётся игра вероятностей и лишь статистика от неё... в которой лишь часть может стать истиной (другая часть ложью)... поскольку ошибок может быть больше, чем вы сможете придумать и вложить в код...
p.p.s
если вы готовы собственноручно составить весь полный список возможных ошибок и правильных от них значений, то машина вам потом выполнит ИНДЕКС(ПОИСКПОЗ... - но думается мне, даже это - будут лишь вероятности  ;) ... т.н. p-values...
***
напомнил фильм вашу проблему   8) ... для меня он стал ответом на ваши вопросы... хоть и философским ответом  
Изменено: JeyCi - 28.01.2017 22:03:47
чтобы не гадать на кофейной гуще, кто вам отвечает и после этого не совершать кучу ошибок - обратитесь к собеседнику на ВЫ - ответ на ваш вопрос получите - а остальное вас не касается (п.п.п. на форумах)
 
С адресами может что-то придумать, хоть и не обязательно корректно, например с помощью https://tech.yandex.ru/maps/doc/geocoder/desc/examples/geocoder_examples-docpage/
Перевод с русского на украинский можно автоматизировать с помощью api гугл переводчика. Опять же все это лишь приближение, но никак не решение, как правильно писали предыдущие постеры.
Изменено: Все_просто - 28.01.2017 22:26:02
С уважением,
Федор/Все_просто
Страницы: 1
Читают тему
Наверх
Loading...