Страницы: 1
RSS
Поиск совпадений по нечетким данным: найти одинаковые адреса и обозначить их
 
Приветствую форумчане!

Помогите с задачей, пожалуйста. Есть 2 списка в которых надо найти повторения. Руками искать слишком трудозатратно, поскольку исходные данные на 10к строк в каждой из таблиц. В колонках А-С приведены данные одной таблицы, в Н другой. задача найти одинаковые адреса и обозначить их. Если через  FuzzyVLOOKUP то как упросить запрос? методом проб и ошибок? Через новый  PQ не возможно сделать, поскольку версия эксель не допускает обновление. Какие варианты могут быть в решении? Помогите, пожалуйста!!!
 
Цитата
Мила написал:
Какие варианты могут быть в решении?
Макросом. Только я ни пойму что вам нужно найти. Одинаковые улицы, города или что ?
 
необходимо в списке "H"  найти адреса из  диапазона А-С. и наоборот посмотреть, каких адресов не хватает в диапазоне А-С
 
Если совпадают три параметра: город, улица и номер дома, достаточное условие для равенства адресов?
 
в большинстве своем - да. Если примера не достаточно, могу привести более обширный.  
 
А выделенные цветом ячейки в столбце Н что-то означают?
 
Нет. Пример взят из таблицы.  
 
Я вот, например, считаю, что адрес
г.Волгоград Ленина ул., дом 56
и
400066, Волгоградская обл, Волгоград г., им В.И.Ленина ул., дом 56
это одинаковый адрес, но как объяснить Экселю, что Ленина ул и
им В.И.Ленина ул - это одно и тоже?
 
в данному случае я пробую надстройку Fuzzy. смогла ее поставить. Но эксель долго обрабатывает мои  данные. более 20 минут на табличку...  и все равно есть вероятность ошибок...А мне их необходимо исключить.
 
Фактически у вас из столбца Н есть только одно совпадение
400066, Волгоградская обл, Волгоград г., Волгодонская ул., владение 3
и
г.Волгоград ул.Волгодонская, 3
других нет
 
Kuzmich,нет. Ленина, Шумилова, Кирова и Волгодонская
 
Цитата
и все равно есть вероятность ошибок
Ну от ошибок никто не застрахован
Предлагаю такой алгоритм.
Из ячеек столбца Н выделяете в отдельные ячейки город, улицу и номер квартиры
Затем цикл по ячейкам столбца Н
ищем город из ячейки столбца Н в столбце С
затем сравниваем улицу и номер квартиры,
при совпадении трех условий пишем сообщение: в какой строке столбца С было совпадение
 
Kuzmich, не пойдет, поскольку не всегда есть город, улица, дом. Есть различные виды написания ул. Кирова и Кирова ул.. Возможно кривое внесение наименования улицы. .. и в этом большая проблема, поскольку у меня адреса по всей России.  
 
Цитата
Ленина, Шумилова, Кирова и Волгодонская
  Я как раз об этом и говорил
им В.И.Ленина ул. и Ленина ул.
им генерала Шумилова ул. и ул.Шумилова
им Кирова ул и ул.Кирова
для программы это разные улицы
  если владение считать домом, то
Волгоград г., Волгодонская ул., владение 3 и
г.Волгоград ул.Волгодонская, 3 можно считать как один адрес
 
Мила, не пытайтесь это делать средствами Excel (искать похожие адреса, предварительно не приведя их к единому написанию)
Все эти решения с нечетким поиском - весьма далеки от идеала на сегодняшний день
Процент ошибок (ненайденных совпадений, неверно найденных совпадений) будет настолько велик, что результат этой работы использовать не получится (всё равно придется вручную всё проверять)

Поищите макросы, разбивающие данные по столбцам (отдельно город, отдельно улица, отдельно дом)
Потом результаты работы этого макроса подправьте вручную (где что неверно найдет) - это не так сложно
И потом уже сравнивайте 2 таблицы по 3 столбца (тут уже всё будет совпадать, и ошибок будет минимум)
 
Добрый день! Я на Вашем месте, вначале на просторах интернета нашёл бы список населенных пунктов с правильными названиями, а также улиц с домами (благо это не проблема), после чего имеющиеся данные привел в соответствие, тоже не составит особого труда (можно с помощью того же Fuzzy) и только после этого начал сравнивать имеющиеся списки. И главное без проверки глазками не обойдетесь, к примеру если будет адрес: Волгоград, Ленина, 50, то Ленина может быть как площадь так и улица, и проспект
 
msi2102, Игорь,  благодарю. Вопрос решен.  Нашла наиболее простой для меня  способ  
 
А поделиться с форумом вера не разрешает?
Страницы: 1
Наверх