Всем привет, возникла необходимость из данных, загруженных в Power Query, удалить все, что встречается по 1 разу, оставив остальное - то есть то, что встречается 2 и более раз. Сверка идет сразу по двум столбцам, Имя и Бренд. http://prntscr.com/10wbg18
Вот если нужен противоположный результат в Power Query есть инструмент Удалить повторения, останутся уникальные. А вот, как оставить, только повторы. Что мне нужно, ниже пример. ------------- Например, Сергей Власов Hyundai Сергей Власов Saab
это уже 2 совпадения и эти данные нужно оставить.
А вот Александр Волков Porsche Александр Волков Porsche Александр Волков Porsche
это все считается 1 значением, и подобное нужно отсечь.
Я во вложенном примере сделал на листе Сверка просто в лоб сводную, и выделил условным форматированием то, что должно выгрузиться в Power Query. Весь массив данных именно сразу, как в примере в сводную закинуть не могу, эксель просто не справляется с обработкой, много данных. А вот если их прогнать через Power Query, то очень даже шустро сводная строится.
Rulsan написал: удалить все, что встречается по 1 разу, оставив остальное - то есть то, что встречается 2 и более раз
полностью противоречит вот этому
Цитата
Rulsan написал: Сергей Власов Hyundai Сергей Власов Saab это уже 2 совпадения и эти данные нужно оставить. А вот Александр Волков Porsche Александр Волков Porsche Александр Волков Porsche это все считается 1 значением, и подобное нужно отсечь.
Где в верхнем примере совпадения, если в разрезе полей имя/бренд там 2 уникальные строки, а в нижнем примере - как раз 3 повторения одного и того же. Определитесь с понятиями, что вам нужно?
извиняюсь, только заметил, что файл не прикрепился. Я может просто плохой объясняльщик) Если у одного человека встречаются 2 и более разных брендов, то такие данные надо выгружать - как у Сергей Власов и других, выделенных желтым. А если у человека попадается только 1 бренд, не важно сколько раз - 1 раз попадается или 100 раз, но он 1, то их надо отсечь. Вот у Александр Волков попадается трижды, но это только один бренд Porsche, он не должен выгружаться.
Rulsan, т.е. нужно зачистить не дубли по Волкову в порше, а вообще всего Волкова во всех поршах? З.Ы. А, и еще всех кто встречается просто по одному разу. Вроде дошла идея.
по сути, мне нужно, чтобы получилась такая же таблица, но отсеклись все сотрудники, у которых был только 1 бренд. Вот я слегка дополнил исходный файл, выделил, что должно выгрузиться, желтым. То же самое, но кроме тех, кто имеет по 1 бренду
Группируем по сотруднику, в одном столбце считаем количество уникальных по столбцу бренд, в другой просто выводим неизмененные таблицы, потом фильтром убираем все строки со значением = 1, потом оставшиеся после фильтрации сгруппированные таблицы собираем в кучу через Table.Combine. В общем и целом, алгоритм простой.
да, вроде простой, и скрипт короткий, но я по нему не могу понять на что надо нажимать, чтобы получился исходный результат(( как уже только не группировал
В общем, у меня выгружает вроде те данные, что нужно, но отсекает не все. Отсекает тех, у кого 1 бренд встречается по 1-му разу, но не отсекает у кого 1 бренд, по нескольку раз (как Александр Волков с одним брендом Porsche, который у него трижды) . Мистика какая-то.