PQ - Удаление дубликатов

PQ - Удаление дубликатов - какая логика?

Пользователь

Сообщений: 188 Регистрация: 29.08.2017

04.02.2018 19:13:32

Я думал, что функция "удаление дубликатов" в PQ идет следующим образом: всегда удаляется второй найденный вариант, то есть если один и тот же результат встречается в 1 и 3 строке, то должна удаляться третья строка. Оказывается, что не совсем.
Я не прав? Или как сделать так, чтобы всегда удалялось второе найденное значение, а не любое.

Спасибо.

Irregular Expression Пользователь Сообщений: 438 Регистрация: 30.10.2017	#2 04.02.2018 21:50:09 Денис, а документацию посмотреть не пробовали? https://support.office.com/ru-ru/article/%D0%A3%D0%B4%D0%B0%D0%BB%D0%B5%D0%BD%D0%B8%D0%B5-%D0%B4%D1%... - отвечает на Ваш вопрос?

Денис

Пользователь

Сообщений: 188 Регистрация: 29.08.2017

05.02.2018 07:16:25

Irregular Expression, там как раз и описано, что удаляется второе найденное значение, а не любое. У меня работало не совсем так.
В итоге было следующее:
я делал фильтрацию, для того, чтобы нужный дубликат всегда шел за главным значением и после этого применял функцию "Удалить дубликаты" и работало не верно.
Сейчас я сделал так - после фильтрации добавил промежуточный шаг (например, Изменить тип) и после этого вставлял "Удалить дубликаты" - и вот тогда удалялись нужные дубликаты.
Не знаю почему так, но работает именно так.

PooHkrd Пользователь Сообщений: 6602 Регистрация: 22.02.2017 Excel x64 О365 / 2016 / Online / Power BI	#4 05.02.2018 09:02:56 Денис, вы бы хоть пример приложили, который бы подтверждал ваши слова. Специально проверил пример по ссылке - работает как описано. Вот горшок пустой, он предмет простой...

Денис

Пользователь

Сообщений: 188 Регистрация: 29.08.2017

05.02.2018 09:15:12

PooHkrd, да у меня большой файл, там идет подгрузка из 6 внешних источников, потом это обрабатывается и выдается результат. поэтому трудно его тут выложить. К тому же, есть личная информация.

Можете в личную переписку перейти? Я бы дал доступ к удаленному рабочему компьютеру и рассказал бы про свои потребности. По оплате договоримся.

PooHkrd

Пользователь

Сообщений: 6602 Регистрация: 22.02.2017

Excel x64 О365 / 2016 / Online / Power BI

05.02.2018 09:18:13

Не могу. Я на работе. А дома извините некогда. За деньги обращайтесь в раздел работа. Там более квалифицированные товарищи чем я быстро и качественно помогут.

Изменено: PooHkrd - 05.02.2018 09:18:54

Вот горшок пустой, он предмет простой...

Денис Пользователь Сообщений: 188 Регистрация: 29.08.2017	#7 05.02.2018 09:36:37 PooHkrd, Понял. Благодарю.

Максим Зеленский

Пользователь

Сообщений: 4663 Регистрация: 11.06.2014

Microsoft MVP 2018-2022

06.02.2018 09:34:15

Чтобы не вдаваться в сугубо технические детали, логика примерно следующая:
- в таблице существует или создается на лету для некоторых операций какой-то ключ (UID строки). При удалении дубликатов и операции группировки данные сортируются по этому ключу. Порядок строк по этому ключу может быть неожиданный. Увидеть его заранее не получится.

- если перед удалением дубликатов или группировкой применить некоторые операции (например, преобразование типа данных в столбце, или добавление индексного столбца, или некоторые другие), в таблице создается неявный ключ, соответствующий текущему порядку строк в таблице. В таком случае всегда будет оставляться первый дубликат.

PS Table.Buffer тоже создает нужный ключ

Изменено: Максим Зеленский - 06.02.2018 09:47:50

F1 творит чудеса

Wiss Пользователь Сообщений: 1028 Регистрация: 08.11.2016	#9 27.01.2020 12:38:26 Вот в этой теме мне помогали пронумеровать дубликаты. Можно потом отфильтровать всё, у чего номер не 1. Изменено: Wiss - 27.01.2020 12:38:35 Я не волшебник, я только учусь.