Страницы: 1
RSS
PQ - Удаление дубликатов - какая логика?
 
Я думал, что функция "удаление дубликатов" в PQ идет следующим образом: всегда удаляется второй найденный вариант, то есть если один и тот же результат встречается в 1 и 3 строке, то должна удаляться третья строка. Оказывается, что не совсем.
Я не прав? Или как сделать так, чтобы всегда удалялось второе найденное значение, а не любое.

Спасибо.
 
Денис, а документацию посмотреть не пробовали? https://support.office.com/ru-ru/article/%D0%A3%D0%B4%D0%B0%D0%BB%D0%B5%D0%BD%D0%B8%D0%B5-%D0%B4%D1%... - отвечает на Ваш вопрос?
 
Irregular Expression, там как раз и описано, что удаляется второе найденное значение, а не любое. У меня работало не совсем так.
В итоге было следующее:
я делал фильтрацию, для того, чтобы нужный дубликат всегда шел за главным значением и после этого применял функцию "Удалить дубликаты" и работало не верно.
Сейчас я сделал так - после фильтрации добавил промежуточный шаг (например, Изменить тип) и после этого вставлял "Удалить дубликаты" - и вот тогда удалялись нужные дубликаты.
Не знаю почему так, но работает именно так.
 
Денис, вы бы хоть пример приложили, который бы подтверждал ваши слова. Специально проверил пример по ссылке - работает как описано.
Вот горшок пустой, он предмет простой...
 
PooHkrd, да у меня большой файл, там идет подгрузка из 6 внешних источников, потом это обрабатывается и выдается результат. поэтому трудно его тут выложить. К тому же, есть личная информация.

Можете в личную переписку перейти? Я бы дал доступ к удаленному рабочему компьютеру и рассказал бы про свои потребности. По оплате договоримся.
 
Не могу. Я на работе. А дома извините некогда. За деньги обращайтесь в раздел работа. Там более квалифицированные товарищи чем я быстро и качественно помогут.
Изменено: PooHkrd - 05.02.2018 09:18:54
Вот горшок пустой, он предмет простой...
 
PooHkrd, Понял. Благодарю.
 
Чтобы не вдаваться в сугубо технические детали, логика примерно следующая:
- в таблице существует или создается на лету для некоторых операций какой-то ключ (UID строки). При удалении дубликатов и операции группировки данные сортируются по этому ключу. Порядок строк по этому ключу может быть неожиданный. Увидеть его заранее не получится.

- если перед удалением дубликатов или группировкой применить некоторые операции (например, преобразование типа данных в столбце, или добавление индексного столбца, или некоторые другие), в таблице создается неявный ключ, соответствующий текущему порядку строк в таблице. В таком случае всегда будет оставляться первый дубликат.

PS Table.Buffer тоже создает нужный ключ
Изменено: Максим Зеленский - 06.02.2018 09:47:50
F1 творит чудеса
 
Вот в этой теме мне помогали пронумеровать дубликаты. Можно потом отфильтровать всё, у чего номер не 1.
Изменено: Wiss - 27.01.2020 12:38:35
Я не волшебник, я только учусь.
Страницы: 1
Наверх