PQ - Развернутый элемент отображает неверные данные

Пользователь

Сообщений: 6602 Регистрация: 22.02.2017

Excel x64 О365 / 2016 / Online / Power BI

05.02.2018 09:12:41

offtop Блин, теперь вместо "не работает ВПР... помогите!" начнут плодиться темы в "PQ не работает слияние..."
Денис, ну вот как вы себе представляете оказание вам помощи без предоставления исходных данных?
На текущий момент могу вас заверить функция Table.NestedJoin (как и ВПР) отлично работает!

Вот горшок пустой, он предмет простой...

Дмитрий Щербаков

Пользователь

Сообщений: 14896 Регистрация: 15.09.2012

Профессиональная разработка приложений для MS Office

05.02.2018 09:15:05

Цитата
Денис написал: ищу правду

ищу файл с запросом для поисков правды

Даже самый простой вопрос можно превратить в огромную проблему. Достаточно не уметь формулировать вопросы...

Пользователь

Сообщений: 6602 Регистрация: 22.02.2017

Excel x64 О365 / 2016 / Online / Power BI

05.02.2018 09:24:07

Там файл с запросом вряд ли поможет. Наверняка данные тащатся из выгрузок 1С или чего-то подобного. В результате в ключевых полях разные невидимые глазу знаки с кодом 160 и тому подобная нечисть. Денис, если данные предоставить не можете копайте в эту сторону. Вот здесь вариант как эти знаки можно искать.

Изменено: PooHkrd - 05.02.2018 09:28:30

Вот горшок пустой, он предмет простой...

Пользователь

Сообщений: 188 Регистрация: 29.08.2017

05.02.2018 10:22:26

PooHkrd, создал тестовый файл - ситуация повторяется.

Что смотреть.
1. Запрос и лист - Минимальный закуп. Например у 1 позиции определился минимальный закуп = 4.
2. Запрос и лист - Минимальная цена. Например у 1 позиции определилась минимальная цена = 9.
3. Итоговый лист, где я объединяю запросы "Минимальная цена" и "Минимальный закуп" - данные там не такие, как в самих запросах.

Прикрепленные файлы

Пример про развернутый элемент.xlsx (30.62 КБ)

Дмитрий Щербаков

Пользователь

Сообщений: 14896 Регистрация: 15.09.2012

Профессиональная разработка приложений для MS Office

05.02.2018 10:35:53

Проблема где-то у Вас в PQ. У меня все нормально отображается и разворачивается. Все данные на месте. Excel 365

Даже самый простой вопрос можно превратить в огромную проблему. Достаточно не уметь формулировать вопросы...

Денис Пользователь Сообщений: 188 Регистрация: 29.08.2017	#7 05.02.2018 10:40:58 Дмитрий Щербаков, можете дать скрин Итоговой таблицы? Не то, что бы я вам не доверяю, просто охота убдеиться, что говорим об и тех же данных)

Пользователь

Сообщений: 6602 Регистрация: 22.02.2017

Excel x64 О365 / 2016 / Online / Power BI

05.02.2018 10:45:12

Тогда и меня проблема в PQ. Ибо тоже фигня какая-то разворачивается. Вот скриншоты до разворачиания, и после.

Прикрепленные файлы

Вот горшок пустой, он предмет простой...

Денис Пользователь Сообщений: 188 Регистрация: 29.08.2017	#9 05.02.2018 10:47:50 PooHkrd, фух. Пронесло. Я думал, что у меня начинаются танцы с бубном по обновлению экселя... Продолжаем изучать эту мистику.

Пользователь

Сообщений: 6602 Регистрация: 22.02.2017

Excel x64 О365 / 2016 / Online / Power BI

#10

05.02.2018 11:00:12

На изучение, честно говоря времени нет. Предлагаю такое решение: Используйте вместо функции Table.NestedJoin функцию Table.Join. Пример во вложении и с ним все работает корректно.
А про Table.NestedJoin, что называется хозяйкам на заметку, нужно пару запросиков будет проверить из моего загашника. Может кто-то из зубров подскажет что-то еще.

Прикрепленные файлы

Копия Пример про развернутый элемент.xlsx (27.12 КБ)

Вот горшок пустой, он предмет простой...

Денис Пользователь Сообщений: 188 Регистрация: 29.08.2017	#11 05.02.2018 11:11:07 PooHkrd, спасибо за рабочее решение. Но действительно надо как-то теперь держать это в голове, так как часто пользуюсь это функцией.

Пользователь

Сообщений: 11927 Регистрация: 22.12.2012

Excel 2016, 365

#12

05.02.2018 11:24:12

Доброе время суток

Цитата
PooHkrd написал: Ибо тоже фигня какая-то разворачивается

Никакой фигни там нет. Просто последствия "ленивого" выполнения Table.Distinct в запросе "Минимальный закуп"

, обсуждаемого в другой теме PQ - Удаление дубликатов - какая логика?. Просто у ТС странная логика и требования к Power Query.

Цитата
я делал фильтрацию, для того, чтобы нужный дубликат всегда шел за главным значением

Чтобы это значило? Каким образом фильтрация может задавать порядок следования?

Пользователь

Сообщений: 188 Регистрация: 29.08.2017

#13

05.02.2018 11:29:32

Цитата
Андрей VG написал: Чтобы это значило? Каким образом фильтрация может задавать порядок следования?

может неправильно выразился. Имел в виду сортировку. Если и так непонятно, то буду более детально описывать)

Цитата

Андрей VG написал:
Никакой фигни там нет. Просто последствия "ленивого" выполнения Table.Distinct в запросе "Минимальный закуп" , обсуждаемого в другой теме PQ - Удаление дубликатов - какая логика? . Просто у ТС странная логика и требования к Power Query.

Получается, при использовании Table.Distinct нет смысла разворачивать столбцы?

Дмитрий Щербаков

Пользователь

Сообщений: 14896 Регистрация: 15.09.2012

Профессиональная разработка приложений для MS Office

#14

05.02.2018 11:34:45

Цитата
PooHkrd написал: фигня какая-то разворачивается

я не сильно вдумывался в сами данные, но ведь они есть? Я так понял изначально, что разворачиваются null вместо данных. А это не так - данные-то есть. И у меня такие же данные разворачиваются, как у Вас. Понятно, что должен быть поставщик 2, а не 1. Видимо в этом проблема. Но не в этом же:

Цитата
Денис написал: Развертываю таблицу и данных нет

Видимо, я просто невнимательно прочитал аннотацию к файлу, где проблема уже чуть иначе была раскрыта.
А данные в этом случае берутся из начального источника - т.е. из Минимальная цена -шаг Источник. Что действительно странно.

Изменено: Дмитрий Щербаков - 05.02.2018 11:41:16

Даже самый простой вопрос можно превратить в огромную проблему. Достаточно не уметь формулировать вопросы...

Пользователь

Сообщений: 11927 Регистрация: 22.12.2012

Excel 2016, 365

#15

05.02.2018 11:53:52

Цитата
Денис написал: Получается, при использовании Table.Distinct нет смысла разворачивать столбцы?

Получается, что вы не правильно решаете задачу. Фактически вам нужно для каждой подгруппы и подтаблицы, задаваемой набором столбцов в Table.Distinct выбрать единственную запись, определяемую набором и правилами упорядочивания. Так это будет правильно. Как это реализовать мышиным хардкодом - не знаю, так как им не пользуюсь.
Пример, как лучше находить таблицы с минимальными ценами и закупами, с учётом того, что в вашем случае можно просто выбирать такие записи подгрупп по минимуму Цены/Закупа.
Успехов.
P. S. И спасибо за демо ошибки - всегда чувствовал, что в Power Query следует соблюдать SQL подход, а не надеяться, что данные будут следовать друг за другом в неизменном виде.

Прикрепленные файлы

Копия Пример про развернутый элемент.xlsx (34.49 КБ)

Изменено: Андрей VG - 05.02.2018 11:56:47

Пользователь

Сообщений: 188 Регистрация: 29.08.2017

#16

05.02.2018 12:17:49

Цитата
Андрей VG написал: Фактически вам нужно для каждой подгруппы и подтаблицы, задаваемой набором столбцов в Table.Distinct выбрать единственную запись, определяемую набором и правилами упорядочивания.

Да я уже перепробовал наверное 5 разных способов нахождения минимального значения)) Но вот понравилось это делать через удаление дубликатов, по следующим причинам: иногда ситуация усложняется и например минимальное значение может быть одинаково и надо уже ориентироваться на самого поставщика - какой из них более приоритетный. И этим можно управлять через любые сортировки, то есть главное чтобы нужное значение было на первом месте, а последующие - удалятся. И сортировка оказалась самым простым способом в этом плане. Но вышли подводные камни...

Цитата
Андрей VG написал: P. S. И спасибо за демо ошибки - всегда чувствовал, что в Power Query следует соблюдать SQL подход, а не надеяться, что данные будут следовать друг за другом в неизменном виде.

Пожалуйста) А вот я не SQL программист, и для меня эти баги прям проблема-проблема...

Пользователь

Сообщений: 11927 Регистрация: 22.12.2012

Excel 2016, 365

#17

05.02.2018 12:46:44

Цитата
Денис написал: и например минимальное значение может быть одинаково и надо уже ориентироваться на самого поставщика - какой из них более приоритетный

Как выше писал это

Цитата
Андрей VG написал: выбрать единственную запись, определяемую набором и правилами упорядочивания

Пример для минимальной цены

Код

let
    Источник = #"Все таблицы",
    grouped = Table.Group(#"Все таблицы", {"№"}, {"needed", each Table.First(Table.Sort(_, {{"Цена", Order.Ascending}, {"Поставщик", Order.Descending}})) }),
    delGroupCols = Table.RemoveColumns(grouped,{"№"}),
    result = Table.ExpandRecordColumn(delGroupCols, "needed", {"№", "Цена", "Закуп", "Поставщик"})
in
    result

Цитата
Денис написал: эти баги

Это не баги. Это неправильное понимание и не знание структур и алгоритмов

Изменено: Андрей VG - 05.02.2018 12:52:51

Пользователь

Сообщений: 6602 Регистрация: 22.02.2017

Excel x64 О365 / 2016 / Online / Power BI

#18

05.02.2018 13:11:36

Вот я прям чувствовал, что не надо использовать удаление дублей. И вот оно - подтверждение моей чуйки

Всегда дубли убираю через группировку, и с такой ерундой ранее не встречался.
Андрей VG, тогда не очень понятно почему Table.Join сработал как ожидалось, а Table.NestedJoin подложил такую свинью. Где хоть ознакомиться, что такое сочетание функции приводит к такому вот результату?

Вот горшок пустой, он предмет простой...

Пользователь

Сообщений: 11927 Регистрация: 22.12.2012

Excel 2016, 365

#19

05.02.2018 15:43:24

Цитата
PooHkrd написал: не очень понятно почему Table.Join сработал как ожидалось, а Table.NestedJoin подложил такую свинью

всё же соглашусь с ТС, наверное баг. PQ же не на прямую выполняется, а как и SQL, проходит цепочку преобразований через анализатор, оптимизатор, компилятор перед выполнением. Видимо где то на этих этапах для nestedjoin теряется использование сортировки перед distinct. Типа - а зачем? Если любой первый? Можно писать баг отчёт разработчикам. Говорят, что подобные вещи они быстро исправляют.
А где ещё есть, не знаю. Стараюсь делать детерминированные решения. Хотя и тут бывают баги. Например у меня вылетало отправляемое на сортировку соединение сделанная через list.generate таблица нарастающего итога по столбцу исходной таблицы с исходной таблицей по общему столбцу индекса с сообщением о нехватки памяти. То есть если не вкючать сортировку итоговой таблицы по индексу исходного порядка, то всё хорошо и вывод есть. Но стоит только добавить - сообщение об ошибке.

Пользователь

Сообщений: 188 Регистрация: 29.08.2017

#20

05.02.2018 15:50:15

PooHkrd, я тоже начинал пробовать через группировку, но до конца реализовать не получилось. А именно:

Вот он выбрал минимальное значение из нескольких строк, а как сделать чтобы он также оставил другие столбцы, соответствующие этому минимальному значению. (то есть подгрузил столбец поставщик, цена и другие)
Как правильно делать группировку, если у нас встречается одинаковые значения и надо уже смотреть по поставщику.

Вот эти вопросы меня и остановили при использовании группировкой...

Цитата
Андрей VG написал: Это не баги. Это неправильное понимание и не знание структур и алгоритмов

Отчасти это так, но в данной ситуации я пользовалсяь стандартными функциями и они не сработали)

Пользователь

Сообщений: 6602 Регистрация: 22.02.2017

Excel x64 О365 / 2016 / Online / Power BI

#21

05.02.2018 15:53:39

Цитата
Андрей VG написал: PQ же не на прямую выполняется, а как и SQL, проходит цепочку преобразований через анализатор, оптимизатор, компилятор перед выполнением.

А вот это натолкнуло меня на идею. Попоробовал - взлетело!
Table.Buffer -вот еще одно решение, и еще одно объяснение, почему я раньше не натыкался на такой баг - месяца 4 назад начал все промежуточные запросы закидывать в память - и работает быстрее и, как оказывается, глюков с очередностью шагов меньше.
Для ТС - каждый последний шаг в двух сливаемых запросах запихиваем в функцию Table.Buffer и вуаля.

Цитата

Денис написал:
Вот он выбрал минимальное значение из нескольких строк, а как сделать чтобы он также оставил другие столбцы, соответствующие этому минимальному значению. (то есть подгрузил столбец поставщик, цена и другие)
Как правильно делать группировку, если у нас встречается одинаковые значения и надо уже смотреть по поставщику.

1. Сделали группировку по минимальному значению
2. Сливаем результат с таблицей, которая была до группировки по двум ключевым столбцам "код номенклаутры" и "значение минимальной цены"
3. Разворачиваем столбец с минимальной ценой по получившемуся столбцу отфильтровываем все строки со значением <> null
На выходе получили только строки с минимальной ценой
Ну а как вы поставщиков с одинаковой минимальной ценой отсеивать будете я логики не видел.

Прикрепленные файлы

Копия Пример про развернутый элемент-2.xlsx (26.77 КБ)

Изменено: PooHkrd - 05.02.2018 16:05:05

Вот горшок пустой, он предмет простой...

Пользователь

Сообщений: 188 Регистрация: 29.08.2017

#22

05.02.2018 16:23:47

Цитата
PooHkrd написал: Для ТС - каждый последний шаг в двух сливаемых запросах запихиваем в функцию Table.Buffer и вуаля.

Попробовал - тоже получилось!
Видимо, все тяжелые запросы надо заканчивать буфером.

Цитата
PooHkrd написал: Ошибка

а это про что?

Пользователь

Сообщений: 6602 Регистрация: 22.02.2017

Excel x64 О365 / 2016 / Online / Power BI

#23

05.02.2018 16:37:25

Цитата
Денис написал: Видимо, все тяжелые запросы надо заканчивать буфером.

Здесь не в этом дело. Обычно буфером я заканчиваю запросы, к которым обращаюсь более одного раза из-за корявого кэширования в Экселевском PQ. Но в данном случае Буфер ограничивает запрос в отдельную структуру для оптимизаторов, про которые писал Андрей VG. Т.е. выполнение действий с данными происходит не как с единой цепочкой от последнего запроса к первому. А сначала отдельно вычисляются два запроса, результаты запихиваются в оперативку, и последний запрос работает уже с результатами, а не разворачивает цепочки.

Вот горшок пустой, он предмет простой...

Пользователь

Сообщений: 188 Регистрация: 29.08.2017

#24

05.02.2018 16:43:04

Цитата
PooHkrd написал: Здесь не в этом дело. Обычно буфером я заканчиваю запросы, к которым обращаюсь более одного раза из-за корявого кэширования в Экселевском PQ

я, конечно, утрировал. Нужна какая-та мера по использованию Table.Buffer, но в принципе если завершать все важные запросы Buffer = Table.Buffer() ничего критичного не должно произойти. Или может наступить переполнение буффера?

PooHkrd Пользователь Сообщений: 6602 Регистрация: 22.02.2017 Excel x64 О365 / 2016 / Online / Power BI	#25 05.02.2018 16:47:41 Ну, на сколько вам оперативки хватит. Все же массивы по нескольку миллионов строк закидывать в оперативку я бы не рекомендовал . Вот горшок пустой, он предмет простой...

Пользователь

Сообщений: 188 Регистрация: 29.08.2017

#26

05.02.2018 16:57:46

Цитата
PooHkrd написал: Обычно буфером я заканчиваю запросы, к которым обращаюсь более одного раза из-за корявого кэширования в Экселевском PQ

имеется в виду обращаетесь в рамках одной книги или разных? То есть если очень часто обращаюсь к таблице, которая загрузила данные с сайта. Причем обращение идет из разных книг. Желательно тогда этот запрос с данными с сайта закончить буффером получается?

Пользователь

Сообщений: 6602 Регистрация: 22.02.2017

Excel x64 О365 / 2016 / Online / Power BI

#27

05.02.2018 17:29:53

Денис, я уже упоминал ранее что не умею обращаться к запросам из других книг. К таблицам, да, но не к запросам. Соответственно, если вы затащили в книгу данные с сайта чтобы сохранить в таблицу, а потом используете полученную таблицу в других книгах, то зачем её еще и в буфер размещать?

Изменено: PooHkrd - 05.02.2018 17:30:06

Вот горшок пустой, он предмет простой...

Денис Пользователь Сообщений: 188 Регистрация: 29.08.2017	#28 05.02.2018 17:31:57 PooHkrd, Я Понял. Актуально только в рамках одной книги)