Нарастающие итоги DAX (Cumulative SUM)

Нарастающие итоги DAX (Cumulative SUM), Как посчитать нарастающий итог без привязки к датам

Пользователь

Сообщений: 49 Регистрация: 27.02.2018

14.06.2018 15:03:39

Ребята, доброе время суток всем.
В работе с АВС анализом столкнулся с некоторой сложностью, а именно подсчетом нарастающей суммы.
В интернете есть примеры, однако они все связаны датой. В данном случае нет дат.

Необходимо просуммировать Долю по Клиентам, желтый блок скрина (или файл в Excel).

Помогите пожалуйста!!!

Прикрепленные файлы

Example.xlsx (107.85 КБ)
Снимок.JPG (24.01 КБ)

Изменено: Anatoly V. - 14.06.2018 15:05:50

Андрей VG

Пользователь

Сообщений: 11927 Регистрация: 22.12.2012

Excel 2016, 365

14.06.2018 15:15:41

Доброе время суток.

Цитата
Anatoly V. написал: однако они все связаны датой

Наглая ложь!

Самый известный пример этого дела легко находится ABC Classification. Он как раз даты и не рассматривает.

Anatoly V.

Пользователь

Сообщений: 49 Регистрация: 27.02.2018

14.06.2018 15:21:25

Андрей VG,

Видел этот пример. Проблема с EARLIER, не могу пройти тот этап поскольку выплывает ошибка.
Отчасти это связано, видимо с незнанием самой функции, использовал ее впервые, изучаю, отчасти, возможно, сам мой кейс несколько иной.

В какой форме следует использовать этот EARLIER, помогите тогда в плане корректного применения.

Спасибо.

PooHkrd

Пользователь

Сообщений: 6602 Регистрация: 22.02.2017

Excel x64 О365 / 2016 / Online / Power BI

14.06.2018 15:35:55

Ну, если взять формулу для вычисляемого столбца прямо из статьи:

Код
[CumulatedSales] = CALCULATE ( SUM ( Products[ProductSales] ), ALL ( Products ), Products[ProductSales] >= EARLIER ( Products[ProductSales] ) )

здесь EARLIER используется в качестве фильтра
Products[ProductSales] - это ссылка на столбец
EARLIER ( Products[ProductSales] ) - это ссылка на значение столбца в текущей строке ( так функция работает только при создании вычисляемых столбцов - в мерах все несколько сложнее).
Т.е. образно функция сортирует столбец по убыванию и начинает перебирать строки по очереди суммируя все значения, которые находятся выше плюс значение в текущей строке.
Тут весь вопрос в том, что для расчета накопительной суммы вам в любом случае нужно задать очередность перебора строк. Где-то это задается датой, где-то индексом, здесь сортировкой.

Изменено: PooHkrd - 14.06.2018 15:40:50

Вот горшок пустой, он предмет простой...

Anatoly V.

Пользователь

Сообщений: 49 Регистрация: 27.02.2018

14.06.2018 15:45:07

PooHkrd,

Вы можете смоделировать корректную формулу в файле Example.xlsx, который был приложен? Теорию я вижу, но практика не позволяет мне этого сделать. В различных вариациях выдает

Прикрепленные файлы

Снимок.JPG (33.8 КБ)

Anatoly V. Пользователь Сообщений: 49 Регистрация: 27.02.2018	#6 14.06.2018 15:51:10 Андрей VG, Андрей, возможно Вы сможете перебить модель необходимым образом? Как-то раз уже помогали мне с одной проблемой. Спасибо.

Anatoly V.

Пользователь

Сообщений: 49 Регистрация: 27.02.2018

14.06.2018 16:00:38

Андрей VG, PooHkrd,
В любом переборе вводных для EARLIER мера при проверки показывает ошибку. Использовал как обращение к мерам, так и к столбцам.
Вроде бы и тупой кейс, но не могу его решить. Гляньте пожалуйста.

Прикрепленные файлы

Снимок.JPG (93.9 КБ)

Изменено: Anatoly V. - 20.06.2018 01:08:19

Андрей VG

Пользователь

Сообщений: 11927 Регистрация: 22.12.2012

Excel 2016, 365

14.06.2018 16:11:33

Anatoly V., читайте внимательнее, о чём пишет коллега, не меру, а

Цитата
PooHkrd написал: если взять формулу для вычисляемого столбца

добавлю в таблице.
Хотите динамически, только мерами, то читайте следующую статью об этом ABC Classification – Dynamic

PooHkrd

Пользователь

Сообщений: 6602 Регистрация: 22.02.2017

Excel x64 О365 / 2016 / Online / Power BI

14.06.2018 16:11:44

ну, например, такой вариант

Код

RunningTotal:=
CALCULATE(
   SUM( [Объем] );
   FILTER(  
      ALL('Клиенты') ;
      SUMX( 
         FILTER( 
            'Клиенты'; 
            EARLIER( 'Клиенты'[Объем] ) >= 'Клиенты'[Объем] ); 
         'Клиенты'[Объем] 
      )
   )
)

Честно спер отсюда
Если перевести по-простому, то для использования функции внутри меры нужно сначала создать внешний контекст (что достигается при помощи ALL('Клиенты') ), тогда появляется внутренний контекст строки в сводной таблице к которому и обращается EARLIER. Когда же вы пишите формулу для столбца, то этот контекст имеется по-умолчанию.
Если что не так сказал, то, думаю, Андрей меня поправит.

Изменено: PooHkrd - 14.06.2018 16:17:14

Вот горшок пустой, он предмет простой...

Anatoly V. Пользователь Сообщений: 49 Регистрация: 27.02.2018	#10 14.06.2018 16:24:16 PooHkrd, Вот она, формула моей мечты Большое всем спасибо за разъяснения. Прилагаю файлик с подсчетом на основании этих рекомендаций. Все заработало. Прикрепленные файлы Example.xlsx (107.98 КБ)

PooHkrd

Пользователь

Сообщений: 6602 Регистрация: 22.02.2017

Excel x64 О365 / 2016 / Online / Power BI

#11

14.06.2018 16:27:18

Имейте ввиду, что данная формула накопительно суммирует значения объемов от большего к меньшему, что не обязательно будет совпадать с сортировкой клиентов в вашей сводной таблице. Т.е. итоговый результат в сводной вас может слегка расстроить

Изменено: PooHkrd - 14.06.2018 16:28:52

Вот горшок пустой, он предмет простой...

Anatoly V. Пользователь Сообщений: 49 Регистрация: 27.02.2018	#12 14.06.2018 16:32:33 PooHkrd, если отсортировать Клиентов по объему от большего к меньшему, теоретически, нивелирует эту особенность и сделает совпадение одного и другого.

Anatoly V.

Пользователь

Сообщений: 49 Регистрация: 27.02.2018

#13

14.06.2018 17:56:21

Андрей VG, PooHkrd,

Также можно посчитать аналогичные результаты по варианту "В", когда заходим с ранжировкой RANKX Клиентов по объему.
Далее, через SUMX и TOPN по RANKX с ALL Клиентами суммируем объемы по нарастающей.
В конце находим накопительный процент отношением строки два и один выше.

В этом случае можно оперировать исключительно мерами, что, как мне кажется, большой плюс.
В качестве изюминки выключил итоги через IF (ISFILTERED), в данном случае это всегда лишнее.

Для себя получил хороший заряд бодрости и радости от того, что добил этот пробел в опыте с DAX. Часто делаем АВС-XYZ, понимание в этой части очень было важно.

Всем хорошего дня и спасибо за полезные советы.

Максим Зеленский

Пользователь

Сообщений: 4663 Регистрация: 11.06.2014

Microsoft MVP 2018-2022

#14

14.06.2018 18:49:48

Цитата
PooHkrd написал: создать внешний контекст (что достигается при помощи ALL('Клиенты') )

неправильно. Нужен не просто внешний контекст, а внешний контекст сроки (row context), который создается FILTER. И вот этот FILTER задает как раз наружный строковый, который и читается EARLIER. SUMX создает внутренний (и что самое любопытное, он будет равен одной строке наружного строкового контекста), который EARLIER игнорирует

F1 творит чудеса

PooHkrd

Пользователь

Сообщений: 6602 Регистрация: 22.02.2017

Excel x64 О365 / 2016 / Online / Power BI

#15

15.06.2018 11:56:51

Попробую сформулировать тоже самое, но как-то на пальцах:
Функция используется как выражение внутри второй функции FILTER, значит этот фильтр не создает для неё контекста т.е. EARLIER "выглядывает" за этот фильтр и видит там SUMX, который как раз задает контекст строки, таким образом она игнорирует именно этот заданный контекст и видит только контекст, который задан первым фильтром с ALL и применяет этот контекст к столбцу.
Соответственно если использовать EARLIEST то он проигнорирует все фильтры и будет использовать только те контексты, которые задаются самой сводной таблицей?
Так?

Вот горшок пустой, он предмет простой...

Максим Зеленский

Пользователь

Сообщений: 4663 Регистрация: 11.06.2014

Microsoft MVP 2018-2022

#16

15.06.2018 19:23:32

Подробнее тут:

Нет, не так.

Итератор типа FILTER или SUMX создает строковый контекст для своего второго аргумента. EARLIER находится во втором аргументе внутреннего FILTER, следовательно внутренний FILTER создает первый строковый контекст для него. EARLIER игнорирует (или, как вы пишете, "выглядывает за") первый строковый контекст, созданный внутренним FILTER. Но так как этот внутренний FILTER сам по себе является первым аргументом SUMX, то сам SUMX еще не успел создать никакого строкового контекста (он тоже создает его для второго аргумента).
Поэтому EARLIER ищет строковый контекст снаружи относительно SUMX, и находит его в наружном FILTER, который ALL('Клиенты').
Находит, берет объем клиента из ALL(Клиенты). Сверяет его с тем объемом, который задан посредством внутреннего FILTER. А внутренний FILTER перебирает табличку из 1 строки (так как он получил ее в контексте из сводной). Т.е. фактически это текущий клиент сводной. Сравниваем полученное из внешнего filter с текущим клиентом сводной, если больше, то считаем число. А если меньше - то у нас получится BLANK
Итого внешний FILTER для каждого клиента получит или число (что равно TRUE) или BLANK (что равно FALSE), и так и отберет нужных клиентов. А потом уже посчитает для них сумму наконец.
И, кстати, вместо SUMX может быть MAXX, и так далее. Не важно, что, важно то, что получится в предыдущем абзаце.

А вообще эта мера очень громоздкая и прям перебор с количеством строковых контекстов. Достаточно двух:

Код
= SUMX ( 'Клиенты'; CALCULATE ( [Total Value, tn]; FILTER ( ALL ( 'Клиенты' ); EARLIER ( 'Клиенты'[Объем] ) <= 'Клиенты'[Объем] ) ) )

правда там итоги странные

Есть более элегантный вариант, без EARLIER, и строковый контекст лучше изучать на таком примере кумулятивной меры:

Код

Total Value. tn = SUM ( 'Клиенты'[Объем] )

Cumulative Value =
CALCULATE (
    [Total Value. tn];
    FILTER (
        ALL ( 'Клиенты' );
        [Total Value, tn] >= SUM ( 'Клиенты'[Объем] )
    )
)

ЗЫ и итог убирать не надо

Цитата
PooHkrd написал: если использовать EARLIEST то он проигнорирует все фильтры и будет использовать только те контексты, которые задаются самой сводной таблицей?

а проверьте. Нет

В мерах он будет брать самый наружный заданный формулой контекст. В вычисляемом столбце - контекст строки таблицы, неважно, сколько вложенных строковых контекстов есть в формуле столбца.

Изменено: Максим Зеленский - 15.06.2018 19:24:04

F1 творит чудеса

PooHkrd Пользователь Сообщений: 6602 Регистрация: 22.02.2017 Excel x64 О365 / 2016 / Online / Power BI	#17 19.06.2018 10:11:38 Атас, такую подробную лекцию мне теперь неделю на примерах переваривать. Максим, огромное спасибо за потраченное на меня время! Вот горшок пустой, он предмет простой...

Kra65

Пользователь

Сообщений: 4 Регистрация: 31.03.2019

#18

31.03.2019 22:57:20

Максим, здравствуйте.

Ваша мера отлично работает, но у меня есть проблема.
У меня довольно объемная таблица - около 3,4 млн строк, и справочник примерно на 100 тыс. строк.
Когда запускаю расчет АБС - система напрочь подвисает, и показывает нехватку памяти (памяти 16 ГБ).

При этом, если ставить фильтр на ТОП наименований - все работает.
Я пробовал несколько вариантов мер, Вашу, и с сортировкой по рейтингу - ничего не помогает.
Это странно, потому что в обычной сводной накопленный процент считает мгновенно для этой же базы.

Что у нас не так?

Заранее благодарен, Владимир.

PooHkrd Пользователь Сообщений: 6602 Регистрация: 22.02.2017 Excel x64 О365 / 2016 / Online / Power BI	#19 01.04.2019 10:00:12 Kra65, чтобы видеть что не так - нужно видеть модель со всеми связями. Не обязательно со всеми 3.4 млн строк, но таблички нужно видеть все и связи между ними тоже. Вот горшок пустой, он предмет простой...

Максим Зеленский

Пользователь

Сообщений: 4663 Регистрация: 11.06.2014

Microsoft MVP 2018-2022

#20

01.04.2019 10:21:55

Цитата
Kra65 написал: Я пробовал несколько вариантов мер

как минимум - покажите меру. Если она использует другие меры, то их формулы тоже желательно - может быть, вся история там.
Ну и понятно, что 100 тыс. в справочнике - не мало. Но тут еще второй важный вопрос: а вам точно нужен динамический подсчет нарастающего итога, или статичного достаточно?

F1 творит чудеса

Kra65

Пользователь

Сообщений: 4 Регистрация: 31.03.2019

#21

02.04.2019 19:55:16

Структура данных простая, связь со справочником через наименование, анализ идет по полю Наименование2 - унифицированное наименование.

Фильтры в Power Pivot и BI ставлю по нескольким параметрам - ГРУППА 1 - 2 -3, ФО т так далее.

Вычисляю через расчет рейтинга:

рейтинг по кг = RANKX(ALLSELECTED( 'Полн_спр'[Наименование2] ); [Сумма по столбцу кг] )

Затем - нарастающим итогом:

NI кг =
DIVIDE(
CALCULATE(
[Сумма по столбцу кг];
TOPN([рейтинг по кг];
ALLSELECTED(
'Полн_спр'[Наименование2]);
[Сумма по столбцу кг]));

CALCULATE(
[Сумма по столбцу кг];
ALLSELECTED(
'Полн_спр'[Наименование2])))

Считает корректно, но при большом массиве данных подвисает и выбрасывает из-за нахватки памяти. Иначе нужно ставить фильтр на Наименование2 по ТОП 100

Мера, предложенная Вами - аналогично.

Пробовал поставить фильтр (подсмотрел на иноязычном сайте):

NI кг=
IF(COUNTROWS(
'Данные для EXCEL')>0; <моя мера> ;BLANK())

Так не вылетает, хотя считает медленно (несколько минут) . Стандартное поле в Power Pivot нарастающий итог выдает почти мгновенно.

Возможно, я что-то не учитываю.

Заранее благодарен за помощь, Владимир.

Kra65 Пользователь Сообщений: 4 Регистрация: 31.03.2019	#22 02.04.2019 19:56:15 структура: Изменено: Kra65 - 02.04.2019 19:58:11

Kra65 Пользователь Сообщений: 4 Регистрация: 31.03.2019	#23 02.04.2019 20:03:15 [img]file://nas/маркетинг/Аналитик/Владимир/Рисунок2[/img] Прикрепленные файлы Рисунок2.png (144.44 КБ)

JeyCi

Пользователь

Сообщений: 3399 Регистрация: 27.11.2013

#24

03.04.2019 08:45:36

вообще EARLIER и RANKX какими-то неоптимальными мне кажутся (сравнивая построчно)... если понятна бух.логика - то вариант я рассматривала здесь ... а у вас, насколько понимаю, ещё проще - только кредит считаете - по сути... [суммой накопительной до данной даты - остатки и ваш кредит]... оптимизируйте (я ведь делала 1-й раз и не хочу опять лезть в PP)...
ну если сможете перевести всё в данные бух термины... и подрядить бух логику ведения счёта... условно интерполируя на ваши объекты расчётов... - то и без EARLIER справитесь - она вроде тормозит!!... но ,бух логикой, действительно, проникнуться надо - на пальцах не буду объяснять (а в примере показала в той ветке)... Начальное сальдо+Дебет-Кредит=Конечное сальдо ... и всё с Фильтром по Товару... - это по сути переводится, как там сказал Андрей VG

Цитата
Андрей VG написал: банальной задачи к текущей дате посчитать сумму приходов минус сумма расходов плюс начальный остаток, начинаются танцы с бубном

только без бубна ... и у вас даже дебет не нужен... а может ещё и остатки не нужны... (вечно путаю ABC и XYZ анализ)

p.s.
или вот соседняя ветка уже сейчас - Касса в сводной таблице (Power pivot) - честно говоря не смотрела ещё...

Изменено: JeyCi - 04.04.2019 11:44:22

чтобы не гадать на кофейной гуще, кто вам отвечает и после этого не совершать кучу ошибок - обратитесь к собеседнику на ВЫ - ответ на ваш вопрос получите - а остальное вас не касается (п.п.п. на форумах)

Андрей Муковнин

Пользователь

Сообщений: 50 Регистрация: 17.09.2014

#25

07.05.2019 11:31:58

Добрый день!
Может кто-нибудь показать пример такого же элегантного варианта из сообщения #16, но как вычисляемый столбец, а не меру?
Спасибо!

Изменено: Андрей Муковнин - 07.05.2019 11:33:21 (Добавлена ссылка на сообщение)

DrillPipe Пользователь Сообщений: 346 Регистрация: 23.04.2019	#26 08.05.2019 02:36:51 «Когда запускаю расчет АБС - система напрочь подвисает, и показывает нехватку памяти (памяти 16 ГБ).» Производительность функции EARLIER может снижаться, поскольку теоретически может понадобиться выполнить количество вычислений, близкое к общему количеству строк (в столбце), умноженному на это количество (в зависимости от синтаксиса выражения). Например, если столбец содержит 10 строк, то может потребоваться до 100 операций, а для 100 строк может выполняться до 10 000 операций. https://docs.microsoft.com/ru-ru/previous-versions/sql/sql-server-2014/ee634551%28v%3dsql.120%29