План-факт анализ в сводной таблице с Power Pivot и Power Query
Постановка задачи
В исходных данных имеем две таблицы. Скромную в дизайне, большую по размеру, но удобную в работе таблицу с фактическими значениями продаж, выгруженную из какой-нибудь учетной системы:
И "красивую" таблицу с плановыми помесячными показателями от руководства:
Задача: каким-то образом объединить обе таблицы в одну, чтобы наглядно отобразить выполнение плана по каждому товару, региону, месяцу, кварталу и т.д.
Необходимая оговорка
Можно, конечно, не напрягаться, и решать это дело привычным образом "в лоб". Т.е. с помощью 144 функций СУММЕСЛИМН (SUMIFS) вычислять суммарные продажи по каждому месяцу, товару и городу, а потом с помощью еще 144 формул вручную считать процент выполнения плана.
Потом мысленно взвыть, когда шеф скажет, что хотел видеть динамику по кварталам, а не по месяцам. И лучше в рублях, а не в процентах. И города лучше расположить по столбцам, а месяцы по строчкам. И не ной, у тебя вся ночь впереди, к утру чтоб было готово.
И в нашем примере всего 3 города и 4 товара. А если будет больше?
Давайте-ка лучше мы пойдем другим путем - чуть более сложным, но гораздо более гибким и удобным в перспективе.
Что мы будем делать
Думаю, никто не будет спорить, что самым удобным, гибким и мощным инструментом для анализа данных в Microsoft Excel являются сводные таблицы. Так что, в идеале, надо бы свести решение нашей задачи именно к ним.
Но как объединить в одной сводной две наших исходных таблицы? Плоскую таблицу продаж по дням и трехмерную таблицу плановых значений с детализацией по месяцам? Тут нам помогут 2 мастхэв надстройки для Excel:
- Power Query - встроена в Excel, начиная с 2016-й версии, для более ранних Excel 2010-2013 её можно бесплатно скачать с сайта Microsoft.
- Power Pivot - c 2013 года входит в состав большинства (но не всех, к сожалению) пакетов Microsoft Office. Для Excel 2010 (но не для более новых версий!) бесплатно качается, опять же, с сайта Microsoft.
Поехали, по шагам...
Шаг 1. Добавляем соединительные таблицы-справочники
Связать напрямую наши исходные таблицы факта и плана, к сожалению, никак не получится. Ни Power Pivot, ни, тем более, Excel не поддерживают пока связи "многие-ко-многим" (many-to-many), означающие, что в исходных таблицах могут встречаться дубликаты (а это как раз наш случай - названия товаров и городов встречаются в каждой таблице не по одному разу).
Поэтому нам потребуется создать "костыли" - промежуточные таблицы-справочники с уникальными значениями товаров, городов и дат, которые мы будем использовать для создания связей "один-ко-многим" (one-to-many), которые Power Pivot умеет делать на ура:
Для создания таблицы дат удобно использовать команду Главная - Заполнить - Прогрессия (Home - Fill - Progression):
Шаг 2. Превращаем все таблицы в "умные" и даём им имена
Для загрузки таблиц в Power Pivot они должны быть "умными" (динамическими). Для этого с каждой таблицей проделываем следующее:
- Выделяем любую ячейку таблицы
- Жмем сочетание клавиш Ctrl+T или выбираем Главная - Форматировать как таблицу (Home - Format as Table).
- В открывшемся окне проверяем корректность выделения диапазона (особенно для таблицы плана!) и включена ли галочка Таблица с заголовками (My table has headers) и жмем ОК.
- На вкладке Конструктор (Design) в левом верхнем углу даем таблице осмысленное имя вместо стандартных безликих Таблица1,2,3...
Я назвал наши таблицы, соответственно:
- таблПродажи
- таблТовары
- таблГеография
- таблКалендарь
- таблПлан
Шаг 3. Грузим первые 4 таблицы в Power Pivot
Первые четыре таблицы у нас в правильном виде, поэтому их можно смело загружать их в Модель данных - область памяти, с которой оперирует Power Pivot. Подключаем нашу надстройку через Файл - Параметры - Надстройки - Надстройки COM - Перейти (File - Options - Add-ins - COM Add-ins - Go) и убеждаемся, что на ленте появилась вкладка Power Pivot.
Теперь по очереди для каждой из первых четырёх таблиц, установив в неё активную ячейку, жмём на кнопку Добавить в модель данных (Add to Data Model):
В старых версиях эта кнопка называлась Связанная таблица (Linked table).
В итоге все наши таблички должны загрузиться в открывшееся окно Power Pivot на отдельные вкладки:
Шаг 4. Доводим до ума таблицу План
Прежде, чем загрузить в Модель данных Power Pivot таблицу с плановыми значениями, её нужно сначала подрихтовать: убрать в ней пустые строки и итоги, развернуть в плоскую, заполнить пустые ячейки в первом столбце городами и т.д. Проще и легче всего это проделать с помощью надстройки Power Query.
Сначала загрузим таблицу с планами в редактор запросов Power Query, используя кнопку Из таблицы/диапазона (From Table/Range) на вкладке Данные (Data) или на вкладке Power Query (если у вас старая версия Excel 2010-2013 и вы установили Power Query как отдельную надстройку):
Затем в открывшемся окне Power Query делаем следующее:
1. Удаляем все пустые строки с null через Главная - Удалить строки - Удалить пустые строки (Home - Remove rows - Remove empty rows).
2. Удаляем строки с итогами, сняв соответствующую галочку в фильтре по столбцу Товар.
3. Удаляем ненужный последний столбец ИТОГО, щелкнув по его заголовку правой кнопкой мыши - Удалить (Remove).
4. Заполняем пустые ячейки в первом столбце названиями городов из вышестоящих ячеек, щелкнув по заголовку столбца Город правой и выбрав Заполнить - Вниз (Fill - Down).
5. Разворачиваем 12 столбцов-месяцев в два: название месяца и его значение. Для это выделяем первых два столбца Город и Товар (удерживая клавишу Ctrl), щёлкаем по их заголовку правой и выбираем команду Отменить свёртывание других столбцов (Unpivot Other Columns).
6. Чтобы преобразовать текстовые названия месяцев в нормальную даты - идём на хитрость:
- Добавляем перед датами единички через пробел с помощью команды Преобразование - Формат - Добавить префикс (Transform - Format - Add prefix)
- Аналогично добавляем после дат 2019 через Преобразование - Формат - Добавить суффикс (Transform - Format - Add suffix)
- Теперь, когда текст в этом столбце стал уже гораздо больше похож на дату, конвертируем всё его содержимое в даты, используя выпадающий список типов в шапке столбца:
7. Столбец Атрибут переименовываем в Дата (двойным щелчком по заголовку столбца).
8. Чтобы не путать исходную таблицу плана с преобразованной, изменим имя запроса на таблПлан2 в правой панели Power Query (впоследствии это будет именем таблицы в Power Pivot).
После этого наша последняя таблица таблПлан должна загрузиться в окошко Power Pivot.
Шаг 5. Связываем таблицы
Теперь пришло время выполнить одно из самых важных действий - связать все имеющиеся у нас таблицы в единую модель, чтобы впоследствии иметь возможность строить сводную по всей модели, будто это одна таблица.
Для связывания в окне Power Pivot лучше переключиться в режим диаграммы с помощью кнопки Главная - Представление диаграммы (Home - Diagram View) или значком Диаграмма (Diagram) в правом нижнем углу окна. Прямоугольные окошки таблиц можно перетащить за строку заголовка и разложить любым удобным вам образом.
Связь делается очень просто: хватаем мышью столбец в одной из соединительных таблиц (таблТовары, таблГеография, таблКалендарь), тянем и бросаем на соответствующий столбец в таблицах таблПродажи и таблПлан2:
Если всё получилось, то сохраняем файл и выдыхаем - дело почти сделано.
Шаг 6. Строим сводную
Теперь на основе созданной модели данных можно построить сводную - для этого в окне Power Pivot выбираем команду Главная - Сводная таблица - Сводная таблица (Home - Pivot table - Pivot table). Мы автоматически вернёмся в Excel, где увидим привычную панель для построения сводной таблицы в правой части экрана, но в ней будут видны уже все таблицы, а не только текущая (как обычно):
Теперь можно знакомым уже образом перетащить мышью нужные нам поля из таблиц в области сводной таблицы.
Главные принципы здесь такие:
- В области строк, столбцов и фильтра можно бросать только поля из таблиц-справочников (таблГеография, таблКалендарь, таблТовары).
- В область значений, где идут вычисления, можно закидывать только поля из таблиц факта и плана (таблПродажи, таблПлан2)
Например, можно накидать так:
Чтобы по столбцам даты шли не с шагом один день, а покрупнее - щёлкаем по любой дате в сводной правой кнопкой мыши и выбираем команду Группировать по (Group by), а затем любой нужный уровень группировки:
В итоге должно получиться что-то уже очень похожее на то, что нам требуется:
Шаг 7. Добавляем меры для вычислений
Меры - это, упрощенно говоря, формулы внутри сводных. На самом деле, когда мы переносим мышью любое поле (например, Выручка) в область значений сводной таблицы, то "под капотом" создается неявная мера - что-то вроде:
Сумма по полю Выручка := SUM(таблПродажи[Выручка])
Но контролировать процесс создания неявных мер мы не можем - Excel сам решает как её назвать, какую именно функцию (SUM или COUNT) использовать и т.д. Поэтому лучше создавать явные меры для сводной самостоятельно - в этом случае мы сможем контролировать все их параметры.
Для этого на вкладке Power Pivot выберем команду Меры - Создать меру (Measure - New measure) и в открывшемся окне задаём:
Здесь:
- Имя таблицы - место для хранения меры (можно выбрать любую таблицу - это не играет роли).
- Название меры - придумываем и вводим любое удобное название (можно на русском).
- Описание - по желанию.
- Формула - вводим формулу, по которой будет вычисляться мера. Можно использовать функции из встроенного в Power Pivot языка DAX (кнопка fx).
- Проверить формулу - чекает вашу формулу на предмет ошибок и выдаёт рекомендации по их исправлению.
- В нижней части окна можно сразу же задать числовой формат для меры, чтобы потом по 100 раз не настраивать его в сводной (как это бывает с обычными неявными мерами).
Повторяем процесс еще два раза:
-
Создаем меру с именем Факт с формулой =SUM('таблПродажи'[Выручка]) и числовым форматом без копеек и с разделителем.
- Создаём меру Отклонение, которая использует две предыдущих созданных меры по формуле =[Факт]/[План]-1 и процентным форматом
Добавленные меры появятся в правой панели сводной таблицы с характерным значком:
Теперь их можно смело закидывать мышкой в нашу сводную и выполнять план-факт анализ в любых разрезах за считанные секунды:
Обновляется вся созданная красота (модель данных Power Pivot, запрос Power Query и сама сводная) одним движением - на вкладке Данные (Data) с помощью кнопки Обновить все (Refresh All) или сочетания клавиш Ctrl+Alt+F5.
Возможные проблемы и их решения
В процессе реализации вы можете нарваться на несколько типичных "граблей":
- Появляются странные ошибки в Power Pivot или сама вкладка Power Pivot неожиданно пропадает из Excel - отключите надстройку, перезапустите Excel и подключите её заново (см. Шаг 3). Обычно помогает.
- Не получается создать связь - проверьте, нет ли повторов в справочниках. В столбцах, используемых для связывания не должно быть (в таблицах-справочниках) дубликатов - это жёсткое требование Power Pivot.
- Какие-то странные результаты получаются в сводной - проверьте 1) правильно ли вы настроили связи 2) те ли поля вы используете для сводной (в области строк, столбцов и фильтра могут лежать только поля из справочников).
Если будут ещё какие-то сложности - пишите в комменты.
В любом случае, попробовать стоит - создав единожды такую обновляемую аналитическую систему, можно ещё долго радоваться ей в будущем :)
Ссылки по теме
- Что такое Power Query, Power Pivot и Power BI и зачем они пользователю Excel
- Сводная таблица сразу по нескольким диапазонам данных
- Создание базы данных в Excel с помощью Power Pivot
В Шаге 5 "Делаем 6 связей - каждый справочник должен быть связан тремя связями с таблицами плана и продаж."
Каждый справочник связывается с таблицами плана и продаж двумя связями.
Я имел ввиду полную функциональность, включая обновление, а оно работать не будет.
Если нужно только поиграться (подвигать туда-сюда поля в сводной, пофильтровать и т.д.), то это работать будет, т.к. сводная кэширует в себе эти данные (если вы не сняли в её параметрах галочку Сохранять данные вместе с таблицей).
Не с точки зрения критики, а дополнительной информации для (уверен вы это все знаете, просто не хотелось раздувать статью):
1. При создании связей без разницы от какой таблицы к какой её тащить, РР сам разберется где один, а где много. Причем если с обеих сторон будут уникальные значения по ключевым столбцам, то заранее вообще не очевидно какую из таблиц он сделает стороной один, частенько он им назначает таблицу с фактами.
2. Календарь можно создавать штатными средствами РР
3. В столбцах, используемых для связи не должно быть не только дубликатов на стороне один, а также пустых ячеек, иначе будет ошибка.
4. При удалении дубликатов силами Power Query перед загрузкой в модель необходимо пристальное внимание обратить на тот факт, что PQ чувствителен к регистру по умолчанию, а РР - нет. Так что могут быть казусы, когда думаешь что дубликаты удалил, а по факту - вот они!
5. Это уже мое личное мнение из полученного опыта, лучше всего файл с отчетом делать отдельным от источников, в самом файле имеет смысл держать только таблички с настройками только для этого отчета. Все остальное тащить исключительно извне.
Очень правильные комментарии, поддерживаю по всем пунктам.
Единственное, по п.1 у меня, по опыту, PP часто лажает со связями, если тащить их в неправильном направлении. Поэтому и акцентировал, что тащить надо от справочников - для надежности.
Подскажите, как создать сводную табл из Power Pivot в другой книге?
В настройках можно выбрать только два варианта: на текущем листе или на новом, а в новой книге или в другой книге - нет выбора.
Это вопрос по п.5 в комментариях Алексея.
Загрузите, пожалуйста, исходный файл для примеры - чтобы мы "руками" могли все сами проделать, руководствуясь видеоуроком. Тот пример, который загружен Вами, уже содержит все выполненные шаги. Хочется поучиться все это делать самой на исходных данных.
Спасибо огромное!
Практика - это очень правильно
Скажите, а если в данном примере в Плане города будут по английски например, а в факте по-русски?
Для связки нужно добавить в справочник второе поле?
Через 15 минут: проверил сам - да, второе поле работает.))
Так что теперь - просто спасибо большое!
а также текущий план (прогноз) с планом (прогнозом) прошлых периодов.
Вот прям как раз думала над такого рода проблемой!
Такая ситуация, на основе данных я создал сводную таблицу, (напрямую, без создания моделей), то я не смогу создать меру без модели?
Большое спасибо за полезную информацию!
Подскажите, пожалуйста, что делать, если после добавления в столбец Атрибут суффикса и префикса PowerQuery по прежнему не распознает данные как дату и выдает ошибку
У меня та же беда (Excel 2013) - на последнем шаге опция "Группировать / Разгруппировать" стала недоступной, в вашем же файле. Вообще обратил внимание - как только использую Модель данных - опция пропадает, если сразу накидываю сводную - возможность группировки есть, для одной и той же таблицы. Как -то можно решить?
Поставили на рабочий ноутбук Exel 2016 проф+. Соответственно, новый вид редактора запросов PQ, но главная проблема в рамках этого видеоурока - во вкладке Формат нет команд Префикс и Суффикс. Подскажите - есть ли возможность добавить? И есть ли возможность настройки отображения (вида) обрабатываемой таблицы - так, раньше в углу столбца отображался, например, тип данных, было очень удобно...
Данный способ мне очень понравился и я его решил применить для План-Факт анализа семейного бюджета. И у меня возник небольшой вопрос. А можно ли вместо общего суммирования воспользоваться суммированием для каждого месяца отдельно? Поясню: в плане за январь стоит сумма 20 000 руб., в феврале 18 000 руб., в марте 25 000 руб. и т.д., а по факту сумма в каждом месяце может отличаться (отклонение)... В результате в сводной на основе модели данных PT я хочу видеть отклонение не от общей суммы запланированных расходов, а конкретно отклонение от месячного плана... Пример: Январь - план 20 000, факт 18 500, отклонение составило 7,50%.... и так для каждого месяца... Спасибо не равнодушным))
Выполнил шаг 6, но офис 365 выдает ошибку вместо даты. Перепроверил преведущие шаги все ок.
Все наладилось. Сменил локализацию формата даты в столбце.
Очень классный урок!
Хотелось узнать, если итоговая таблица имеет несколько категорий товаров, у каждого из которых свои подразделы.
Создавая меры на каждый период времени, чтобы видеть отличие всех сумм подразделов на каждый товар сразу - выставляю меры по сумме в целых числах, провожу вычисление (% от родительской суммы), но не получается создать меру разницы по вычислениям.
То есть вычитая из февраля - январь, получается только разница исходных мер (разница показателей двух месяцев в абсолютных числах).
Нужна разница вычисленных процентов, исходя из того, что за 100% берется показатель по каждому товару.
Подскажите, пожалуйста, как можно проводить вычисления с такими мерами?
Нигде в инете не могу найти ответ на свою проблему.
Делаю выгрузку из гугл-таблицы с помощью Power Query. До февраля 2021г все было также, но все работало.
Теперь не работает ни старая выгрузка, ни новую не сделать, а также не работает выгрузка годичный давности. Ранее все работало...Выдает следующую ошибку, причем и при выгрузке с помощью Power Query, даже из книги Excel, сохраненной из этой гугл-таблицы.
Подскажите в чем ошибка?
""Непредвиденная ошибка: Ссылка на объект не указывает на экземпляр объекта.
Подробные сведения:
Microsoft.Mashup.Evaluator.Interface.ErrorException: Ссылка на объект не указывает на экземпляр объекта. ---> Microsoft.Mashup.Evaluator.Interface.ErrorException: Ссылка на объект не указывает на экземпляр объекта. ---> System.NullReferenceException: Ссылка на объект не указывает на экземпляр объекта.
в Microsoft.Mashup.Engine1.Runtime.TextValue.New(String value)
в Microsoft.Mashup.Engine1.Library.Excel.ExcelReaderOpenXml.CreateItemRecord(WorkbookItem workbookItem)
в Microsoft.Mashup.Engine1.Library.Excel.ExcelReaderOpenXml.<>c__DisplayClass4.<ReadTablesUnguarded>b__3(Int32 i)
в Microsoft.Mashup.Engine1.Runtime.ListValue.DemandArrayListValue.get_Item(Int32 index)
в Microsoft.Mashup.Engine1.Runtime.BufferedListValue.BufferedValueReference.get_Value()""
Фото прикладываю.[IMG][IMG]
Теперь в сводной таблице все города пересекаются со всеми категориями - что является лишним (см. красные значения на
Как правильно строить модели данных, если в каждом городе свой ассортимент товара?
sum('табплан2'[Значение]), а далее "ссылка на объект не указывает на экземпляр объекта"?
Это происходит как в скачанном примере, так и в самостоятельно создаваемом файле.
Николай, подскажите, плиз., что я сделала не так.
Репетирую на ваших же файлах. Результат: в сводной план по месяцам один и тот же. В каждом месяце сумма по товару - итог за 12 месяцев. Факт верный. Не знаю, как тут скрины приложить.
Необходимо проверить везде формат ячейки - должно стоять "дата".
И в таблицах на обычных листах и в таблице в power query.
[IMG]
[IMG]
Возможно укажете на ошибку, при построении сводной таблицы не удается совместить суммы из 2хтаблиц (Выписка и Остатки) по датам, таблица строит 2 отдельных столбца для каждой даты. Заранее спасибо.
Будет круто если вы на своем портале расскажете нам и покажете побольше примеров задач с использованием Power Pivot. Мне инструмент кажется довольно перспективным, но многие о нем вообще не знают. То же самое и про сервис Power Bi.
Еще я полазила в надстройках, которые предлагает нам Excel, и нашла вот такие: Inquire, MC Power Map. Возможно, они также представляют интерес для аналитиков
Будет круто если вы на своем портале расскажете нам и покажете побольше примеров задач с использованием Power Pivot. Мне инструмент кажется довольно перспективным, но многие о нем вообще не знают. То же самое и про сервис Power Bi.
Еще я полазила в надстройках, которые предлагает нам Excel, и нашла вот такие: Inquire, MC Power Map. Возможно, они также представляют интерес для аналитиков