Страницы: 1
RSS
Подготовка данных для статистики
 
Добрый день, у меня чисто теоретический вопрос.

У меня есть 60 колонок с данными. и 4 ключа по которым эти данные группируются:
Ключ 1 : номер клиента, номер продавца, месяц (пример данных с этим ключом: "Кол-во транзакций с клиентом в заданном месяце")
Ключ 2 : сектор, к которому принадлежит клиент (пример данных с этим ключом: "Кол-во врачей в секторе")
Ключ 3 : сектор и месяц (пример данных с этим ключом: "Доля рынка в этом секторе в заданный месяц")
Ключ 4 : сектор, месяц, номер продавца (пример данных с этим ключом: "Количество транзакций с врачами этим продавцом в этом секторе в заданный месяц")

Эту таблицу я собираюсь закинуть в R в PowerBi с идеей сделать мультифакторный анализ и посмотреть есть ли корреляция, например, между долей рынка и количеством транзакций с врачами.

Мой вопрос - можно ли так делать - кидать в одну таблицу данные сгруппированные по разным ключам, и можно ли затем в powerBi фильтровать данные без ущерба для верности расчетов- например, выбирая определенный сектор или определенную специализацию клиента?

Также буду безмерно благодарен если сможете посоветовать мне тюториал или курс по подготовке данных к статистической обработке, ну или книгу на худой конец.

Спасибо.
 
А что мешает делать группировку через summarize?
 
Цитата
badzen написал: Подготовка данных для статистики
Это вообще о чём? Что можно понять из такого названия?
Страницы: 1
Наверх