Для тренда высчитать для каждой строки функцию ЛИНЕЙН в DAX-Excel

Пользователь

Сообщений: 3399 Регистрация: 27.11.2013

06.05.2023 17:48:32

приложу decompose для period=7 ваших Продаж этой ветки - не Оптимизировала, тест Дикки-Фуллера не делала, но остатки мне не нравятся, и цикличность тоже... после оптимизации график может быть получше - для Dax это будет, наверно, очень тяжёлая операция

Цитата
Михаил Л написал: И очень даже работает(в файле)

остатки не видны, чтобы делать валидный вывод...
p.s.
-- как решите делать валидные выводы, пусть эта ветка вам даст пищу для размышления. (просто не люблю неверные интерпретации и необоснованные выводы, и вам не советую рисовать Тренд и искать Сезонность по параметрам из головы) -- алагоритмически анализ timeseries вроде здесь, но тоже на англ. и тоже без оптимизации, а ручками искать best parameters - неудобно (не зависимо от языка)
Успехов

Прикрепленные файлы

06.05.jpg (150.33 КБ)

Изменено: JeyCi - 07.05.2023 05:41:29

чтобы не гадать на кофейной гуще, кто вам отвечает и после этого не совершать кучу ошибок - обратитесь к собеседнику на ВЫ - ответ на ваш вопрос получите - а остальное вас не касается (п.п.п. на форумах)

Михаил Л

Пользователь

Сообщений: 2882 Регистрация: 19.02.2020

#32

06.05.2023 19:56:57

Цитата
JeyCi написал: (просто не люблю неверные интерпретации и необоснованные выводы, и вам не советую рисовать Тренд и искать Сезонность по параметрам из головы)

Если честно то я уже изменил свое резюме, убрал все строки, касающиеся прогнозирования. Конечно надеюсь что мое резюме больше не придется применять).

Цитата
JeyCi написал: Прикрепленные файлы 06.05.jpg (150.33 КБ)

А в Excel формулами Excel возможно получить эти данные и графики? Интересует Трендовая линия, Линия цикла и линия остатков.
Что такое остатки - даже не понимаю.

НА МЯСО В ПРОФИЛЕ

JeyCi

Пользователь

Сообщений: 3399 Регистрация: 27.11.2013

#33

07.05.2023 10:23:14

Цитата
Михаил Л написал: Что такое остатки

TS-ряд состоит из :
- детерминированный тренд
- стохастический тренд (сезонность и иная цикличность)
- стационарная ошибка (или остатки, или шум, или то, что остаётся после изъятия из TS-ряда тренда и цикличности
и 2 вида моделей: или все эти компоненты складываются (additive model) или все перемножается (multiplicative model)...
соответственно, чтобы выделить эти составляющие надо:
при additive model - отнимать, при multiplicative - делить = чтобы изъять соотв. компоненты, которых кстати может и не быть - поэтому сначала см., что они есть ?... - см. Автокоррелограммы - на выявление значимых частот цикличности и др. паттерны)
т.е. Algo (как изъять):
Python detrended = signal.detrend(df.value.values) ИЛИ вычитать/делить на трендовую составляющую, рассчитанную по вашим параметрам, например MovingAverage ИЛИ как захочется...
seasonal тоже вычитать/делить в зависимости от типа вашей модели (additive или multiplicative)
... в Excel - всё ручками (выше давала линк на надстройку RealStatistics - там уже есть много полезных функций для анализа временных рядов)
##############
Остатки должны в итоге предпочтительно быть белым шумом (нормально распределены с mean=0 и std=const), но не всегда это бывает - зависит от вашей модели - mean м.б. просто const и std д. б. const в любом случае - чтобы данные считались Стационарными...
(по остаткам выше видно, что при такой декомпозиции на тренд/циклы/шум - остаётся какой-то неучтённый моделью паттерн цикличности - остатки идут волнами, а не норм. распределены с const mean и std)
############## по Декомпозиции:

Цитата
Михаил Л написал: Интересует Трендовая линия, Линия цикла и линия остатков.

и есть мнение , что есть алгоритмы декомпозиции получше (в tsa - объект STL) (или в prophet), чем классическая декомпозиция, которая в tsa объект seasonal_decompose - ...
ПО КАКОМУ АЛГОРИТМУ ВЫ БУДЕТЕ РАСКЛАДЫВАТЬ РЯД НА КОМПОНЕНТЫ - ВАШ ВЫБОР (обычно в smoother'ах State-Space моделей исп-ют Kalman-Filter) -- всё поддаётся описанию мат. формулами (формализации) и алгоритмами (из линков выше ComputationalStatistics даёт много возможностей для описания нужных алгоритмов)... но я предпочитаю готовые stat. библиотеки в Python (например, реализация SpectralSmoother, который smoothes the timeseries applying a Fourier Transform - в качестве примера алгоритма - стоит ли переводить на DAX?) и адекватную теор. базу по статистике - избавляют от ручных расчётов (формул) -
- в Excel вроде нет ничего для анализа временных рядов, хоть по статичтике в ПакетеАнализа что-то есть для распределений - ишите Описательная статистика в Excel -- и какие-то формулы -- но для ан. временных рядов надо делать самому ...

Изменено: JeyCi - 17.05.2023 07:05:13

JeyCi

Пользователь

Сообщений: 3399 Регистрация: 27.11.2013

#34

07.05.2023 10:24:55

P.S.
ПО созданию модели Прогноза
############## по Стационарности (т.е. чтобы факторы не коррелировали между собой - важно при лин. регрессии - e.g. AR, исследующая корреляцию ряда с самим собой, т.е. оценивая его подряды с заданным лагом на корреляцию между собой)
изначально надо делать тесты ‘Unit Root Tests’:
или здесь
- Augmented Dickey Fuller test (ADH Test)
- Kwiatkowski-Phillips-Schmidt-Shin – KPSS test (trend stationary)
- Philips Perron test (PP Test)
###
ADF test, where the null hypothesis is the time series possesses a unit root and is non-stationary. So, id the P-Value in ADH test is less than the significance level (0.05), you reject the null- hypothesis
The KPSS test, on the other hand, is used to test for trend stationarity. The null hypothesis and the P-Value interpretation is just the opposite of ADH test.
###
повторюсь, ваши данные нестационарны (к стационарности не приводила) - поэтому дальнейший любой AR анализ бесполезен (пока не приведёте к стационарности - можно брать первые разности - обычно этого достаточно)... и снова тест на стационарность
ИЛИ

Цитата
Another method is to split the series into 2 or more contiguous parts and computing the summary statistics like the mean, variance and the autocorrelation. If the stats are quite different, then the series is not likely to be stationary

############## потом Автокорреляционные факторы (PACF для AR и ACF для MA) м. помочь подобрать d,p,q параметры для AR моделей (не все нужны для всех моделей) -- (но это неудобно делать глазами, поэтому исп. лучше оптимизацию с проверкой по критерию правдоподобия AIC)
P.P.S.
вообще, автокорреляция может встретиться при регрессии любой зависимости, не только dx/dt, но для др случаев она встречается реже (зависит от рассматриваемых факторов-признаков и факторов-результатов) - но её надо принимать во внимание (если она есть) при описании зависимости

Изменено: JeyCi - 07.05.2023 10:27:09

JeyCi

Пользователь

Сообщений: 3399 Регистрация: 27.11.2013

#35

07.05.2023 10:27:35

############# по Прогнозированию временных рядов:
всё что можно посоветовать - это начать изучать тему - прежде чем этот Тренд ложить в основу своих выводов и степени их доверия ...
например Steps of Building the ARIMA (AR + MovingAverage) model:

Цитата
•Explore dataset •Check if the dataset is non-stationary •Apply either differencing or transformation methods to make time-series stationary •Find the relevant values for p, d, and q. •Train the model •Evaluate the model and make predictions

(только на 6м шаге прогноз! )
#############
P.P.P.S.
по степени доверия (вложила файл, по которому можно судить о приемлемости модели) - примерно такой модели по вашим данным я, может, и доверила бы, но выбранные p и q меня смущают (не уверена, что их стоит делать одинаковыми)
... это только пригодность модели, потом делается прогноз (с учётом трендовой составляющей, цикличности и доверительных интервалов, которые характеризуются +/-3sigma для нормально-распределённых данных)...
- и в Остатках не должно быть автокорреляции...
и они должны иметь Гауссовское распределение (в жизни не всегда так бывает)
##############
По алгоритму (см раздел картинки ARIMA Algorithm Flowchart )
или что-нибудь по-новее Singular Spectrum Analysis - т.к. по сути анализ временных рядов и есть спектральный анализ для различных лагов (насколько понимаю) с определением частот, на которых наблюдается повышенная автокорреляция - для последующего её удаления (выделения в трендовую и циклическую составляющую) и финальной оценкой остатков (предпочтительно, гауссовского распределения) --

Цитата
Singular Spectrum Analysis (SSA) is a non-parametric method that can be applied to analyze time series of complex structure

-- как только выделите компоненты - нарисовать их на графике не составит труда - в зависимости от выбранной модели: additive или multiplicative (как указала выше: отнимать составляющие части или делить)

Прикрепленные файлы

07.05 SARIMAX (1,5,5) Rresult.jpg (114.95 КБ)

Изменено: JeyCi - 09.05.2023 10:00:32

JeyCi

Пользователь

Сообщений: 3399 Регистрация: 27.11.2013

#36

09.05.2023 10:08:05

и да вы правы - в зависимости от выбранной модели - вы можете получить различный Тренд - например, как здесь - убрав seasonal-составляющую (используя SARIMA модель) по сравнению с просто ARIMA -- Slope тренда сразу уменьшается и не выглядит так впечатляюще - поэтому как вы разбросаете ваш ряд на трендовую, цикличную и шумовую составляющую (компоненты) зависит только от ваших предпочтений (?), но лучше если будет зависеть от корректно выполненного анализа автокорреляционных реалий вашего временного ряда

Изменено: JeyCi - 09.05.2023 10:51:56

Михаил Л

Пользователь

Сообщений: 2882 Регистрация: 19.02.2020

#37

09.05.2023 13:09:43

Цитата
JeyCi написал: пусть эта ветка вам даст пищу для размышления

Спасибо!
Сейчас у меня новая работа. Поэтому очень занят и не отвечаю

НА МЯСО В ПРОФИЛЕ

JeyCi

Пользователь

Сообщений: 3399 Регистрация: 27.11.2013

#38

09.05.2023 15:48:00

Excel Solver spectrum (Поиск Решения) - или сразу по Timeseries - может стать более подходящим инструментом Excel (эволюционные и генетические алгоритмы для различных [мета]эвристик) - дадут более адаптивные решения для реал данных, поскольку для линейных методов надо сделать очень много apriori предположений... только алгоритм всё равно д.б., желательно, сгенерирован собой... а в Excel, может, ещё и sampler
... Успехов

Изменено: JeyCi - 09.05.2023 19:04:48

JeyCi Пользователь Сообщений: 3399 Регистрация: 27.11.2013	#39 05.04.2024 15:26:17 наткнулась на пример на python Time Series Analysis, Regression, and Forecasting - с формулами, понятными для перевода, но без сезонности чтобы не гадать на кофейной гуще, кто вам отвечает и после этого не совершать кучу ошибок - обратитесь к собеседнику на ВЫ - ответ на ваш вопрос получите - а остальное вас не касается (п.п.п. на форумах)