Страницы: Пред. 1 2
RSS
Для тренда высчитать для каждой строки функцию ЛИНЕЙН в DAX-Excel
 
приложу decompose для period=7 ваших Продаж этой ветки - не Оптимизировала, тест Дикки-Фуллера не делала, но остатки мне не нравятся, и цикличность тоже... после оптимизации график может быть получше  - для Dax это будет, наверно, очень тяжёлая операция
Цитата
Михаил Л написал:
И очень даже работает(в файле)
остатки не видны, чтобы делать валидный вывод...
p.s.
-- как решите делать валидные выводы, пусть эта ветка вам даст пищу для размышления.  (просто не люблю неверные интерпретации и необоснованные выводы, и вам не советую рисовать Тренд и искать Сезонность по параметрам из головы)  -- алагоритмически анализ timeseries вроде здесь, но тоже на англ. и тоже без оптимизации, а ручками искать best parameters - неудобно (не зависимо от языка)
Успехов
Изменено: JeyCi - 07.05.2023 05:41:29
чтобы не гадать на кофейной гуще, кто вам отвечает и после этого не совершать кучу ошибок - обратитесь к собеседнику на ВЫ - ответ на ваш вопрос получите - а остальное вас не касается (п.п.п. на форумах)
 
Цитата
JeyCi написал:
(просто не люблю неверные интерпретации и необоснованные выводы, и вам не советую рисовать Тренд и искать Сезонность по параметрам из головы)
Если честно то я уже изменил свое резюме, убрал все строки, касающиеся прогнозирования. Конечно надеюсь что мое резюме больше не придется применять).
Цитата
JeyCi написал:
Прикрепленные файлы
06.05.jpg  (150.33 КБ)
А в Excel формулами Excel возможно получить эти данные и графики? Интересует Трендовая линия, Линия цикла и линия остатков.
Что такое остатки - даже не понимаю.
 
Цитата
Михаил Л написал:
Что такое остатки
TS-ряд состоит из :
- детерминированный тренд
- стохастический тренд (сезонность и иная цикличность)
- стационарная ошибка (или остатки, или шум, или то, что остаётся после изъятия из TS-ряда тренда и цикличности
и 2 вида моделей: или все эти компоненты складываются (additive model) или все перемножается (multiplicative model)...
соответственно, чтобы выделить эти составляющие надо:
при additive model - отнимать, при multiplicative - делить = чтобы изъять соотв. компоненты, которых кстати может и не быть - поэтому сначала см., что они есть ?... - см. Автокоррелограммы - на выявление значимых частот цикличности и др. паттерны)
т.е. Algo (как изъять):
Python detrended = signal.detrend(df.value.values) ИЛИ вычитать/делить на трендовую составляющую, рассчитанную по вашим параметрам, например MovingAverage  ИЛИ как захочется...
seasonal тоже вычитать/делить в зависимости от типа вашей модели (additive или multiplicative)
... в Excel - всё ручками (выше давала линк на надстройку RealStatistics - там уже есть много полезных функций для анализа временных рядов)
##############
Остатки должны в итоге предпочтительно быть белым шумом (нормально распределены с mean=0 и std=const), но не всегда это бывает - зависит от вашей модели - mean м.б. просто const и std д. б. const в любом случае - чтобы данные считались Стационарными...
(по остаткам выше видно, что при такой декомпозиции на тренд/циклы/шум - остаётся какой-то неучтённый моделью паттерн цикличности - остатки идут волнами, а не норм. распределены с const mean и std)
############## по Декомпозиции:
Цитата
Михаил Л написал:
Интересует Трендовая линия, Линия цикла и линия остатков.
и есть мнение , что есть алгоритмы декомпозиции получше (в tsa - объект STL) (или в prophet), чем классическая декомпозиция, которая в tsa объект seasonal_decompose - ...
ПО КАКОМУ АЛГОРИТМУ ВЫ БУДЕТЕ РАСКЛАДЫВАТЬ РЯД НА КОМПОНЕНТЫ - ВАШ ВЫБОР (обычно в smoother'ах State-Space моделей исп-ют Kalman-Filter) -- всё поддаётся описанию мат. формулами (формализации) и алгоритмами (из линков выше ComputationalStatistics даёт много возможностей для описания нужных алгоритмов)... но я предпочитаю готовые stat. библиотеки в Python (например, реализация SpectralSmoother, который smoothes the timeseries applying a Fourier Transform - в качестве примера алгоритма - стоит ли переводить на DAX?) и адекватную теор. базу по статистике  - избавляют от ручных расчётов (формул) -
- в Excel вроде нет ничего для анализа временных рядов, хоть по статичтике в ПакетеАнализа что-то есть для распределений - ишите Описательная статистика в Excel  -- и какие-то формулы  -- но для ан. временных рядов надо делать самому ...
Изменено: JeyCi - 17.05.2023 07:05:13
чтобы не гадать на кофейной гуще, кто вам отвечает и после этого не совершать кучу ошибок - обратитесь к собеседнику на ВЫ - ответ на ваш вопрос получите - а остальное вас не касается (п.п.п. на форумах)
 
P.S.
ПО созданию модели Прогноза
##############  по Стационарности (т.е. чтобы факторы не коррелировали между собой - важно при лин. регрессии - e.g. AR, исследующая корреляцию ряда с самим собой, т.е. оценивая его подряды с заданным лагом на корреляцию между собой)
изначально надо делать тесты ‘Unit Root Tests’:
или здесь
- Augmented Dickey Fuller test (ADH Test)
- Kwiatkowski-Phillips-Schmidt-Shin – KPSS test (trend stationary)
- Philips Perron test (PP Test)
###
ADF test, where the null hypothesis is the time series possesses a unit root and is non-stationary. So, id the P-Value in ADH test is less than the significance level (0.05), you reject the null- hypothesis
The KPSS test, on the other hand, is used to test for trend stationarity. The null hypothesis and the P-Value interpretation is just the opposite of ADH test.
###
повторюсь, ваши данные нестационарны (к стационарности не приводила) - поэтому дальнейший любой AR анализ бесполезен (пока не приведёте к стационарности - можно брать первые разности - обычно этого достаточно)... и снова тест на стационарность
ИЛИ
Цитата
Another method is to split the series into 2 or more contiguous parts and computing the summary statistics like the mean, variance and the autocorrelation. If the stats are quite different, then the series is not likely to be stationary
############## потом Автокорреляционные факторы (PACF для AR и ACF для MA) м. помочь подобрать d,p,q параметры для AR моделей (не все нужны для всех моделей) -- (но это неудобно делать глазами, поэтому исп. лучше оптимизацию с проверкой по критерию правдоподобия AIC)
P.P.S.
вообще, автокорреляция может встретиться при регрессии любой зависимости, не только dx/dt, но для др случаев она встречается реже (зависит от рассматриваемых факторов-признаков и факторов-результатов) - но её надо принимать во внимание (если она есть) при описании зависимости
Изменено: JeyCi - 07.05.2023 10:27:09
чтобы не гадать на кофейной гуще, кто вам отвечает и после этого не совершать кучу ошибок - обратитесь к собеседнику на ВЫ - ответ на ваш вопрос получите - а остальное вас не касается (п.п.п. на форумах)
 
############# по Прогнозированию временных рядов:
всё что можно посоветовать - это начать изучать тему - прежде чем этот Тренд ложить в основу своих выводов и степени их доверия  ...
например Steps of Building the ARIMA (AR + MovingAverage) model:
Цитата
•Explore dataset
•Check if the dataset is non-stationary
•Apply either differencing or transformation methods to make time-series stationary
•Find the relevant values for p, d, and q.
•Train the model
•Evaluate the model and make predictions
(только на 6м шаге прогноз! )
#############
P.P.P.S.
по степени доверия (вложила файл, по которому можно судить о приемлемости модели) - примерно такой модели по вашим данным я, может, и доверила бы, но выбранные p и q меня смущают (не уверена, что их стоит делать одинаковыми)
... это только пригодность модели, потом делается прогноз (с учётом трендовой составляющей, цикличности и доверительных интервалов, которые характеризуются +/-3sigma для нормально-распределённых данных)...
- и в Остатках не должно быть автокорреляции...
и они должны иметь Гауссовское распределение (в жизни не всегда так бывает)
##############
По алгоритму (см раздел картинки ARIMA Algorithm Flowchart )
или что-нибудь по-новее Singular Spectrum Analysis - т.к. по сути анализ временных рядов и есть спектральный анализ для различных лагов (насколько понимаю) с определением частот, на которых наблюдается повышенная автокорреляция - для последующего её удаления (выделения в трендовую и циклическую составляющую) и финальной оценкой остатков (предпочтительно, гауссовского распределения) --
Цитата
Singular Spectrum Analysis (SSA) is a non-parametric method that can be applied to analyze time series of complex
structure  
-- как только выделите компоненты - нарисовать их на графике не составит труда - в зависимости от выбранной модели: additive или multiplicative (как указала выше: отнимать составляющие части или делить)
Изменено: JeyCi - 09.05.2023 10:00:32
чтобы не гадать на кофейной гуще, кто вам отвечает и после этого не совершать кучу ошибок - обратитесь к собеседнику на ВЫ - ответ на ваш вопрос получите - а остальное вас не касается (п.п.п. на форумах)
 
и да вы правы - в зависимости от выбранной модели - вы можете получить различный Тренд - например, как здесь - убрав seasonal-составляющую (используя SARIMA модель) по сравнению с просто ARIMA --  Slope тренда сразу уменьшается и не выглядит так впечатляюще - поэтому как вы разбросаете ваш ряд на трендовую, цикличную и шумовую составляющую (компоненты) зависит только от ваших предпочтений (?), но лучше если будет зависеть от корректно выполненного анализа автокорреляционных реалий вашего временного ряда
Изменено: JeyCi - 09.05.2023 10:51:56
чтобы не гадать на кофейной гуще, кто вам отвечает и после этого не совершать кучу ошибок - обратитесь к собеседнику на ВЫ - ответ на ваш вопрос получите - а остальное вас не касается (п.п.п. на форумах)
 
Цитата
JeyCi написал:
пусть эта ветка вам даст пищу для размышления
Спасибо!
Сейчас у меня новая работа. Поэтому очень занят и не отвечаю
 
Excel Solver spectrum (Поиск Решения) - или сразу по Timeseries - может стать более подходящим инструментом Excel (эволюционные и генетические алгоритмы для различных [мета]эвристик) - дадут более адаптивные решения для реал данных, поскольку для линейных методов надо сделать очень много apriori предположений... только алгоритм всё равно д.б., желательно, сгенерирован собой... а в Excel, может, ещё и sampler
... Успехов
Изменено: JeyCi - 09.05.2023 19:04:48
чтобы не гадать на кофейной гуще, кто вам отвечает и после этого не совершать кучу ошибок - обратитесь к собеседнику на ВЫ - ответ на ваш вопрос получите - а остальное вас не касается (п.п.п. на форумах)
 
наткнулась на пример на python Time Series Analysis, Regression, and Forecasting - с формулами, понятными для перевода, но без сезонности
чтобы не гадать на кофейной гуще, кто вам отвечает и после этого не совершать кучу ошибок - обратитесь к собеседнику на ВЫ - ответ на ваш вопрос получите - а остальное вас не касается (п.п.п. на форумах)
Страницы: Пред. 1 2
Наверх