Анализ временных рядов — различия между версиями
Строка 8: | Строка 8: | ||
Из-за временных зависимостей данных временных рядов, мы не можем пользоваться обычными способами валидации. Чтобы избежать смещения оценки мы должны удостовериться, что обучающие наборы данных содержат только наблюдения, которые произошли до событий из валидирующий наборов. | Из-за временных зависимостей данных временных рядов, мы не можем пользоваться обычными способами валидации. Чтобы избежать смещения оценки мы должны удостовериться, что обучающие наборы данных содержат только наблюдения, которые произошли до событий из валидирующий наборов. | ||
− | Возможным способом преодоления данной проблемы будет | + | Возможным способом преодоления данной проблемы будет использование скользящего окна, как описано здесь [https://robjhyndman.com/hyndsight/tscv/]. Эта процедура называется кросс-валидацией временного ряда и может быть вкратце описано следующей картинкой, в которой синие точки обозначают тренировочный набор данных, а красные соответствующие валидационные наборы данных. |
+ | [[Файл:https://miro.medium.com/max/4800/1*WhbBO3X-HHLWMiVWSjHWVA.png]] |
Версия 11:13, 11 января 2021
Временные ряды это актуальный инструмент применимые во множестве решений, от предсказания цен на акции, прогнозов погоды, планирования бизнеса, до распределения ресурсов. Несмотря на то, что прогнозирование может быть сведено к построению контролируемой регрессии, существуют особенноссти, связанные с временным характером наблюдений, которые необходимо учитывать, используя специальные инструменты.
Временной ряд
Обычно временной ряд представляется как стохастический процесс Y(t), то есть ряд случайных переменных. В момент предсказания мы находимся в моменте t и нужно предположить значение Y(t+b), использую только информацию, доступную в момент t.
Как валидировать и тестировать модель временного ряда?
Из-за временных зависимостей данных временных рядов, мы не можем пользоваться обычными способами валидации. Чтобы избежать смещения оценки мы должны удостовериться, что обучающие наборы данных содержат только наблюдения, которые произошли до событий из валидирующий наборов.
Возможным способом преодоления данной проблемы будет использование скользящего окна, как описано здесь [1]. Эта процедура называется кросс-валидацией временного ряда и может быть вкратце описано следующей картинкой, в которой синие точки обозначают тренировочный набор данных, а красные соответствующие валидационные наборы данных. Файл:Https://miro.medium.com/max/4800/1*WhbBO3X-HHLWMiVWSjHWVA.png