Материалы ИЦ «ГЕВИССТА»

Материалы ИЦ «ГЕВИССТА» 

DS/ML/AI

238subscribers

83posts

Содержание поста "Руководство по оценке качества прогнозирования временных рядов для специалистов по data science: распространенные подводные камни и лучшие практики (86-стр. pdf)"

Аннотация 3
1. Введение 3
2. Формулировка проблемы и терминология 7
3. Актуальность и распространенные подводные камни 11
3.1. Характеристики временных рядов 11
3.2. Базовые модели для оценки качества прогноза 13
3.3. Графики прогнозов 16
3.4. Утечка данных при оценке качества прогнозов 19
4. Обзор процесса оценки прогноза 20
5. Разбиение данных 21
5.1. Фиксированная начальная точка прогнозирования 21
5.2. Скользящая начальная точка, перекрестная проверка временных рядов и предварительная оценка качества 22
5.3. (Рандомизированная) перекрестная проверка 25
5.4. Разбиение нестационарных данных 28
5.5. Другие методы выбора модели 30
5.6. Выводы и рекомендации по разбиению данных и выбору модели 31
6. Метрики для оценки качества прогнозов 31
6.1. Классификация метрик 36
6.1.1. Метрики, зависящие от масштаба 36
6.1.2. Метрики, основанные на процентных ошибках 40
6.1.3. Метрики, основанные на относительных ошибках 46
6.1.4. Относительные метрики 48
6.1.5. Метрики, основанные на масштабированных ошибках 50
6.1.6. Метрики, основанные на рангах и процентах 52
6.1.7. Метрики, основанные на преобразованиях 53
6.1.8. Другие метрики в литературе 54
6.2. Проблемы, связанные с метриками, и рекомендации по их устранению 57
6.2.1. Счетные данные значительно выше нуля со стационарностью 61
6.2.2. Сезонность 62
6.2.3. Тренды 63
6.2.4. Единичные корни 65
6.2.5. Гетероскедастичность 66
6.2.6. Структурные разрывы (со сдвигами уровня) 66
6.2.7. Прерывистые ряды 69
6.2.8. Выбросы 73
7. Тесты на статистическую значимость 76
8. Выводы 79
Библиография 82
Go up