Содержание поста-книги "Анализ причинно-следственных связей для храбрых и честных" (перевод Causal Inference for The Brave and True, 513-стр. pdf, 26 глав, 26 Jupyter-тетрадок, 3 скрипта, файлы данных)"
ЧАСТЬ I. ЯНЬ 7
ГЛАВА 1. ВВЕДЕНИЕ В ПРИЧИННОСТЬ (КАУЗАЛЬНОСТЬ) 7
Зачем беспокоиться? 7
Наука о данных уже не та, что была раньше (или наконец-то
стала таковой) 7
стала таковой) 7
Отвечая на вопросы другого рода 9
Когда ассоциация ЯВЛЯЕТСЯ причинно-следственной связью 11
Смещение 16
Ключевые идеи 24
ГЛАВА 2. РАНДОМИЗИРОВАННЫЕ ЭКСПЕРИМЕНТЫ 25
Золотой стандарт 25
В школе «на удаленке» 27
Идеальный эксперимент 30
Механизм присваивания 31
Ключевые идеи 32
ГЛАВА 3. ОБЗОР СТАТИСТИК: САМОЕ ОПАСНОЕ УРАВНЕНИЕ 33
Стандартная ошибка наших оценок 37
Доверительные интервалы 38
Тестирование гипотез 44
P-значения 48
Ключевые идеи 51
ГЛАВА 4. ГРАФОВЫЕ ПРИЧИННО-СЛЕДСТВЕННЫЕ (КАУЗАЛЬНЫЕ) МОДЕЛИ 53
Рассуждая о причинности 53
Ускоренный курс по графовым моделям 55
Смещение, вызванное спутывающим фактором (ошибка спутывания,
confounding bias) 62
confounding bias) 62
Смещение из-за отбора (ошибка отбора, selection bias) 65
Ключевые идеи 70
ГЛАВА 5. ПОРАЗИТЕЛЬНАЯ ЭФФЕКТИВНОСТЬ ЛИНЕЙНОЙ РЕГРЕССИИ 71
Все, что вам нужно, – это регрессия 71
Теоретические аспекты регрессии 74
Регрессия для неслучайных данных 76
Смещение, вызванное опущенной переменной или спутывающим
фактором (omitted variable bias или confounding bias) 81
фактором (omitted variable bias или confounding bias) 81
Ключевые идеи 86
ГЛАВА 6. РЕГРЕССИЯ, ОБУЧЕННАЯ НА СГРУППИРОВАННЫХ ДАННЫХ,
И РЕГРЕССИЯ С ДАММИ-ПЕРЕМЕННЫМИ 87
И РЕГРЕССИЯ С ДАММИ-ПЕРЕМЕННЫМИ 87
Регрессия, обученная на сгруппированных данных 87
Регрессия c дамми-переменными 93
Ключевые идеи 101
ГЛАВА 7. ПОМИМО СПУТЫВАЮЩИХ ПЕРЕМЕННЫХ 102
«Хорошие» контрольные переменные 102
Преимущественно вредные контрольные переменные 108
Плохие контрольные переменные – смещение из-за отбора 114
Плохой COP-эффект 119
Ключевые идеи 125
ГЛАВА 8. ИНСТРУМЕНТАЛЬНЫЕ ПЕРЕМЕННЫЕ 126
Обход смещения, возникшего из-за опущенной переменной 126
Квартал рождения человека и влияние образования на
заработную плату 129
заработную плату 129
Коэффициент регрессии 1-го этапа 132
Коэффициент короткой регрессии 135
Инструментальные переменные, созданные вручную 136
Несколько инструментальных переменных 138
Ключевые идеи 144
ГЛАВА 9. НЕСОБЛЮДЕНИЕ ТРЕБОВАНИЙ И LATE 145
Погружаемся в разнородный мир 145
Локальный средний эффект воздействия (local average
treatment effect – LATE) 151
treatment effect – LATE) 151
Влияние на вовлеченность 154
Ключевые идеи 157
ГЛАВА 10. МАТЧИНГ (СОПОСТАВЛЕНИЕ ОБЪЕКТОВ ТЕСТОВОЙ И
КОНТРОЛЬНОЙ ГРУПП) 158
КОНТРОЛЬНОЙ ГРУПП) 158
Что же в конце концов делает регрессия? 158
Субклассификационная оценка 161
Матчинг-оценка 163
Смещенность матчинг-оценки 170
Проклятие размерности 174
Ключевые идеи 176
ГЛАВА 11. ОЦЕНКА СКЛОННОСТИ (PROPENSITY SCORE) 177
Психология роста 177
Оценка склонности 181
Взвешивание по склонности 183
Прогнозирование оценки склонности 186
Стандартная ошибка 190
Распространенные проблемы с оценкой склонности 192
Сопоставление по оценке склонности (propensity score
matching) 196
matching) 196
Ключевые идеи 197
ГЛАВА 12. ПОЛУЧЕНИЕ ОЦЕНОК С ДВОЙНОЙ РОБАСТНОСТЬЮ 199
Не кладите все яйца в одну корзину 199
Получение оценок с двойной робастностью 201
Ключевые идеи 207
ГЛАВА 13. МЕТОД РАЗНОСТИ РАЗНОСТЕЙ 208
Три рекламных щита на юге Бразилии 208
Метод разности разностей (difference in differences – DiD) 210
Непараллельные тренды 216
Ключевые идеи 218
ГЛАВА 14. ПАНЕЛЬНЫЕ ДАННЫЕ И ФИКСИРОВАННЫЕ ЭФФЕКТЫ 219
Параллельные тренды 220
Контролируйте то, что вы не видите 222
Фиксированные эффекты 225
Визуализация фиксированных эффектов 231
Фиксированные эффекты для периодов времени 234
Когда панельные данные вам не помогут 234
Ключевые идеи 236
ГЛАВА 15. СИНТЕТИЧЕСКИЙ КОНТРОЛЬ 237
Один удивительный математический трюк, позволяющий узнать
то, что невозможно узнать 237
то, что невозможно узнать 237
У нас есть время 240
Синтетический контроль в виде линейной регрессии 244
Не экстраполируйте 247
Делаем вывод 252
Ключевые идеи 258
ГЛАВА 16. РАЗРЫВНОЙ РЕГРЕССИОННЫЙ ДИЗАЙН 260
Алкоголь убивает вас? 261
Оценка RDD 264
Взвешивание с помощью ядерной функции 268
Эффект овчины и нечеткий RDD 271
Тест Маккрари 275
Ключевые идеи 279
ЧАСТЬ II. ИНЬ 280
ГЛАВА 17. КУРС ПО ПРОГНОЗНЫМ МОДЕЛЯМ 280
Машинное обучение в промышленности 281
Ускоренный курс по машинному обучению 287
Перекрестная проверка 290
Прогнозы и политики 292
Политика на основе одного признака 292
Политика на основе модели машинного обучения 297
Тонкая настройка политики 302
Ключевые идеи 305
ГЛАВА 18. ГЕТЕРОГЕННЫЕ ЭФФЕКТЫ ВОЗДЕЙСТВИЯ И ПЕРСОНАЛИЗАЦИЯ 307
От прогнозов к анализу причинно-следственных связей 307
От ATE к CATE 309
Прогнозирование чувствительности 313
Ключевые идеи 322
ГЛАВА 19. ОЦЕНКА КАЧЕСТВА ПРИЧИННО-СЛЕДСТВЕННЫХ (КАУЗАЛЬНЫХ)
МОДЕЛЕЙ 324
МОДЕЛЕЙ 324
Чувствительность по диапазонам прогнозов модели 328
Кривая накопленной чувствительности (cumulative sensitivity
curve) 332
curve) 332
Кривая накопленного выигрыша (cumulative gain curve) 336
Принимаем дисперсию во внимание 339
Ключевые идеи 342
Дополнительное чтение 343
ГЛАВА 20. МОДЕЛИ «ПОДКЛЮЧИ-И-ПОЛЬЗУЙСЯ» 345
Формулировка проблемы 345
Преобразование зависимой переменной 347
Случай непрерывного воздействия 352
Нелинейные эффекты воздействия 359
Ключевые идеи 360
Дополнительное чтение 361
ГЛАВА 21. МЕТАМОДЕЛИ 363
S-модель 364
T-модель 368
X-модель 371
Ключевые идеи 376
Дополнительное чтение 376
ГЛАВА 22. НЕСМЕЩЕННОЕ/ОРТОГОНАЛЬНОЕ МАШИННОЕ ОБУЧЕНИЕ 377
Машинное обучение для мешающих параметров 379
Теорема Фриша-Во-Ловелла 380
Теорема Фриша-Во-Ловелла на стероидах 383
Оценивание CATE с помощью двойного машинного обучения 388
Непараметрическое двойное/несмещенное машинное обучение 390
Что такое непараметрическая оценка? 393
Ненаучное двойное/несмещенное машинное обучение 398
Возможно, потребуется больше эконометрики! 405
Ключевые идеи 407
Дополнительное чтение 408
ГЛАВА 23. ПРОБЛЕМЫ, СВЯЗАННЫЕ С ГЕТЕРОГЕННОСТЬЮ ЭФФЕКТА И
НЕЛИНЕЙНОСТЬЮ 409
НЕЛИНЕЙНОСТЬЮ 409
Эффекты воздействия для бинарного результата 409
Симулируем данные 411
Непрерывное воздействие и нелинейность 420
Ключевые идеи 425
Дополнительное чтение 425
ГЛАВА 24. САГА О РАЗНОСТИ РАЗНОСТЕЙ 427
1) Рождение: многообещающие панельные данные 428
2) Смерть: проблемы из-за гетерогенности эффекта 437
3) Просветление: гибкая функциональная форма 450
Ключевые идеи 458
Дополнительное чтение 458
ГЛАВА 25. СИНТЕТИЧЕСКАЯ РАЗНОСТЬ РАЗНОСТЕЙ 461
Ревизия метода разности разностей 465
Ревизия метода синтетического контроля 469
Синтетическая разность разностей 472
Временная гетерогенность эффекта и постепенная адаптация 484
Оценивание плацебо-дисперсии 491
Ключевые идеи 496
Дополнительное чтение 497
ПРИЛОЖЕНИЕ 1. УСТРАНЕНИЕ СМЕЩЕНИЯ С ПОМОЩЬЮ ОРТОГОНАЛИЗАЦИИ 498
Перерождение линейной регрессии 498
Интуиция, лежащая в основе ортогонализации 500
Ортогонализация с помощью машинного обучения 509
Ключевые идеи 512
Дополнительное чтение 513
causal_inference
пост_книга_"causal_inference"