EN
Материалы ИЦ «ГЕВИССТА»
Материалы ИЦ «ГЕВИССТА»
216 subscribers

Содержание поста-книги "Анализ причинно-следственных связей для храбрых и честных" (перевод Causal Inference for The Brave and True, 513-стр. pdf, 26 глав, 26 Jupyter-тетрадок, 3 скрипта, файлы данных)"

ЧАСТЬ I. ЯНЬ          7
ГЛАВА 1. ВВЕДЕНИЕ В ПРИЧИННОСТЬ (КАУЗАЛЬНОСТЬ)         7
Зачем беспокоиться?           7
Наука о данных уже не та, что была раньше (или наконец-то
стала таковой) 7
Отвечая на вопросы другого рода  9
Когда ассоциация ЯВЛЯЕТСЯ причинно-следственной связью          11
Смещение      16
Ключевые идеи        24
ГЛАВА 2. РАНДОМИЗИРОВАННЫЕ ЭКСПЕРИМЕНТЫ      25
Золотой стандарт     25
В школе «на удаленке»       27
Идеальный эксперимент     30
Механизм присваивания     31
Ключевые идеи        32
ГЛАВА 3. ОБЗОР СТАТИСТИК: САМОЕ ОПАСНОЕ УРАВНЕНИЕ            33
Стандартная ошибка наших оценок          37
Доверительные интервалы  38
Тестирование гипотез          44
P-значения     48
Ключевые идеи        51
ГЛАВА 4. ГРАФОВЫЕ ПРИЧИННО-СЛЕДСТВЕННЫЕ (КАУЗАЛЬНЫЕ) МОДЕЛИ       53
Рассуждая о причинности   53
Ускоренный курс по графовым моделям  55
Смещение, вызванное спутывающим фактором (ошибка спутывания,
confounding bias)     62
Смещение из-за отбора (ошибка отбора, selection bias)  65
Ключевые идеи        70
ГЛАВА 5. ПОРАЗИТЕЛЬНАЯ ЭФФЕКТИВНОСТЬ ЛИНЕЙНОЙ РЕГРЕССИИ      71
Все, что вам нужно, – это регрессия         71
Теоретические аспекты регрессии 74
Регрессия для неслучайных данных          76
Смещение, вызванное опущенной переменной или спутывающим
фактором (omitted variable bias или confounding bias)         81
Ключевые идеи        86
ГЛАВА 6. РЕГРЕССИЯ, ОБУЧЕННАЯ НА СГРУППИРОВАННЫХ ДАННЫХ,
И  РЕГРЕССИЯ С ДАММИ-ПЕРЕМЕННЫМИ      87
Регрессия, обученная на сгруппированных данных        87
Регрессия c дамми-переменными  93
Ключевые идеи        101
ГЛАВА 7. ПОМИМО СПУТЫВАЮЩИХ ПЕРЕМЕННЫХ     102
«Хорошие» контрольные переменные      102
Преимущественно вредные контрольные переменные  108
Плохие контрольные переменные – смещение из-за отбора      114
Плохой COP-эффект            119
Ключевые идеи        125
ГЛАВА 8. ИНСТРУМЕНТАЛЬНЫЕ ПЕРЕМЕННЫЕ   126
Обход смещения, возникшего из-за опущенной переменной    126
Квартал рождения человека и влияние образования на
заработную плату     129
Коэффициент регрессии 1-го этапа           132
Коэффициент короткой регрессии 135
Инструментальные переменные, созданные вручную    136
Несколько инструментальных переменных         138
Ключевые идеи        144
ГЛАВА 9. НЕСОБЛЮДЕНИЕ ТРЕБОВАНИЙ И LATE            145
Погружаемся в разнородный мир  145
Локальный средний эффект воздействия (local average
treatment effect – LATE)       151
Влияние на вовлеченность  154
Ключевые идеи        157
ГЛАВА 10. МАТЧИНГ (СОПОСТАВЛЕНИЕ ОБЪЕКТОВ ТЕСТОВОЙ И
КОНТРОЛЬНОЙ ГРУПП)     158
Что же в конце концов делает регрессия? 158
Субклассификационная оценка     161
Матчинг-оценка       163
Смещенность матчинг-оценки       170
Проклятие размерности       174
Ключевые идеи        176
ГЛАВА 11. ОЦЕНКА СКЛОННОСТИ (PROPENSITY SCORE)          177
Психология роста     177
Оценка склонности  181
Взвешивание по склонности          183
Прогнозирование оценки склонности       186
Стандартная ошибка            190
Распространенные проблемы с оценкой склонности      192
Сопоставление по оценке склонности (propensity score
matching)        196
Ключевые идеи        197
ГЛАВА 12. ПОЛУЧЕНИЕ ОЦЕНОК С ДВОЙНОЙ РОБАСТНОСТЬЮ         199
Не кладите все яйца в одну корзину         199
Получение оценок с двойной робастностью        201
Ключевые идеи        207
ГЛАВА 13. МЕТОД РАЗНОСТИ РАЗНОСТЕЙ  208
Три рекламных щита на юге Бразилии     208
Метод разности разностей (difference in differences – DiD)       210
Непараллельные тренды     216
Ключевые идеи        218
ГЛАВА 14. ПАНЕЛЬНЫЕ ДАННЫЕ И ФИКСИРОВАННЫЕ ЭФФЕКТЫ   219
Параллельные тренды         220
Контролируйте то, что вы не видите         222
Фиксированные эффекты    225
Визуализация фиксированных эффектов 231
Фиксированные эффекты для периодов времени            234
Когда панельные данные вам не помогут 234
Ключевые идеи        236
ГЛАВА 15. СИНТЕТИЧЕСКИЙ КОНТРОЛЬ     237
Один удивительный математический трюк, позволяющий узнать
то, что невозможно узнать        237
У нас есть время       240
Синтетический контроль в виде линейной регрессии    244
Не экстраполируйте 247
Делаем вывод           252
Ключевые идеи        258
ГЛАВА 16. РАЗРЫВНОЙ РЕГРЕССИОННЫЙ ДИЗАЙН         260
Алкоголь убивает вас?        261
Оценка RDD  264
Взвешивание с помощью ядерной функции        268
Эффект овчины и нечеткий RDD   271
Тест Маккрари         275
Ключевые идеи        279
ЧАСТЬ II. ИНЬ         280
ГЛАВА 17. КУРС ПО ПРОГНОЗНЫМ МОДЕЛЯМ      280
Машинное обучение в промышленности 281
Ускоренный курс по машинному обучению        287
Перекрестная проверка       290
Прогнозы и политики          292
Политика на основе одного признака       292
Политика на основе модели машинного обучения         297
Тонкая настройка политики           302
Ключевые идеи        305
ГЛАВА 18. ГЕТЕРОГЕННЫЕ ЭФФЕКТЫ ВОЗДЕЙСТВИЯ И ПЕРСОНАЛИЗАЦИЯ        307
От прогнозов к анализу причинно-следственных связей           307
От ATE к CATE        309
Прогнозирование чувствительности         313
Ключевые идеи        322
ГЛАВА 19. ОЦЕНКА КАЧЕСТВА ПРИЧИННО-СЛЕДСТВЕННЫХ (КАУЗАЛЬНЫХ)
МОДЕЛЕЙ        324
Чувствительность по диапазонам прогнозов модели      328
Кривая накопленной чувствительности (cumulative sensitivity
curve)  332
Кривая накопленного выигрыша (cumulative gain curve)           336
Принимаем дисперсию во внимание         339
Ключевые идеи        342
Дополнительное чтение      343
ГЛАВА 20. МОДЕЛИ «ПОДКЛЮЧИ-И-ПОЛЬЗУЙСЯ»           345
Формулировка проблемы    345
Преобразование зависимой переменной  347
Случай непрерывного воздействия           352
Нелинейные эффекты воздействия           359
Ключевые идеи        360
Дополнительное чтение      361
ГЛАВА 21. МЕТАМОДЕЛИ          363
S-модель        364
T-модель        368
X-модель       371
Ключевые идеи        376
Дополнительное чтение      376
ГЛАВА 22. НЕСМЕЩЕННОЕ/ОРТОГОНАЛЬНОЕ МАШИННОЕ ОБУЧЕНИЕ      377
Машинное обучение для мешающих параметров           379
Теорема Фриша-Во-Ловелла          380
Теорема Фриша-Во-Ловелла на стероидах          383
Оценивание CATE с помощью двойного машинного обучения           388
Непараметрическое двойное/несмещенное машинное обучение          390
Что такое непараметрическая оценка?      393
Ненаучное двойное/несмещенное машинное обучение 398
Возможно, потребуется больше эконометрики!  405
Ключевые идеи        407
Дополнительное чтение      408
ГЛАВА 23. ПРОБЛЕМЫ, СВЯЗАННЫЕ С ГЕТЕРОГЕННОСТЬЮ ЭФФЕКТА И
НЕЛИНЕЙНОСТЬЮ 409
Эффекты воздействия для бинарного результата            409
Симулируем данные 411
Непрерывное воздействие и нелинейность          420
Ключевые идеи        425
Дополнительное чтение      425
ГЛАВА 24. САГА О РАЗНОСТИ РАЗНОСТЕЙ 427
1) Рождение: многообещающие панельные данные       428
2) Смерть: проблемы из-за гетерогенности эффекта      437
3) Просветление: гибкая функциональная форма           450
Ключевые идеи        458
Дополнительное чтение      458
ГЛАВА 25. СИНТЕТИЧЕСКАЯ РАЗНОСТЬ РАЗНОСТЕЙ      461
Ревизия метода разности разностей          465
Ревизия метода синтетического контроля 469
Синтетическая разность разностей           472
Временная гетерогенность эффекта и постепенная адаптация  484
Оценивание плацебо-дисперсии    491
Ключевые идеи        496
Дополнительное чтение      497
ПРИЛОЖЕНИЕ 1. УСТРАНЕНИЕ СМЕЩЕНИЯ С ПОМОЩЬЮ ОРТОГОНАЛИЗАЦИИ 498
Перерождение линейной регрессии          498
Интуиция, лежащая в основе ортогонализации   500
Ортогонализация с помощью машинного обучения       509
Ключевые идеи        512
Дополнительное чтение      513

Subscription levels

$
No subscription levels
Go up