Топ вопросов с Data Science собеседований | Часть 2
Знание classic ML - база любых собеседований на все грейды в DS!
Таймкоды:
0:00 Что вас ждет?
0:13 Приветствие
1:01 Как выглядит алгоритм построения решающего дерева?
1:40 Какие бывают критерии сплиттинга?
3:44 В чем разница между классификацией и регрессией в деревьях?
4:24 В чем плюсы и минусы деревьев?
6:13 Почему дерево легко переобучается?
6:28 Как глубина влияет на дерево?
6:51 Как можно регуляризировать решающее дерево?
7:33 Почему деревья не чувствительны к масштабированию признаков?
8:04 Как оценить важность признаков по дереву?
8:21 Что такое бэггинг?
8:43 Что такое случайные лес? Где там случайность?
9:17 Что такое бустинг?
9:29 Что такое стекинг?
9:46 Что такое bias-variance decomposition? Какой тип ансамблирования, что оптимизирует?
11:47 Что такое градиентный бустинг? Почему называется градиентным? Где там градиент?
12:54 Почему нельзя в качестве базовых алгоритмов использовать линейные модели, например?
13:19 Где деревья глубже бустинг/бэггинг?
13:49 Что если сделать первое дерево очень глубоким в бэггинге/бустинге?
14:28 Что если убрать первое дерево в бэггинге/устинге?
14:50 Можно ли переобучить бустинг? а бэггинг?
15:28 Отличия LightGBM, XGBoost, CatBoost?
16:28 Где конспект по всем темам
16:40 Что такое метрические модели?
17:15 Как работает k-nn? Какое у него время обучения и предсказания?
18:23 Как можно считать расстояние?
18:44 Какие есть плюсы и минусы метрических моделей и knn в особенности?
19:27 Как масштабирование признаков влияет на K-NN? Почему?
19:48 Как ускорить K-NN для большого датасета?
20:17 Где можно применять метрические модели?
20:57 Самый эффективный способ зайти в МЛ
21:41 Что такое кластеризация? Примеры задач, которые решаются с помощью кластеризации?
21:58 Объясните различия между soft и hard кластеризацией.
22:19 Как работает метод К-средних?
23:30 Какие есть проблемы с начальной инициализацией центров? Как можно улучшить ее?
24:04 Как можно ускорить алгоритм к-средних?
24:35 Что такое иерархическая агломеративная кластеризация, чем отличается от дивизионных алгоритмов?
25:04 Как можно посчитать расстояние между кластерами в иерархической кластеризации?
25:30 Что такое дендрограмма?
25:57 Какие есть критерии остановки работы иерархической кластеризации?
26:26 Как работает алгоритм DBSCAN?
28:24 Какие метрики существуют для оценки качества кластеризации?
29:51 Как выбрать оптимальное количество кластеров?
30:22 Финальное слово
Конспект с разобранными вопросами: https://t.me/rockaux
Разборы реальных собеседований: https://boosty.to/lokis_alexandr
Менторство "оффер под ключ": https://sites.google.com/view/lokismlmentor
личный тг: https://t.me/abletobetable
In bundle
classic ml
free
мок собес
machine learning