Александр Локис

Александр Локис 

ML engineer and mentor

100subscribers

31posts

Showcase

24
goals2
36 of 50 paid subscribers
Делаю большой разбор практической задачи
$0 of $284 raised
На аренду студии для записи интервью

Топ вопросов с Data Science собеседований | Часть 2

Знание classic ML - база любых собеседований на все грейды в DS!
Таймкоды:
0:00 Что вас ждет?
0:13 Приветствие
1:01 Как выглядит алгоритм построения решающего дерева?
1:40 Какие бывают критерии сплиттинга?
3:44 В чем разница между классификацией и регрессией в деревьях?
4:24 В чем плюсы и минусы деревьев?
6:13 Почему дерево легко переобучается?
6:28 Как глубина влияет на дерево?
6:51 Как можно регуляризировать решающее дерево?
7:33 Почему деревья не чувствительны к масштабированию признаков?
8:04 Как оценить важность признаков по дереву?
8:21 Что такое бэггинг?
8:43 Что такое случайные лес? Где там случайность?
9:17 Что такое бустинг?
9:29 Что такое стекинг?
9:46 Что такое bias-variance decomposition? Какой тип ансамблирования, что оптимизирует?
11:47 Что такое градиентный бустинг? Почему называется градиентным? Где там градиент?
12:54 Почему нельзя в качестве базовых алгоритмов использовать линейные модели, например?
13:19 Где деревья глубже бустинг/бэггинг?
13:49 Что если сделать первое дерево очень глубоким в бэггинге/бустинге?
14:28 Что если убрать первое дерево в бэггинге/устинге?
14:50 Можно ли переобучить бустинг? а бэггинг?
15:28 Отличия LightGBM, XGBoost, CatBoost?
16:28 Где конспект по всем темам
16:40 Что такое метрические модели?
17:15 Как работает k-nn? Какое у него время обучения и предсказания?
18:23 Как можно считать расстояние?
18:44 Какие есть плюсы и минусы метрических моделей и knn в особенности?
19:27 Как масштабирование признаков влияет на K-NN? Почему?
19:48 Как ускорить K-NN для большого датасета?
20:17 Где можно применять метрические модели?
20:57 Самый эффективный способ зайти в МЛ
21:41 Что такое кластеризация? Примеры задач, которые решаются с помощью кластеризации?
21:58 Объясните различия между soft и hard кластеризацией.
22:19 Как работает метод К-средних?
23:30 Какие есть проблемы с начальной инициализацией центров? Как можно улучшить ее?
24:04 Как можно ускорить алгоритм к-средних?
24:35 Что такое иерархическая агломеративная кластеризация, чем отличается от дивизионных алгоритмов?
25:04 Как можно посчитать расстояние между кластерами в иерархической кластеризации?
25:30 Что такое дендрограмма?
25:57 Какие есть критерии остановки работы иерархической кластеризации?
26:26 Как работает алгоритм DBSCAN?
28:24 Какие метрики существуют для оценки качества кластеризации?
29:51 Как выбрать оптимальное количество кластеров?
30:22 Финальное слово
Конспект с разобранными вопросами: https://t.me/rockaux
Разборы реальных собеседований: https://boosty.to/lokis_alexandr
Менторство "оффер под ключ": https://sites.google.com/view/lokismlmentor
личный тг: https://t.me/abletobetable
Subscription levels3

Baseline

$17.1 per month
Доступ ко всем закрытым видео и статьям:
- мок-собесы
- обучающие материалы
- разборы собесов
- ML System Design
- резюме
Subscription Spots Are Limited

Предоплата за менторство

$149 per month
only for mentorship (сначала написать в лс в тг и договориться)
Subscription Spots Are Limited

SOTA

$213 per month
 - Созвон со мной раз в месяц на любую тему от ответов на вопросы до карьерной консультации и тестового собеседования
 - Доступ к базе знаний менторства
    - все материалы, теория, практика
    - вопросы с собеседований 
    - материалы по подготовке в MLSD
    - материалы для формирования резюме
 - Полный доступ ко всем закрытым видео
Go up