EN
mlcourse.ai
mlcourse.ai
112 subscribers
goals
7 of 77 paid subscribers
Когда я наберу 77 подписчиков в месяц, я смогу уделять больше времени разработке нового обучающего материала на русском.

Бонусные задания открытого курса по машинному обучению mlcourse.ai

Всем привет!
Открытый курс машинного обучения mlcourse.ai сообщества OpenDataScience – это сбалансированный по теории и практике курс, дающий как знания, так и навыки (необходимые, но не достаточные) машинного обучения уровня Junior Data Scientist. Нечасто встретите и подробное описание математики, стоящей за используемыми алгоритмами, и соревнования Kaggle Inclass, и примеры бизнес-применения машинного обучения в одном курсе. С 2017 по 2019 годы Юрий Кашницкий yorko и большая команда ODS проводили живые запуски курса дважды в год – с домашними заданиями, соревнованиями и общим рейтингом учаcтников. 
Статьи на Хабре на русском все еще актуальны – вот первая. Впрочем, наиболее актуальная версия материалов – на английском, см. mlcourse.ai
C 2020 года курс – в режиме самостоятельного прохождения. Часть заданий мы выложили в открытый доступ, с решениями. А часть заданий доступны на Patreon и тут на Boosty – "Бонусные задания mlcourse.ai". Все – на английском (верим, что курс на русском возродится, но первые попытки, к сожалению, оказались не очень удачными). 
В бонусной подписке вы получаете доступ к Jupyter Book с бонусными, «полноценными» (в отличие от демонстрационных) версиями заданий mlcourse.ai. В их числе – реализация деревьев решений, случайного леса, SGD и градиентного бустинга своими руками с нуля, а также задания, в которых вы под нашим чутким руководством за счет создания признаков и грамотной валидации модели бьете бейзлайны в Kaggle Inclass соревнованиях (“Alice” и “Medium”). 
В качестве тизера – то самое легендарное задание на реализацию градиентного бустинга своими руками. Мы досконально разберемся с математикой, стоящей за этим алгоритмом, почему он обобщается на классификацию, регрессию и ранжирование. 
Дальше мы на игрушечных примерах разберемся, как алгоритм работает. Вы получите похожие картинки, передающие "интуицию" того, что там происходит у бустинга под капотом.
Подробнее рассказываю про бонусные задания в этом посте в блоге.
Удачи!
avatar
Юрий добрый день, можете подсказать как найти train.json файл. У меня в папках его нет по 6 бонусному заданию
avatar
Doniyordjon Abduvaliev, добрый день! В задании даются ссылки на соревнование Kaggle https://www.kaggle.com/c/how-good-is-your-medium-article/data?select=train.json ("Download the competition data and place it where it’s convenient for you. You can modify the path to data below."). Файлы довольно большие, поэтому их нет в папках.
avatar
сорри, не обратил внимание

Subscription levels

Просто спасибо

$ 2,08 per month
Это для тех, кто просто хочет сказать спасибо за открытый курс машинного обучения mlcourse.ai

Еще бОльшее спасибо

$ 5,2 per month
Это для тех, кто просто хочет сказать спасибо за открытый курс машинного обучения mlcourse.ai

Бонусные задания mlcourse.ai

$ 10,4 per month
Тут вы получаете доступ к Jupyter Book с бонусными, «полноценными» (в отличие от демонстрационных) версиями заданий mlcourse.ai. В их числе – реализация деревьев решений, случайного леса, SGD и градиентного бустинга своими руками с нуля, а также задания, в которых вы под нашим чутким руководством за счет создания признаков и грамотной валидации модели бьете бейзлайны в Kaggle Inclass соревнованиях. 
Go up