Содержание поста-книги "Кластерный анализ (171-стр. pdf, 9 Jupyter-тетрадок, 1 скрипт)"
I. Знакомство с кластерным анализом
I.1. Методы кластерного анализа
I.2. Преимущества и недостатки кластерного анализа
I.3. Этапы проведения кластерного анализа
I.4. Выбор переменных для кластерного анализа
I.5. Выбор меры расстояния между объектами
I.6. Выбор меры расстояния между кластерами
I.7. Определение оптимального количества кластеров
I.7.1. «Метод локтя»
I.7.2. Силуэтный коэффициент
I.7.3. Гэп-статистика
I.8. Верификация
II. Метод k-средних
II.1. Описание метода
II.2. Улучшение процедуры инициализации центров кластеров в методе k-средних++
II.3. Программная реализация метода k-средних
II.4. Применение собственной реализации метода k-средних к данным об ирисах Фишера и набору make_blobs
II.5. Недостатки метода k-средних
II.6. Применение класса KMeans для задачи с известными фактическими метками кластеров (кластеризация с ground truth)
II.7. Применение класса Kmeans для задачи с неизвестными фактическими метками кластеров (кластеризация без ground truth)
III. Метод DBSCAN
III.1. Описание метода
III.2. Программная реализация DBSCAN
III.3. Настройка гиперпараметров DBSCAN
III.4. Преимущества и недостатки DBSCAN
IV. Метод HDBSCAN
IV.1. Описание метода
IV.2. Настройка гиперпараметров HDBSCAN
V. Метод BIRCH
V.1. Описание метода
V.2. Иллюстрация метода
кластерный_анализ