Биоинформатика и лапки

Jan 14 2025 21:55

Fever dreams о шизоистории

Новая рубрика ТРИП РЕПОРТ -- интересные истории о котячьих путешествиях. Выпуск первый, музей новой хронологии в Ярославле. 18+ много мата.

Level required:

оченб маленбки котови

котяху порвало

трип репорт

простое

Nov 27 2024 18:02

Как моделировать для 3д печати, чтобы не быть лолкой

Для моих красотуль -- как моделировать для 3д печати на примере доделки детали биопринтера)

Level required:

оченб маленбки котови

простое

3д печать

Nov 12 2024 08:23

Восстание против меточного шума

В этом открытом длиннопосте поговорим о меточном шуме и о том, как с ним бороться. Код приложен к посту.

В прикладном машинном обучении, особенно в высоконаучных приложениях вроде той же биоинформатики, иногда возникают интересные задачи эпистемиологического характера в духе "А как мы можем понять, что из этих данных вообще можно узнать, и насколько они правильные?".

Предположим, что существует некий датасет (X, y_gathered), где X -- данные, а y_gathered -- метки. (Бусти, втф, добавь латех в редактор!)

Этот датасет был, например, собран людьми, у которых руки растут не из того места -- реальные метки y_real и собранные метки y_gathered отличаются так, что y_gathered = y_real + N, где N -- некий шум неизвестной природы. Также мы можем предположить, что сама метка y_real -- какая-то сложноопределимая хрень, насчет которой спорят эксперты (ТМ) и никак не могут определиться с результатом.

Для нас эти две постановки эквивалентны.

Есть интерес в том, чтобы:

1. Попытаться понять, какие из меток в y_gathered неправильные и соответствующие примеры выкинуть из датасета;

2. Насколько реальный диапазон y_real отличается от диапазона y_gathered, или, если говорить о классификации, насколько классы из y_real соответствуют классам в y_gathered;

3. Какой может быть модель шума -- какие классы проще всего между собой перепутать?

В общем виде этим заннимается теория уверенного обучения (confident learning), которая предлагает свою формализацию понятия меточного шума и общие подходы к этим вопросам. Сегодня мы попробуем поиграться с решением задачи 1, и посмотреть на примере, а можно ли тем же самым подходом решить задачу 2. Про задачу 3 поговорим как-нибудь в другой раз.

длиннопост

машинное обучение

А М

Хороший пост! Интересно было почитать. Изложенное нужно будет опробовать на своих данных)

Nov 12 2024 08:56

Oct 21 2024 06:26

Индуктивное конформное предсказание для прикола и профита, часть 1: регрессия.

Вонзаем ЗУБКЕ в оценку неопределенности предсказаний машинного обучения! ВКУТНИ

Level required:

мохнати поболбше

длиннопост

большое

машинное обучение

Oct 06 2024 14:58

Полезный шаблон докерфайла для мл-проектов

😸😸😸😸😸😸 Тысячи часов сэкономлено! 💸 Бесконечные проблемы с зависимостями забыты навсегда! 🚫 😸😸😸😸😸😸😸

Level required:

оченб маленбки котови

простое

рецепты

наброски

Sep 26 2024 18:33

Хирург с ледорубом против современного мира

Книжный блог доктора Пушистого №2: Сэм Кин "Во имя науки"

Level required:

маленьки мохнати

книжный блог доктора пушистого

Sep 23 2024 02:25

Самый важный раздел математической книги

ШОК! ТРЕПЕТ! РОССИЙСКИЕ УЧЕНЫЕ РАСКРЫВАЮТ СЕКРЕТ ПОНИМАНИЯ МАТАНА!

Level required:

оченб маленбки котови

простое

Sep 20 2024 02:15

Почему человечество больше не производит Эйнштейнов?

В честь начала учебного года -- перевод статьи американского нейробиолога Эрика Хёля "Why we stopped making Einsteins: Aristocratic tutoring I: Explaining the decline of genius". Вкратце -- БАЗА.

Рисунки для блога "The Intrinsic Perspective" сделаны Alexander Naughton

Я считаю, что факт о человечестве, который сильнее всего вызывает депрессию, -- то, что, хоть во время нулевых большая часть мира и получила, по сути, свободный и бесплатный доступ ко всему существующему знанию, это не привело к золотому веку.

Если думать о возникновении интернета достаточно долго, кажется невозможным не начать отвергать существующие предположения о том, как создается гениальность. Если бы гении были лишь вопросом генетики, тогда во время предыдущего века, с колоссальным ростом населения мира и взлётом массовости образования, а также с разрушением расовых и гендерных барьеров по всему миру (в частности, в последние несколько десятилетий, тогда, когда наше общество стало насыщено свободной и бесплатной информацией), мы должны были бы наблюдать всплеск гениальности -- расцвет лучших математиков, самых великих ученых, и наиболее впечатляющих людей искусства.

длиннопост

перевод

Sep 15 2024 00:49

Трещина находится далеко не в мироздании

Книжный блог доктора Пушистого №1: Даудна, Стернберг "Трещина в мироздании"

Level required:

маленьки мохнати

книжный блог доктора пушистого

Sep 02 2024 14:02

Как подсчитать стоимость 3д печати?

ЧТОБЫ УЗНАТЬ, СКОЛЬКО СТОИТ ПЕЧАТЬ, НУЖЕН ВСЕГО ЛИШЬ ПРОСТОЙ СОВЕТСКИЙ...

Level required:

оченб маленбки котови

наброски

простое

About

Восстание против меточного шума

Почему человечество больше не производит Эйнштейнов?

оченб маленбки котови

маленьки мохнати

мохнати поболбше

биг коть

кутёжный котан