creator cover Биоинформатика и лапки
Биоинформатика и лапки

Биоинформатика и лапки 

Путевые заметки старшего мяучного котрудника

13subscribers

11posts

goals1
1 of 100 paid subscribers
Если получится набрать сто котят-подписчиков, то запущу видеоблог или лапковый подкаст.

About

Богдан Кириллов, кандидат биологических наук (a.k.a. PhD по наукам о жизни из Сколтеха), автор телеграмм-канала "Биоинформатика и лапки".
Дисклеймер: все мнения -- исключительно мои и никак не соответствуют позициям организаций, с которыми я аффилирован
Биоинформатик, обучатель машин, полимат, немного кринж. Жмякаю лапками на нескольких рабкотах, в целом наслаждаюсь жизнью, косплея ленивого кота. Тут пишу об интересных мне вещах по науке, технологии и тд, но не только.
Все мемы -- в телеге, а здесь место для более сурьезного контента, но это не точно. Длиннопосты (доступные с уровня "мохнати поболбше") выпускаются два-четыре раза в месяц, более короткие заметки, списки и тд (доступные с первого уровня) -- чаще, но предупреждаю -- я не перфекционист, и заметки получаются весьма al dente. Книжный блог доктора Пушистого доступен с уровня "маленьки мохнати". Для уровней "биг коть" и "кутежный котан" доступен особый, секретный сорт Лапкочата, где можно заказывать посты. Организация постов по тегам будет позже, а пока что ниже представлены избранные ссылки на старое.
Думайте. Подписаться.
Мои выступления на подкастах, видео и т.д.
Подкаст Медача 1 -- https://t.me/medach/3568
Лампово поговорили о том, как можно прийти в биоинформатику и какой спектр задач можно решать с ее помощью, обсудили роль машинного обучения и искусственного интеллекта в этой области.
Подкаст Медача 2 -- https://t.me/medach/3828
На этот раз мы обсудили CRISPR, генетически модифицированные организмы и роль этих технологий – в настоящем и будущем. Подкаст с лавинным эффектом — начинается скучно нормисно, но постепенно становится все более и более шизовым, заканчивая на стадии «инфохазард».
Обсудили состояние современной науки, трансгуманизм, научную этику.
А ещё поговорили о том, как сочетается вера и наука, какие перспективы у клонирования и предотвращения старения.
Открытый доступ -- очень старые лонгриды.
Биоинформатика: Starter Pack - http://telegra.ph/Bioinformatika-Starter-Pack-08-11
Легендарный длиннопост про биоинформатику от 2018 года, который многих (судя по отзывам) наставил на путь истинный.
Construction material of the brain is different for different populations - https://telegra.ph/Construction-material-of-the-brain-is-different-for-different-populations-09-29
Пост про одну интересную научную статью про разницу состава мозга разных человеческих популяций, на английском.
Fever dreams о шизоистории
Новая рубрика ТРИП РЕПОРТ -- интересные истории о котячьих путешествиях. Выпуск первый, музей новой хронологии в Ярославле. 18+ много мата.
Level required:
оченб маленбки котови
Как моделировать для 3д печати, чтобы не быть лолкой
Для моих красотуль -- как моделировать для 3д печати на примере доделки детали биопринтера)
Level required:
оченб маленбки котови

Восстание против меточного шума

В этом открытом длиннопосте поговорим о меточном шуме и о том, как с ним бороться. Код приложен к посту.
В прикладном машинном обучении, особенно в высоконаучных приложениях вроде той же биоинформатики, иногда возникают интересные задачи эпистемиологического характера в духе "А как мы можем понять, что из этих данных вообще можно узнать, и насколько они правильные?".
Предположим, что существует некий датасет (X, y_gathered), где X -- данные, а y_gathered -- метки. (Бусти, втф, добавь латех в редактор!)
Этот датасет был, например, собран людьми, у которых руки растут не из того места -- реальные метки y_real и собранные метки y_gathered отличаются так, что y_gathered = y_real + N, где N -- некий шум неизвестной природы. Также мы можем предположить, что сама метка y_real -- какая-то сложноопределимая хрень, насчет которой спорят эксперты (ТМ) и никак не могут определиться с результатом.
Для нас эти две постановки эквивалентны.
Есть интерес в том, чтобы:
1. Попытаться понять, какие из меток в y_gathered неправильные и соответствующие примеры выкинуть из датасета;
2. Насколько реальный диапазон y_real отличается от диапазона y_gathered, или, если говорить о классификации, насколько классы из y_real соответствуют классам в y_gathered;
3. Какой может быть модель шума -- какие классы проще всего между собой перепутать?
В общем виде этим заннимается теория уверенного обучения (confident learning), которая предлагает свою формализацию понятия меточного шума и общие подходы к этим вопросам. Сегодня мы попробуем поиграться с решением задачи 1, и посмотреть на примере, а можно ли тем же самым подходом решить задачу 2. Про задачу 3 поговорим как-нибудь в другой раз.
Хороший пост! Интересно было почитать. Изложенное нужно будет опробовать на своих данных)
Индуктивное конформное предсказание для прикола и профита, часть 1: регрессия.
Вонзаем ЗУБКЕ в оценку неопределенности предсказаний машинного обучения! ВКУТНИ
Level required:
мохнати поболбше
Полезный шаблон докерфайла для мл-проектов
😸😸😸😸😸😸 Тысячи часов сэкономлено! 💸 Бесконечные проблемы с зависимостями забыты навсегда! 🚫 😸😸😸😸😸😸😸
Level required:
оченб маленбки котови
Хирург с ледорубом против современного мира
Книжный блог доктора Пушистого №2: Сэм Кин "Во имя науки"
Level required:
маленьки мохнати
Самый важный раздел математической книги
ШОК! ТРЕПЕТ! РОССИЙСКИЕ УЧЕНЫЕ РАСКРЫВАЮТ СЕКРЕТ ПОНИМАНИЯ МАТАНА!
Level required:
оченб маленбки котови

Почему человечество больше не производит Эйнштейнов?

В честь начала учебного года -- перевод статьи американского нейробиолога Эрика Хёля "Why we stopped making Einsteins: Aristocratic tutoring I: Explaining the decline of genius". Вкратце -- БАЗА.
Рисунки для блога "The Intrinsic Perspective" сделаны Alexander Naughton
Я считаю, что факт о человечестве, который сильнее всего вызывает депрессию, -- то, что, хоть во время нулевых большая часть мира и получила, по сути, свободный и бесплатный доступ ко всему существующему знанию, это не привело к золотому веку.
Если думать о возникновении интернета достаточно долго, кажется невозможным не начать отвергать существующие предположения о том, как создается гениальность. Если бы гении были лишь вопросом генетики, тогда во время предыдущего века, с колоссальным ростом населения мира и взлётом массовости образования, а также с разрушением расовых и гендерных барьеров по всему миру (в частности, в последние несколько десятилетий, тогда, когда наше общество стало насыщено свободной и бесплатной информацией), мы должны были бы наблюдать всплеск гениальности -- расцвет лучших математиков, самых великих ученых, и наиболее впечатляющих людей искусства.
Трещина находится далеко не в мироздании
Книжный блог доктора Пушистого №1: Даудна, Стернберг "Трещина в мироздании"
Level required:
маленьки мохнати
Как подсчитать стоимость 3д печати?
ЧТОБЫ УЗНАТЬ, СКОЛЬКО СТОИТ ПЕЧАТЬ, НУЖЕН ВСЕГО ЛИШЬ ПРОСТОЙ СОВЕТСКИЙ...
Level required:
оченб маленбки котови
Subscription levels5

оченб маленбки котови

$2.84 per month
Доступ к небольшим статьям, спискам, рецептам. Gateway drug лапкопространства.

маленьки мохнати

$7.1 per month
Доступ к книжному блогу доктора Пушистого, вдобавок к предыдущему уровню. Погружение в котовость по колено (со стрелой или без).

мохнати поболбше

$14.2 per month
Оптимальный уровень погружения в лапкопространство, полный доступ ко всем постам, чертежам, коду, stl-ам.

биг коть

$28.4 per month
Все предыдущее + доступ в телеграмм чат для бустеров. 
+ chat

кутёжный котан

$71 per month
Для невероятно богатых котанов, которые меня очень любят по какой-то причине или без. Поим котят шампанским, входим в PAWCOIN на всю котлету, наслаждаемся девятью жизнями на полную КОТ УШКО. Все то же, что и для биг коть, плюс моя большая благодарность.
+ chat
Go up