creator cover Если быть точным
Если быть точным

Если быть точным 

Собираем данные для решения социальных проблем

91subscribers

12posts

goals1
40 of 100 paid subscribers
Сто подписчиков — это сто участников команды «Если быть точным»‎, которые помогут нам достичь новых высот.

About

Привет, это «Если быть точным»! Мы собираем данные для решения социальных проблем в России.
За последние годы данных становится всё меньше: статистику скрывают, удаляют, ограничивают доступ. Но несмотря на это, их по-прежнему много. И порой они обнаруживаются в самых неожиданных источниках. Мы собираем и сохраняем их: наши аналитики ежегодно разбирают сотни excel и pdf-таблиц, находят скрытые API на сайтах ведомств и через Wayback Machine восстанавливают удаленные показатели. 
Что мы сделали в 2025 году:
🔺Мы опубликовали и обновили 21 датасет, всего их теперь 42. За 2025 год их скачали 37 тысяч раз. Среди самых популярных — муниципальная статистика, тысяча показателей по регионам, финансовая отчетность компаний.
🔺Продолжили доставать редкие данные, которые сложно еще где-то найти — например, по трудоустройству и зарплатам всех российских выпускников или численности населения и национальном составе всех населенных пунктов России.
🔺Несколько раз мы ездили в одно из ведомств, чтобы получить данные в ответ на наш запрос, поскольку они весили слишком много. Так у нас на руках оказалась флешка с 4 ГБ данных — все они теперь в каталоге. 
🔺Росстат иногда удаляет с сайта ежемесячные сборники через некоторое время после публикации. При подготовке датасета по пересмотрам экономических показателей мы восстановили их с помощью эксперта, который регулярно сохраняет все версии — он любезно поделился архивом.
🔺Добавили третий современный формат хранения данных — Parquet — и опубликовали в нем уже больше 10 датасетов. Данные в формате Parquet весят в несколько раз меньше, чем в других.
Поддержите нас, чтобы открытых данных становилось больше. Ваши регулярные пожертвования помогают нам выпускать новые материалы и оставаться независимым проектом.
Подписчики уровня «Аналитик» или выше получают от нас бонус — еженедельную рассылку «Это не показатель». В ней мы рассказываем, что стоит за статистическими показателями, делимся лайфхаками и историями про данные. Опубликовали уже больше 60 выпусков, вы получите доступ ко всем сразу.

Почему выросло число зданий школ?

Привет! Любите разбираться в аномалиях и необычных паттернах в данных? Мы тоже, поэтому в одной из рубрик нашей рассылки «Это не показатель» предлагаем читателям дата-загадки. 
В одних загадках мы предлагаем разобраться в природе артефакта или неожиданной корреляции в данных, в других — угадать показатель, соотнести графики и понять, какой фактор объединяет разные регионы России. А в ответе всегда делимся контекстом: рассказываем, откуда берется тренд и как устроены данные, которые за ним стоят. 
Раз в две недели мы будем публиковать загадку и здесь. 

Ловите первую!

В одном из регионов России в последние годы количество зданий школ выросло более чем вдвое — с 1867 в 2019 году до 4190 в 2024-м. Предположите, что могло стать причиной столь резкого роста.

Пишите ваши догадки в комментариях! Для подписчиков уровня «Стажер» и выше через несколько дней опубликуем ответ с контекстом.

Мы запустили рассылку для тех, кто поддерживает «Если быть точным»

Рассылка называется «Это не показатель» — в ней мы делимся лайфхаками о работе с данными и визуализации, рассказываем о том, как готовим наши исследования и публикуем дата-загадки. 
Доступны уже более 60 выпусков на разные темы: например, как пользоваться ЕМИСС, замечать ошибки в исследованиях, нормировать данные и многое другое. Материалы будут полезны исследователям, аналитикам данных, журналистам, PR-специалистам, маркетологам — как начинающим, так и опытным, а также всем, кого интересует работа с данными.

Рассылка доступна тем, кто поддерживает нас на сумму от 500 рублей и выше — это уровень «Аналитик» или «Исследователь». Подписка дает доступ ко всем опубликованным выпускам. Новое письмо будет приходить вам на почту раз в неделю.
Поддержите наш проект и читайте рассылку «Это не показатель».
Архив выпусков рассылки (46-60)
Level required:
Аналитик
Архив выпусков рассылки (31-45)
Level required:
Аналитик
Архив выпусков рассылки (16-30)
Level required:
Аналитик
Архив выпусков рассылки (1-15)
Это пост с архивом опубликованных выпусков рассылки «Это не показатель».
Level required:
Аналитик
Привет, друзья!
Спасибо, что вы с нами — каждый платный подписчик помогает нам продолжать нашу работу: сохранять и распространять открытые данные в России.
С февраля мы подготовили уже 13 выпусков рассылки «Это не показатель» — собирали карты источников об инвалидности и гендерном неравенстве, рассказывали, как извлечь данные из pdf и строить половозрастные пирамиды в Google Таблицах, а также делились новостями из мира российских данных.
У нас еще много идей полезных материалов, но мы хотим узнать ваши! Расскажите, о чем бы вам хотелось почитать или чему научиться?
Если вам интересно, как работает редакция «Если быть точным», у вас есть вопрос по нашим материалам или датасетам или вы просто хотите предложить тему для нового выпуска — напишите нам, и мы обязательно учтем ваши пожелания. 
А еще на подходе новые форматы — скоро мы запустим закрытые вебинары для подписчиков с командой проекта. До следующего выпуска!

Мы обновили каталог датасетов! Теперь в нем есть данные о ВИЧ-инфекции из семи источников, зарплатах российских выпускников за последние пять лет и больше тысячи региональных показателей

В начале декабря мы запустили каталог — раздел с открытыми данными, собранными в удобные машиночитаемые датасеты. В июне мы открыли доступ к пяти новым наборам данных — четыре из них собраны только у нас.
🔸 Трудоустройство и зарплаты выпускников по образовательным организациям
Выпускники пяти тысяч организаций среднего профессионального и высшего образования России 2019-2023 годов. Данные находились в открытом доступе всего два дня, но мы успели их скачать.
🔸 Трудоустройство и зарплаты выпускников по направлениям подготовки
Зарплаты и трудоустройство всех российских выпускников по регионам, полу и 740 специальностям.
🔸 Демографические показатели муниципальных образований России
Население, смертность, рождаемость и миграция в 2,3 тысячах российских муниципалитетах с учетом изменений административного деления и названий. Можно исследовать избыточную смертность и другие демографические процессы на внутрирегиональном уровне.
🔸 ДТП: координаты, участники и пострадавшие
Данные проекта «Карта ДТП» в формате плоских таблиц. Можно анализировать реальные причины ДТП и разрабатывать решения, которые улучшат ситуацию на дорогах.
🔸 ВИЧ-инфекция в России с 2014 года
Почти все доступные данные о распространении ВИЧ-инфекции в России с 2014 года из 7 разных источников. Можно изучать, как на самом деле развивается эпидемия.

Большие новости — теперь на «Если быть точным» есть каталог датасетов!

Привет, друзья! Это команда «Если быть точным», и у нас важные новости!
Наверняка вы знаете, что данные в России исчезают. Сведения о доходах и расходах чиновников, информация о госзакупках подсанкционных компаний, миграционная статистика — с 24 февраля 2022 года более 20 наборов данных были скрыты полностью или частично. Последние месяцы мы занимались тем, что пытались их «спасти».
Так у нас на сайте появился каталог — раздел с открытыми данными, собранными в удобные машиночитаемые датасеты. В таком формате вы их больше нигде не найдете. Чтобы собрать эти данные, мы обработали сотни таблиц из pdf-файлов, нашли скрытые API в недрах сайтов ведомств и вернулись в прошлое с помощью Wayback Machine, чтобы вернуть удаленные показатели.
Для каждого набора мы подготовили описание — об источниках, полноте и качестве данных. Доступных датасетов пока восемь.
🔸 Атмосфера: степень загрязнения в городах России с 2007 года. Данные для 220 населенных пунктов, в которых Росгидромет проводит регулярные наблюдения.
🔸 Объекты-загрязнители. Данные обо всех объектах, которые производят выбросы в стране, и о вредных веществах, которые в них содержатся. Ранее Росприроднадзор их скрыл.
🔸 Социально-экономические показатели. Почти 500 показателей о регионах России за 20 лет — от социально-демографических данных и уровня жизни до доходов и внешней торговли.
🔸 Учреждения уголовно-исполнительной системы. Из чего состоят, кто в них работает и за какие преступления в них сидят.
🔸 Смертность и заболеваемость среди заключенных и осужденных

❗️Россия — страна победившей «токсичной маскулинности», где мужчины умирают на 10 лет раньше, чем женщины. Такого разрыва нет почти нигде в мире. Исследование «Если быть точным» и РЭШ

В прошлом году Россия вышла на первое место в мире по разрыву в продолжительности жизни мужчин и женщин. Российские мужчины почти в семь раз чаще женщин заканчивают жизнь самоубийством, больше курят и пьют и гораздо раньше умирают от хронических заболеваний.

Разница в смертности мужчин и женщин есть почти во всех странах. Однако в большинстве случаев она проявляется после 60 лет. В России же мужчины начинают умирать чаще уже после 25 (!).
Обычно в трудоспособном возрасте люди погибают не от болезней, а от «внешних причин» — это несчастные случаи, убийства, самоубийства, отравления и так далее. Для мужчин этого возраста риск смерти от внешней причины в пять раз выше, чем для женщин. По оценкам демографа Алексея Ракши, до ⅔ смертей от внешних причин в России связаны с алкоголем.
Это приводит к сильному перекосу в демографической структуре России. В возрастной группе 80-84 года женщин уже в три раза больше, чем мужчин.
Причем биологически обусловленная разница в продолжительности жизни мужчин и женщин составляет не более двух лет. Все остальное – культурные факторы, в том числе постсоветский тип маскулинности, который предполагает пренебрежение своим здоровьем.
👉 подробнее о том, почему российские мужчины умирают так рано, читайте в нашем исследовании
Этот материал мы подготовили совместно с Российской экономической школой. И он не последний, следите за каналом 👀
Subscription levels4

Стажер

$1.45 per month
Поддерживайте аналитический подход к решению социальных проблем. В благодарность за ваш вклад мы будем присылать:
· ответы на дата-загадку с контекстом;
· один полезный материал из архива нашей дата-рассылки в месяц.

Лаборант

$4.4 per month
Помогите «Если быть точным» планировать будущие исследования и датасеты. Чтобы поблагодарить за поддержку, мы отправим: 
· ответы на дата-загадку с контекстом;
· один полезный материал из архива нашей дата-рассылки в месяц;
· один материал из последнего выпуска рассылки раз в две недели.

Аналитик

$7.3 per month
Вы очень поддержите нас в выпуске больших материалов. Раз в неделю мы будем присылать вам рассылку «Это не показатель». В ней мы рассказываем, что на самом деле стоит за статистическими показателями, делимся лайфхаками и историями про данные. 

Старший исследователь

$14.5 per month
Подписка для тех, кто хочет быть самым точным! Каждую неделю будем присылать вам рассылку «Это не показатель» и подарим специальные материалы: HTML и CSS  в Datawrapper, чек-лист подготовки дата-журналистского исследования и инструкцию о том, как сделать плиточную карту.
Go up