
Идея

Каждый пятый человек в России ещё десять лет назад работал неофициально. Ни налогов, ни больничных, ни пенсий. При анализе данных меня интересовало, меняется ли ситуация в России в связи с принятием новых мер по борьбе с безработицей и привлечению людей в официальный сектор. Если да, то в какую сторону?
Начнём с главного: почему это важно? Теневая занятость — это не просто цифры в отчётах. Это потерянные деньги для бюджета, которые могли бы пойти на школы, дороги и медицину. Это тысячи работников без социальных гарантий. Но за последние 10 лет доля неофициальной занятости упала с 20% до 12%. Об этом и пойдет речь дальше.

нейросеть leonardo.ai
Статисника по занятости населения в официальном и теневом секторах взята с официального сайта федеральной службы государственной статистики — Росстата.
Для наглядности материалов будут использоваться следующие виды диаграмм: тепловая диаграмма, пузырьковая диаграмма, гистограмма, круговая диаграмма. Они, на мой взгляд, лучше всего дают понимание данных относительно друг друга

нейросеть leonardo.ai
Используемые библиотеки Python:
1. pandas — работа с табличными данными: анализ, очистка, обработка. 2. numpy — математические операции с массивами и матрицами. 3. matplotlib.pyplot — построение статических графиков: линейные, столбчатые, scatter-plot и другие. 4. seaborn — создание визуально-привлекательных статистических графиков 5. plotly.express — создание интерактивных графиков в одну строку. 6. plotly.graph_objects — построение интерактивных графиков с большим количеством настроек, чем plotly.express. 7. plotly.io — управление настройками Plotly: рендеринг, экспорт графиков. 8. kaleido — экспорт интерактивных графиков Plotly в статические изображения.
Использованные нейросети:
1. leonardo.ai 2. deepseek 3. iloveimg
Этап работы № 1
Были скачаны две таблицы Excel с данными по занятости населения в официальном и теневом секторах. Это задало вектор дальнейшего исследования.
нейросеть leonardo.ai
Среди множества данных, которые содержались в файлах, больше всего меня заинтересовали разделы о численности занятых людей в официальном секторе и теневом, численность занятых людей в обоих секторах по виду деятельности и уровню образования. На основе этих данных были составлены новые таблицы в формате .csv для последующей работы с ними.
нейросеть leonardo.ai
Этап работы № 2
Составленные таблицы .csv я закинула в нейросеть Deepseek с подробным описанием того, как нужно обработать данные и как какие аналитические диаграммы построить на их основе.
Просматривая данные в исходных файлах Excel у меня возникло несколько гипотез и предположений, которые я решила проверить: подтвердить или опровергнуть при помощи анализа, сравнения данных в различных срезах, изучения динамики изменения по годам, возрастным группам и сферам экономики.
нейросеть leonardo.ai
Так как образ рабочего человека у меня ассоциируется с синим, то было принято решение сделать этот проект в темно-синих оттенках. Для разнообразия были добавлены бежевый и голубой и фиолетовые цвета. Фон темный, поэтому цвет шрифта белый.
Глобальная картина занятости
Рассмотрим глобальную картину занятости населения, а именно процентное оттошение теневого сектора к официальному с 2013 до 2023 годы. Можно заметить, что количество процентов людей, занятых в неофициальных сферах снижается. Явно это прослеживается у людей из категории 15-19 лет и 70+. Делее мы рассмотрим это более детально.
Обратите внимание на следующие графики. Они показывают процент занятых с офицальном и теневом секторах относительно общего количества занятых:
Размер и цвет пузырьков зависит от величины процента занятых в для разных возрастных групп на протяжении одинадцати лет с 2013 по 2023 годы включительно.
Видно, что доля занятых снижается в возрстных группах 20-24 и 25-29 лет, а в старших возрастных группах — наоборот — увеличивается.
Если нормализовать зависимость цвета от величины процента внутри каждой возрастной группы, то видим еще более интересную картину:
— самая высокая динамика уменьшения занятости наблюдается в возрастной группе 20-24 года. В группах 25-29 и 50-54 количество занятых тоже снизилось. Причем, в обоих группах и в официальном, и в неофициальном секторах.
— при этом, среди возрастов 30-44 и в старших возрасных группах (55-70+) года наблюдается рост занятости в официальных сферах.
— в неофициальном секторе не наблюдается такой выраженной динамики в группах 45-59 и 60-64 лет.
Данный фрагмент кода одинаковый для обеих пузырьковых диаграмм
Из графиков можно сделать несколько выводов:
Наблюдается общее снижение занятости как в официальном, так и в неофициальном секторах среди молодежи и средних возрастных групп. Это может быть связано с повышением качества образования.
В старших возрастных группах наблюдается рост занятости, что может быть связано с увеличением пенсионного возраста, необходимостью и/ли возможностью продолжать работать.
Самое активное рабочее население в возрасте от 30 до 49 лет переходит из теневого сектора в официальный. Это связано, возможно, с желанием получать пенсию и другие субсидии от государства.
Занятость по уровню образования
Рассмотрим процентное соотнощение занятости неофициального сектора к официальному по уровню образования на следующей тепловой карте. Можно заметить, что, пускай и не значительно, но количество занятых в неофициальном секторе снижается. Обратим внимание, что ощутимо упал процент занятых без основного общего образования.
Теперь обратим вниманее на тенденции роста и снижения занятости людей в обоих секторах относительно их профессиональной подготовкой.
Данный фрагмент кода одинаковый для обеих гистограмм
Сравнивая графики относительно друг друга, можно заметить, что:
В обоих секторах увеличивается число лиц с высшим и средним профессиональным образованием, но в официальном секторе это более выражено.
Во всех категориях наблюдается сокращение работников со средним общим образованием.
Основное общее образование сохраняет свою долю, особенно в неофициальном секторе.
Активное снижение числа работников с отсутсвием образования как в официальном секторе, так в теневом.
Занятость по сферам деятельности
Обратим распределение людей по сферам экономической деятельсти в официальном и теневом секторах. Нагляднее всего это покажет круговая диаграмма.
Данный фрагмент кода одинаковый для обеих круговых диаграмм
Официальный сектор доминирует в отраслях с высокими требованиями к регулированию, технологиям и капиталовложениям, а именно обрабатывающая промышленность, финансы, логистика.
Неофициальный сектор сохраняет значимое присутствие в сферах с низкими барьерами для входа. Например, сельское хозяйство, торговля, услуги.
Государственные и социальные отрасли, такие как, образование и здравоохранение, почти полностью сосредоточены в официальном секторе поскольку финансируются, в основном, государством.
В этих двух графиках более наглядно изображено отношение официального сектора к неофициальному. Из этого можно вывести следующее:
Официальный сектор преобладает в стратегических и регулируемых отраслях, тогда как неофициальный остается нишей для малого бизнеса и среднего бизнеса и индивидуальной деятельности.
Вывод
Исходя из данных статистик, можно выдвинуть несколько выводов:
Сокращение теневой занятости связано с ужесточением законодательства, цифровизацией контроля, налоговыми реформами.
Рост официального сектора обусловлен повышением уровня образования работников, пенсионной реформой и программами поддержки.
Ключевые отрасли, такие как строительство и торговля, демонстрируют значительный переход в легальный сектор.
Молодежь и старшее поколение всё чаще выбирают официальную занятость, что снижает долю теневого рынка.
нейросеть leonardo.ai
Таким образом, эти тенденции указывают на успешную интеграцию мер по борьбе с безработичей и созданием условий для привлечения людей в официальный сектор. Надеюсь, правительство России продолжит работу в этом направлении, чтобы наша страна процветала.
нейросеть leonardo.ai
Промт обложки проекта в нейросети leonardo.ai: cover on the topic of the shadow economy in modern times