
описание
Рынок недвижимости — одна из самых актуальных тем среди уже подросших зумеров. Примерно с 2019 года я сама постоянно сижу на ЦИАНе, как в социальной сети, и «присматриваю» себе квартиру. Для многих покупка или аренда квартиры — первый шаг во взрослую жизнь. Однако в наши дни это сделать крайне сложно. Из-за стоимости.
Мне стало интересно проанализировать Московскую недвижимость, поэтому на сервисе Kaggle я нашла датасет MoscowHomes: Dynamic Dataset, который отлично подошёл для данного проекта и анализа.
В ходе анализа получилось достаточно много графиков. Виды тех, что вошли в проект:
- столбчатые диаграммы - круговая диаграмма — графики - диаграмма рассеяния - корреляционная матрица - линейчатая диаграмма
визуальная концепция
Обложка проекта сгенерирована в Ideogram с помощью очень простого промпта:
real estate in moscow (недвижимость в Москве)
Мне хотелось, чтобы нейросеть отобразила московскую недвижимость самостоятельно, именно поэтому я намеренно не вписала в промпт подробности генерируемого изображения.
После создания линейчатой диаграммы, я с помощью Adobe Photoshop наложила на изображение созданную диаграмму.
Цветовая гамма проекта также сгенерирована при помощи нейросети Ideogram.
Первым шагом стала генерация изображения, иллюстрирующего образ Москвы:
vector image of Moscow residential architecture, the image reflects the color palette of Moscow residential architecture, the image contains modern and historical residential architecture of Moscow (векторное изображение жилой архитектуры Москвы, изображение отражает цветовую палитру жилой архитектуры Москвы, изображение содержит современную и историческую жилую архитектуру Москвы)
Нейросеть сгенерировала несколько разных вариантов, однако я остановилась на самом ярком.

образ Москвы глазами нейросети
Вторым шагом с помощью Adobe Color была создана цветовая палитра для визуализации данных.
цветовая палитра визуализации данных
#053959 используется в графиках для фона; #CEE8F2 — для текста; #50C4F2, #F2AB6D, #F2766B — для самих графиков и диаграмм.
Golos Text. Автор — Aleksandra Korolkova, Vitaly Kuzmin
Для подписей выбран шрифт Golos Text. Простой и красивый — самое то для визуализации данных.
обработка данных
Единственный минус данного датасета — отсутствие столбца с административными округами. Однако это не оказалось проблемой — я самостоятельно его добавила.
Для этого был создан и обработан большой словарь вида:
{ 'округ': ['станция метро 1', 'станция метро 2'…] }.
Теперь данные проще группировать территориально!
визуализация. обзор датасета
Итак, начнем с простого — диаграммы, которые показывают соотношения данных в датасете по различным типам. Возможно, это поможет при постройке более сложных графиков.
столбчатая диаграмма № 1. распределение объявлений по административным округам
код для столбчатой диаграммы № 1. распределение объявлений по административным округам
круговая диаграмма № 1. количество объявлений по типу квартиры
код для круговой диаграммы № 1. количество объявлений по типу квартиры
столбчатая диаграмма № 2. количество вторичек по административным округам
код для столбчатой диаграммы № 2. количество вторичек по административным округам
столбчатая диаграмма № 3. количество новостроек по административным округам
столбчатая диаграмма № 4. количество объявлений по количеству комнат
код для столбчатой диаграммы № 4. количество объявлений по количеству комнат
Коротко о датасете: - большинство объявлений приходится на Юг Москвы; - незначительно преобладают вторичики; - заметна сильная разница между вторичными и новыми квартирами — в датасете новостройки представлены только на Юге Москвы, что, скорее всего, и делает эти округа самыми «популярными» в датасете; - больше всего объявлений, ожидаемо, с 2-х комнатными квартирами, однако встречается даже 12-ти комнатная
визуализация. анализ данных
Самое интересное — увидеть зависимость цен на квартиры от каких-либо параметров. Ниже приведены такие графики
графики № 1 и № 2. зависимость цены от административного округа
Как и предполагалось, квартиры в центре — самые дорогие. Однако удивительно — насколько. Разница между Центральным и Западным АО, который стоит на 2-м месте по стоимости, почти в 2 раза. Мой родной Северо-Западный на 3 месте с разницей в 90 млн по сравнению с Центральным.
коды для графиков № 1 и № 2. зависимость цены от административного округа
графики № 3 и № 4. средняя цена за квадратный метр по административным округам
Этот график с ценой за квадратный метр уже интереснее. Центр все еще на 1 месте с большим отрывом, однако некоторые другие округа поменялись местами. Выходит, дело в площади квартир в разных округах.
коды для графиков № 3 и № 4. средняя цена за квадратный метр по административным округам
корреляционная матрица. корреляция между характеристиками квартир
Этот график — самый интересный!
Наиболее очевидное: цена сильно зависит от площади (любой: общей, жилой, кухни).
Из того, что меня всегда интересовало: зависимость от этажа и удаленности от метро. Если про метро еще можно предположить, что — чем ближе, тем дороже, однако есть ли разница в цене между квартирой на 1 этаже и на последнем? ведь нет общего мнения на этот счет: кто-то категорически против 1-х этажей, а кто-то последних.
Благодаря этому графику выясняется, что этаж практически не влияет ни на один из параметров.
А вот удаленность от метро оказывает небольшое влияние на цену. Это и рассмотрим далее чуть подробнее
код для корреляционная матрица. корреляция между характеристиками квартир
график № 5. распределение цен по количеству минут до метро
График средней цены почти не меняется, хотя есть непонятный скачок в интервале 43-48 минут. А вот график максимальной цены заметно падает с увеличением количества минут до метро!
код для графика № 5. распределение цен по количеству минут до метро
диаграмма рассеяния. распределение цен по количеству минут до метро
Линия тренда диаграммы рассеяния все же дает понять, что да — сокращение времени до метро увеличивает цену. Либо плати за машину, либо плати за квартиру, либо сиди дома.
код для диаграммы рассеяния. распределение цен по количеству минут до метро
линейчатая диаграмма. средняя цена за квадратный метр по административным округам и типу ремонта
Осталась нетронутой колонка с типом ремонта. Исправим!
Очевидно, что дизайнерский ремонт сильно повышает цену за квартиру, однако и без ремонта их продают часто дороже, чем с косметическим или евро.
код для линейчатой диаграммы. средняя цена за квадратный метр по административным округам и типу ремонта
заключение
Основные выводы по графикам уже были сделаны выше, но подытожим:
Дороже всего жить: - в центре - в большой квартире - с дизайнерским ремонтом - или даже без него - близко к метро - этаж опционально
Дешевле всего жить: - в Подольске! - или на Юго-Востоке Москвы
Выводы неутешительные. Как купить квартиру в Москве — всё ещё насущный вопрос.
описание применения генеративной модели
Ideogram: генерация изображений для обложки и цветовой палитры проекта
Adobe Color: генерация цветовой палитры на основе загруженного, сгенерированного в Ideogram, изображения
Chat GPT: генерация кода определенных типов диаграмм и графиков для последующей модернизации их вручную
Adobe Photoshop: наложение диаграммы на изображение для обложки, увеличение разрешения всех графиков, диаграмм и изображений, представленных в проекте, создание изображений с текстом кодов