Введение в проект
В рамках данного проекта был проведён анализ дискографии Ланы Дел Рей на основе табличного датасета, собранного с платформы Genius. Данные включают информацию о песнях и альбомах, датах релиза, количестве просмотров страниц песен, жанровых тегах, а также тексты песен.
Цель проекта — показать, как методы анализа данных и визуализации могут быть использованы для исследования музыкального и культурного феномена. В отличие от чисто количественного анализа, в данном проекте данные рассматриваются как способ изучения художественного языка, настроений и структуры творчества артиста.
Стилистическая концепция проекта
Для визуализаций была выбрана ограниченная цветовая палитра в вишнёвых, розовых и персиковых оттенках с добавлением синего и коричневого, что было вдохновлено обложкой и эстетикой альбома Honeymoon. Все цвета, фон и параметры шрифтов заданы напрямую в коде Python, без постобработки в графических редакторах. Такой подход обеспечивает визуальную консистентность и подчёркивает связь между данными и их визуальным представлением.
Часть 1. Динамика релизов во времени (линейный график)
Для первого этапа анализа был выбран линейный график, отображающий количество релизов по годам. Этот тип визуализации был выбран потому, что он наглядно показывает изменения во времени и позволяет увидеть общую структуру дискографии.
График демонстрирует, как распределяются релизы Lana Del Rey по годам и позволяет выделить периоды активности и паузы. Такой анализ важен для понимания того, как формируются отдельные творческие этапы и альбомные «эпохи».
Часть 2. Популярность альбомов (столбчатая диаграмма)
Во второй части проекта используется столбчатая диаграмма для сравнения популярности альбомов и релизов на основе суммарного или медианного количества просмотров страниц песен на Genius.
Данный тип графика выбран, так как он позволяет легко сравнивать категории между собой и выделять наиболее заметные релизы. Визуализация показывает, какие альбомы вызывают наибольший интерес аудитории, и позволяет сопоставить популярность разных этапов творчества.
Часть 3. Связь характеристик песен и популярности (scatter plot)
Третья визуализация представляет собой точечную диаграмму, которая используется для анализа взаимосвязи между количественными характеристиками песен, например длиной текста или позицией в треклисте, и уровнем популярности.
Этот тип графика выбран, потому что он позволяет увидеть общую тенденцию и наличие или отсутствие связи между переменными. Визуализация помогает ответить на вопрос, существуют ли закономерности между структурой песен и интересом аудитории.
Часть 4. Корреляционная матрица Спирмена
Для более системного анализа взаимосвязей между числовыми метриками была построена корреляционная матрица с использованием коэффициента Спирмена.
Данный метод выбран, поскольку он устойчив к выбросам и не требует нормальности распределений, что особенно важно для показателей популярности. Корреляционная матрица позволяет одновременно рассмотреть связи между несколькими характеристиками и выявить наиболее выраженные зависимости.
Цветовая шкала матрицы адаптирована под общую стилистику проекта и помогает интуитивно различать положительные и отрицательные корреляции.
программа для построения графика № 4
Часть 5. Лексический анализ текстов песен (облако слов)
Заключительная визуализация представляет собой облако слов, построенное на основе очищенных текстов песен. Перед построением были удалены стоп-слова и технические элементы, чтобы сохранить только содержательные слова.
Этот тип визуализации выбран как инструмент качественного анализа. Он не даёт точных количественных выводов, но позволяет визуально выделить повторяющиеся мотивы и ключевые слова, формирующие лирический образ творчества Lana Del Rey.
программа для построения графика № 5
Заключение
Проведённый анализ показал, что дискография Lana Del Rey обладает выраженной структурой как во времени, так и в распределении популярности и текстовых характеристик. Использование разных типов визуализаций позволило рассмотреть данные с нескольких сторон и объединить количественный и качественный анализ.
Проект демонстрирует, что визуализация данных может служить не только инструментом анализа, но и способом интерпретации культурных и художественных явлений.
Дисклеймер об использовании ИИ
В процессе работы над проектом использовалась генеративная модель ChatGPT (OpenAI). Модель применялась исключительно для консультаций и уточнения сложных моментов, связанных с логикой кода, параметрами визуализаций и структурированием аналитического текста.
В основном, основная логика для построения графиков и написания основного кода была выполнена самостоятельно (основная помощь понадобилась в «дизайн"-моментах по типу шлифовки датасета, задания цвета и шрифта и т. д.)
Также ИИ-модель использовалась для language ecnhancement, чтобы текст исследования звучал более академично и отшлифованно.



