
Let the games begin!
Taylor Swift

Концеция
Тейлор Свифт стала для меня артисткой, чьи песни сопровождали разные этапы жизни и часто совпадали с личными переживаниями. В её текстах много внимания уделяется чувствам, внутренним конфликтам и процессу взросления. Через образы и эмоции формируется ощущение диалога с собой и слушателем, где важно не только событие, но и то, как оно проживается.
Вдохновением для проекта стал концертный тур The Eras Tour Тейлор Свифт, который объединяет разные периоды её карьеры в одном пространстве и времени. Это подтолкнуло меня взглянуть на её творчество целостно и попробовать проанализировать тексты песен с точки зрения данных. Мне интересно увидеть, какие слова и темы повторяются чаще всего, как меняется эмоциональный фон и какие мотивы остаются ключевыми на протяжении всего творчества.

Визуальный стиль эры Reputation в The Eras Tour
Музыка Тейлор Свифт охватывает разные этапы жизни и эмоциональные состояния, от наивных и романтичных до более сложных и рефлексивных. В её текстах часто повторяются мотивы памяти, расставаний, внутреннего диалога и переосмысления прошлого, что делает их близкими и узнаваемыми для многих слушателей и меня. Именно это разнообразие и последовательность изменений побудили меня взглянуть на её творчество не только как на музыку, но и как на материал для анализа.
Это подтолкнуло меня к идее проанализировать тексты песен с точки зрения данных и проследить, какие темы и образы остаются ключевыми на протяжении всего творчества. В качестве материала для анализа в проекте используется база данных с текстами песен Тейлор Свифт, на основе которой строятся визуализации и выводы, взятые с платформы Kaggle, но, к сожалению, файл был немного поврежден и содержал излишние данные, поэтому пришлось его редактировать и доводить до ума.
В ходе анализа данных для визуализации я решил сгенерирвать такие виды графиков как:
Цветовая палитра эры
Цветовая палитра проекта была собрана с помощью сервиса Adobe Color и основана на визуальной эстетике эры Reputation в концертном туре The Eras Tour. Эта часть шоу отличается тёмной, контрастной и напряжённой визуальной подачей, которая хорошо отражает более жёсткий и закрытый образ Тейлор Свифт в этот период её творчества.
При выборе оттенков я ориентировался на сценические образы, световое оформление и общее настроение эры Reputation, где преобладают чёрный цвет и резкие акценты. Использование тёмного фона и контрастных цветов делает визуализации более цельными и связывает их с выбранной музыкальной эпохой.
Процесс работы и графики
Перед началом работы с визуализациями я подготовил рабочую среду: импортировал необходимые библиотеки, загрузил файл с данными и проверил его структуру в соответствии с установочными требованиями. Этот этап был важен, чтобы убедиться, что данные корректно считываются и готовы к дальнейшему анализу, а все последующие графики будут построены на надёжной основе.
Код установки библиотек и импорта данных
Столбчатые диаграммы
В первую очередь я решил посмотреть, как распределяются песни Тейлор Свифт по альбомам. Для этого я использовал столбчатую диаграмму, так как она позволяет без искажений сравнить количество треков в разных релизах. Я сгруппировал данные по альбомам и посчитал число уникальных песен в каждом из них, после чего отобразил результаты на графике. Такой формат я выбрал, потому что он сразу показывает различия между альбомами и помогает понять общую структуру дискографии, не навязывая интерпретаций.
Код для генерации диаграммы количества песен в альбмах
По диаграмме видно, что основные студийные альбомы Тейлор Свифт имеют сопоставимое количество песен и занимают большую часть всей дискографии. Сборники, демо-записи и EP заметно уступают им по объёму и представлены гораздо скромнее. Я делаю акцент на этом различии, потому что оно показывает, что именно полноформатные альбомы являются для Тейлор Свифт основным способом высказывания, тогда как остальные релизы скорее дополняют её творчество, а не формируют его основу.
После анализа количества песен в каждом альбоме я перешёл к сравнению объёма текстов. Для этого я сгруппировал данные по альбомам и посчитал количество строк текста, приходящихся на каждый из них. Затем я отсортировал результаты и представил их в виде столбчатой диаграммы, чтобы наглядно сравнить альбомы между собой. Я выбрал такой формат визуализации, поскольку он позволяет без дополнительных пояснений увидеть различия в насыщенности текстов и понять, где лирика играет более заметную роль, а где она выглядит более сдержанной.
Код для генерации диаграммы количества строк текста в альбмах
Диаграмма показывает, что наибольший объём текстов сосредоточен в альбомах, относящихся к ключевым этапам карьеры Тейлор Свифт. В этих релизах количество строк заметно выше, что указывает на более детальную и развернутую работу с текстом. Я обращаю внимание на это различие, потому что оно помогает понять, что именно основные альбомы становятся пространством для сложных историй и личных высказываний, тогда как сборники и дополнительные релизы выполняют скорее поддерживающую роль и остаются более компактными.
Далее я решил посмотреть, как в разных альбомах используются отдельные слова. Для этого я выбрал несколько простых и часто встречающихся слов и посчитал, как часто они появляются в текстах каждого альбома. Такой подход позволяет нейтрально зафиксировать различия в лексике между релизами. Я выбрал именно этот тип визуализации, потому что он помогает проследить, как со временем меняется язык песен и какие темы в разные периоды становятся более заметными.
Код для генерации диаграммы частоты выбранных слов по альбомам
График показывает, что одни и те же слова распределяются по альбомам неравномерно. В ранних и более поп-ориентированных релизах чаще встречаются слова, связанные с любовью и романтическими переживаниями, такие как love и heart. В более поздних альбомах их частота снижается, а лексика становится более сдержанной и точечной. Я делаю на этом акцент, потому что такое распределение наглядно отражает изменения в том, как Тейлор Свифт говорит о чувствах и как со временем трансформируется её авторский язык.
Круговая диаграмма
После анализа столбчатых диаграмм я перешёл к более обобщённому представлению данных и построил круговую диаграмму. В ней я выделил пять альбомов с наибольшим количеством песен, а остальные объединил в категорию «Другое». Я выбрал такой формат, потому что он позволяет сразу увидеть соотношение основных релизов и вспомогательных выпусков и упростить восприятие общей структуры дискографии.
Код для генерации диаграммы распределения песен по альбомам
Диаграмма показывает распределение песен между альбомами и позволяет увидеть, какие релизы занимают наибольшую долю в общей дискографии. Я делаю акцент на этом результате, потому что он подтверждает, что основная часть песен сосредоточена в нескольких крупных альбомах, тогда как сборники и дополнительные релизы выполняют скорее вспомогательную функцию и не формируют ядро творчества.
Линейный график
Затем я посмотрел, как менялось количество выпускаемых песен по годам, сгруппировав данные по году релиза. Линейный график позволяет нейтрально зафиксировать общую динамику и увидеть периоды роста и снижения активности. Я выбрал именно такой тип визуализации, потому что он хорошо показывает изменения во времени и помогает проследить, в какие годы Тейлор Свифт выпускала больше музыки, а когда делала паузы или ограничивалась небольшими релизами.
Код для генерации диаграммы количества песен по годам релиза
График показывает, что количество выпускаемых песен по годам в целом остаётся относительно стабильным, но при этом заметны отдельные всплески и спады. Пики приходятся на годы выхода крупных альбомов, тогда как снижение активности совпадает с промежутками между релизами или переходными этапами. Я обращаю внимание на эту динамику, потому что она наглядно демонстрирует, что творчество Тейлор Свифт развивается не линейно, а через чередование периодов активной работы и осознанных пауз.
Облако слов
В завершение анализа я обобщил работу с текстами и посмотрел, какие слова в песнях Тейлор Свифт встречаются чаще всего в целом. Для этого я построил облако слов, предварительно очистив тексты от служебных элементов и повторов, чтобы зафиксировать именно наиболее значимые слова. Я выбрал этот формат, потому что он позволяет в сжатом виде показать общий языковой и эмоциональный фон творчества, а использование общей цветовой палитры и чёрного фона связывает визуализацию с остальными элементами проекта и делает её более выразительной.


Код для генерации облака слов
Результат показывает, что в лирике Тейлор Свифт чаще всего встречаются слова, связанные с чувствами, внутренними состояниями и личным переживанием, такие как love, know, feel и want. Это позволяет зафиксировать общий эмоциональный и тематический фон её текстов без привязки к отдельным альбомам или временным периодам. Я завершаю анализ именно этой визуализацией, потому что облако слов наиболее наглядно обобщает предыдущие наблюдения и, при этом, визуально выделяется среди остальных графиков, делая итог анализа более цельным и запоминающимся.
Заключение
Работа над проектом показала, что тексты песен Тейлор Свифт можно рассматривать не только как эмоциональные истории, но и как структурированный материал для анализа. Использование графиков и визуализаций помогло увидеть повторяющиеся темы, изменения в настроении и особенности лирики, которые сложно уловить при обычном прослушивании. Такой подход позволяет по-новому взглянуть на её творчество и заметить, как разные периоды карьеры связаны между собой.
Описание применения генеративной модели
Chat-GPT использовался для запросов, связанных с разработкой и оптимизацией компьютерного кода. Adobe Color использовался для автоматического создания цветовой палитры, используя загруженное изображение в качестве основы.