Radiohead — Jigsaw Falling Into Place
Описание проекта
Группа Radiohead — один из самых культовых музыкальных коллективов, чья музыка пронизана глубокой эмоциональностью, философскими размышлениями и новаторским подходом к звучанию. Их творчество подобно путешествию сквозь музыкальные лабиринты, где каждый аккорд, каждое слово и каждая нота по-особенному отзываются в душе слушателя.
Красной нитью через все творчество группы проходит особенный сюжет. С одной стороны, это квинтэссенция (подчас почти клишированная) истории современной аномии — борьбы изолированного и обездоленного индивида с большими, обезличенными силами современного мира. С другой стороны, Radiohead интерпретируют этот извечный сюжет и характерные ему непреходящие мотивы уникально, с присущими группе художественным своеобразием и артистическим видением. От экспериментальных звуков в ранних работах до меланхоличных баллад и электронных экспериментов в более поздних альбомах, Radiohead играют с жанрами и звучанием, создавая неповторимую атмосферу.
Именно поэтому в фокусе моего внимания — группа Radiohead. Их творчество уникально и многогранно, а значит, требует глубокого разбора и исследования.
Поиски стилистического решения проекта, выполненные в Midjourney1.
Будучи большой поклонницей творчества Radiohead, я с особым трепетом и интересом подошла к этому исследованию. В качестве анализируемого материала я выбрала две базы данных (Radiohead Song Lyrics и Radiohead Gloom Index Songs) с сайта Kaggle.
В ходе анализа датасетов я посчитала подходящими следующие виды графиков, поскольку нашла их наиболее релевантными и наглядными для визуализации данных:
Гистограмма Облако слов Круговая диаграмма Пузырьковая диаграмма
1 create a cover for a project related to Radiohead songs, paper texture, red background --sref https://tinnitist.com/wp-content/uploads/2021/05/Radiohead-Amnesiac.jpg: 2 --v 6.0
В оформлении графиков я использовала обложку альбома «Amnesiac» как колористический ориентир. Кроме того, она также стала идейным образцом для обложки самого проекта, задав стилистический тон. Само изображение было выполнено при помощи Midjourney2, увеличено в Topaz Gigapixel AI и дополнено в Photoshop. Именно из этого изображения впоследствии извлекалась основная цветовая тема при помощи Adobe Color.
Таким образом, в цветовую палитру вошли цвета #90362D, #D9B589 и #F2E1C2, применявшиеся в оформлении графических элементов, и второстепенные нейтральные оттенки — #0D0D0D, #403A3A. Последние были использованы для дизайна подписей.
2 create a cover for a project related to data analysis of Radiohead songs lyrics —sref https://tinnitist.com/wp-content/uploads/2021/05/Radiohead-Amnesiac.jpg —ar 2:3 —v 6.0
Обложка альбома «Amnesiac» группы Radiohead.
Цветовая палитра.
— поиск референсов, объединение датасетов и обращение к Spotify Web API
Изначально планировалось использовать одну базу данных, однако количество предлагаемой для анализа информации в первоначальном датасете (Radiohead Song Lyrics) показалось мне скудным, поэтому я решила дополнить его значениями из другого датасета (Radiohead Gloom Index Songs). Во втором источнике меня в первую очередь интересовали данные Spotify Web API, поскольку другим способом получить их для пользователей из России затруднительно3.
Перед тем, как объединить два датасета, я сравнила их структуры. После поверхностного анализа я выявила сходства и определила, по какому ключу (столбцу) буду объединять базы данных, а именно — по принципу наименования музыкальных композиций.
3 Выдаваемая ошибка при попытке загрузить данные плейлиста в среду программирования: HTTP Error for GET to [ссылка на плейлист] with Params: {'fields': None, 'market': None, 'additional_types': 'track'} returned 403 due to Spotify is unavailable in this country.
1. Поиск несоответствий в ключах. 2. Вывод ключей, которые отсутствуют и/или заменены на другую композицию во втором датасете. 3. Добавление отсутствующих данных во второй датасет.
Объединение датасетов по столбцу 'Track Name' без сортировки, вывод и запись обновленного датасета в новый csv-файл.
После объединения баз данных я добавила недостающую информацию (которая впоследствии пригодится в анализе) по таким параметрам песен, как danceability, energy и loudness, из Spotify Web API и создала новый файл Radiohead_final.csv
Чтобы определиться с внешним видом последующей инфографики, я сделала пробные несодержательные варианты графиков.
Это помогло мне наметить не только стилистическую составляющую проекта, но и содержательную, поскольку я смогла наглядно определить, что будет более интересно реализовать в формате графика.
1. Код с первым применением цветовой палитры. 2. Пробный вариант Area Plot графика, поиски. 3. Код с попыткой имплементации цвета график с линиями. 4. Пробный вариант Box Plot графика.
Итоговые графики
Чтобы расширить свои представления о возможных итоговых графиках, я спросила у Chat GPT4, какие взаимосвязи между процессами было бы интересно изучить, имея датасет Radiohead_final.csv
Некоторые из предложенных нейросетью альтернатив вошли в финальный проект.
4 I have a database that consists of Radiohead lyrics, the year of album release, loudness, danceability, energy and valence parameters of the songs. What can I analyze and compare?
— частотность слов в песнях Radiohead
Диаграммы наглядно показывают, какие слова чаще встречаются в песнях музыкальной группы. Очевидно преобладание частоупотребимых глаголов: get, like, know, come, take. Нетипичным кажется слово hurt, которое сразу свидетельствует о депрессивном, страдальческом, печальном характере композиций. Любопытным стало и самое частоупотребимое существительное — raindrops. За все сто песен его употребляли почти 50 раз.
Удивительным показалось соседство nothing — everything. Кажется, Radiohead способны сочетать в своей лирике и эти настолько противоречащие понятия.
Стандартная гистограмма, визуализирующая частотность слов в песнях Radiohead.
Код для гистограммы частотности слов.
Облако частотности слов в песнях Radiohead.
Код для облака слов.
В облаке слов мне также было важно сохранить цветовую палитру, поэтому я попросила написать Chat GPT5 соответствующую функцию.
5 how to set multiple colors in the color_func parameter using wordcloud library?
— корреляция между разными параметрами песен Spotify Web API: valence, danceability, energy, loudness, duration_ms
Второй тип графика направлен на отслеживание корреляций между различными параметрами песен, предоставленными Spotify Web API.
Круговая диаграмма средних значений valence, danceability и energy песен Radiohead.
Все три параметра принимают значения в диапазоне от 0 до 1.
energy: описывает позитивность музыки. Треки с высоким valence звучат более позитивно (например, счастливо, жизнерадостно, эйфорично), в то время как треки с низким valence звучат более негативно (например, грустно, подавленно, сердито).
danceability: описывает, насколько трек подходит для танцев, основываясь на сочетании музыкальных элементов, включая темп, стабильность ритма, силу такта и общую регулярность.
energy: отражает восприятие интенсивности и активности. Как правило, энергичные треки кажутся быстрыми, громкими, шумными.
Таким образом, в среднем песни Radiohead звучат печально и депрессивно (valence — 0.32), не совсем подходят для танцев (danceability — 0.41) и достаточно энергичны (energy — 0.57).
Код круговой диаграммы — средних значений valence, danceability и energy песен Radiohead.
1. Средние значения valence, danceability и energy всех альбомов Radiohead. 2. Код для построения диаграмм.
1. Код построения диаграммы зависимости громкости песни от ее длины. 2. Диаграмма с акцентным элементом, выполненным с помощью encircle ().
В пузырьковой диаграмме зависимости громкости композиции от ее длительности мне захотелось акцентировать внимание на участке с, как мне показалось, большим количеством точек. Для этого я использовала функцию encircle () и с помощью Chat GPT6 имплементировала ее в программу.
6 insert function in the code and fix errors if needed:
def encircle (x, y, ax=None, **kw): if not ax: ax=plt.gca () p = np.c_[x, y] hull = ConvexHull (p) poly = plt.Polygon (p[hull.vertices,: ], **kw) ax.add_patch (poly)
Таким образом, оценивая средние значения valence, danceability и energy всех альбомов Radiohead с общими средними значениями всей дискографии, можно сделать вывод о том, что значения остаются в одном и том же диапазоне, а если и отклоняются, то незначительно. Однако любопытно, что в последнем альбоме группы A Moon Shaped Pool значение danceability несколько нетипично превышает обычные показатели. Вероятно, это связано с последними трендами и повышением спроса на более легкую, веселую, доступную музыку, под которую можно свободно танцевать.
Обращаясь к графику зависимости громкости от длительности песни, становится очевидно, что самые громкие песни находятся в примерном диапазоне от 200000 мс. до 300000 мс., что наглядно обозначается на графике отдельной фигурой.
— сравнение степени негативности песен Radiohead
Второй датасет, который я взяла и объединила с первым, изначально рассчитывал индекс «мрачности» и негативности песен Radiohead и был основан на исследовании дата-сайентиста Чарли Томпсона. Я изучила комментарии пользователей: оказалось, в большинстве случаев слушатели не согласны с результатами его анализа.
Поэтому я решила проверить и составить свой рейтинг самых негативных песен группы, а затем сравнить его с результатами исследования Томпсона (по gloom_index) и сухой сортировкой песен по показателю valence.
В своем анализе я опиралась на лингвистические и структурные особенности текстов песен Radiohead. Для этого я использовала библиотеку VADER (Valence Aware Dictionary and sEntiment Reasoner), специально созданную для анализа настроения текста и выделения позитивного, негативного и нейтрального эмоционального контента.
Для успешной имплементации библиотеки VADER в первоначальный код был задействован Chat GPT7.
7 how to use VADER with Radiohead_final.csv database, considering this data <…>
Гистограмма — рейтинг самых негативных песен Radiohead.
Как и для первой гистограммы я использовала библиотеку NLTK, однако для сортировки песен по их негативному эмоциональному оттенку я также применяю библиотеку VADER.
Рейтинг «мрачных» песен Radiohead по gloom_index и valence.
Как в сортировке по valence, так и в сортировке по gloom_index на лидирующих позициях стоит песня «True Love Waits». В рейтинге, представленном мной, эта песня не вошла даже в топ-20. Первое место в моем рейтинге занимает песня «Give Up the Ghost», которая, в свою очередь, не встречается в вышеприведенных списках негативных песен.
Однако пересечения между рейтингами все же присутствуют («All I Need», «The Tourist», «The Gloaming», «There, There», «Go to Sleep», «Burn The Witch», «My Iron Lung» — песни, вошедшие в мой и один или сразу два других рейтинга). И больше всего пересечений с рейтингом, основанном на исследовании Томпсона. Возможно, это связано с тем, что был использован схожий подход — анализ лингвистической составляющей песен.
Тем не менее, метод Чарли Томпсона, хотя и был раскритикован в сети, во многом превосходит мой подход к анализу песен Radiohead. Эмоциональность проявляется через множество факторов: смысл слов, метафор, темп, ритм, звучание, громкость — и все это следует учитывать в анализе, чтобы добиться достоверного результата.
— сравнение альбомов Radiohead по параметру лирической плотности (lyrical_density)
Следующий график иллюстрирует среднее значение лирической плотности (lyrical_density) для каждого альбома Radiohead. Этот параметр демонстрирует, какую долю от длительности трека занимают слова.
Так, самым наполненным (по количеству слов) альбомом оказался Hail to the Thief, а менее наполненным — The King of Limbs.
Самой же наполненной по словам песнью стала «Pulk/Pull Revolving Doors», незначительно обогнав «Nude».
1. Гистограмма средних значений lyrical_density для всех альбомов Radiohead. 2. Гистограмма средних значений lyrical_density для песен Radiohead.
Код для графика-сравнения альбомов Radiohead по плотности слов.
Заключение
Исследование текстов песен группы Radiohead раскрыло грустный характер их дискографии. Этот тезис подтверждает не только анализ частотности слов, но и исследование эмоциональной окраски текстов песен.
Получилось установить корреляции между разными параметрами песен, предложенными Spotify Web API: valence, danceability, energy, loudness, duration_ms. Оказалось, что песни, длящиеся от трех до пяти минут, — самые громкие.
Кроме того, были выявлены самые емкие по количеству слов альбомы и песни группы. Так называемые лидеры — альбом Hail to the Thief и песня «Pulk/Pull Revolving Doors».
Таким образом, можно утверждать, что Radiohead — крайне печальные, мрачные ребята, однако для нас, слушателей, это и так «не сюрприз».
Анализ подобных данных особенно актуален, поскольку такие исследования активно способствовуют расширению возможностей использования Spotify Web API (и др. похожих инструментов) при разработке алгоритмов рекомендаций, персонализированных предложений и рекламы, которые учитывают предпочтения пользователей на основе их прослушиваний.
Описание применения генеративной модели
Midjourney — генерация обложки и нескольких изображений (см. экраны 4-6) Chat GPT — обращения с целью генерации инструкций и рекомендаций по улучшению кода, вопросы по тому, как правильно имплементировать те или иные функции, библиотеки и т.д (см. экраны 17, 24, 32, 35) Topaz Gigapixel AI — увеличение всех представленных изображений: сгенерированных картинок, диаграмм, скриншотов кода Adobe Color — генерация цветовой палитры и ее редактирование на основе загруженного изображения