Введение
В качестве анализируемого материала я выбрала базу данных «YouTube Top 100 Songs 2025» с сайта Kaggle.
Интерес к анализу этих данных появился из-за сочетания в клипах музыки и визуала, которые идеальны для креативной визуализации. А мне, как человеку, выбравшему творческую специальность, важно развивать насмотренность, ведь клипы — одни из источников вдохновения и зарождения новых трендов.
Поэтому, стало интересно проанализировать и узнать, что делает клип виральным, могут ли на просмотры влиять хэштеги или тайминг и какие клипы сейчас являются самыми просматриваемыми.
При создании графиков была использована следующая цветовая палитра: FFC8C8, FF9999, 444F5A, 3E4149.
Для визуализации данных были использованы следующие графики:
Столбчатая диаграмма Линейчатая диаграмма График «Облако слов» График рассеивания

#FFC8C8 #FF9999 #444F5A #3E4149

Импорт файла и указание цветовой палитры
График № 1.
После подключения всех нужных библиотек, можно приступать к работе с данными.
В первом графике я решила проанализировать топ 30 каналов с наибольшим количеством просмотров. Для визуализации данных была выбрана столбчатая диаграмма.
На основе получившейся диаграммы, можно увидеть самые активные каналы, за которыми наблюдают люди.
Программа для графика № 1
Столбчатый график № 1
График № 2.
Клипы снимают не только музыкальные исполнители, но и люди, которые ведут свой блог, и, чтобы разнообразить контент, они также создают свои музыкальные клипы.
Поэтому мы можем посмотреть разницу между двух категорий. Нагляднее всего сравнение можно увидеть на линейчатом графике.
Линейчатая диаграмма № 2
График № 3.
На продвижение видео немалую роль играют хэштеги, которые помогают распределять материал на разные катгории, жанры (реп, k-pop, шансон и тд), а позже показывать в рекомендациях тем, у кого похожие интересы.
Поэтому просмотр самых распространенных хэштегов — важная часть в анализе популярных клипов. Так можно узнать, какие хэштеги является ключевыми среди интересущих нас видеоматериалов.
График «Облако слов» — самый удобный способ увидеть слова, которые чаще всего встречаются в хэштегах.
Код для графика № 3
График «Облако слов» № 3
График № 4.
Также проанализируем среднюю длительность по времени клипов с рекордными просмотрами. Так мы найдём среднее по времени число секунд, которое люди смотрят.
Для визуализации данных был использован график рассеивания, который наглядно показывает разницу в просмотрах, также можно определить длительность клипов, которые наименее просматриваемые, и сделать вывод, что тайминг всё-таки влияет на количество просмотров.
График рассеивания № 4
Программа для графика № 4
График № 5.
Проанализировав отдельные пункты, которые, как мы уже определили, влияют на количество просмотров клипов на интернет платформах, можем увидеть топ 10 клипов с рекордными просмотрами.
Для визуализации данных был выбран линейчатый график, по которому можно увидеть разницу просмотров среди песен.
Линейчатая диаграмма № 5
Программа для графика № 5
Вывод
В рамках данного проекта был проведён анализ датасета «YouTube Top 100 Songs 2025», который позволил изучить влияние отдельных пунктов, таких как хэштеги, тайминг, каналы, на которых выкладываются видео, на количество просмотров у музыкальных клипов.





