Исходный размер 1140x1600

Атлас языкового разнообразия

PROTECT STATUS: not protected

Концепция

Языки мира можно представить как карту голосов. Одни языки объединены в крупные семьи, другие существуют как изоляты без известных родственников. Одни распространены в больших регионах, другие привязаны к конкретным точкам. Вместе они образуют не политическую карту стран, а более сложный слой человеческой культуры.

Этот проект рассматривает языки не через количество говорящих, а через их распределение в пространстве: где языков больше, как они связаны с языковыми семьями, какие статусы встречаются чаще и где появляются языки-изоляты.

Главный вопрос проекта: как языковое разнообразие распределено по миру — по регионам, координатам, семьям, статусам и изолятам?

Цель проекта

Цель инфографики — показать языковое разнообразие как живую систему, а не как список отдельных языков. В датасете нет информации о числе носителей, поэтому проект не сравнивает языки по популярности. Вместо этого он показывает другую сторону языкового мира: количество языков, их географию, классификацию и состояние.

Такой подход помогает увидеть, что языковая карта мира не совпадает с привычной картой государств. Языки образуют плотные зоны, семейные группы, отдельные «острова» и области с разным уровнем устойчивости.

Данные

Для анализа использован датасет 22_Languages_of_the_World.csv.

Файл содержит 8612 языков и 12 колонок. В данных есть название языка, macroarea, широта, долгота, ISO-код, страны, признак изолята, идентификатор языковой семьи, название семьи, код статуса и текстовое описание статуса.

В таблице есть пропуски, но полных дубликатов не обнаружено. Основные поля, которые использовались в проекте: name, macroarea, latitude, longitude, countries, is_isolate, family_id, family, status_code и status_label.

Важное ограничение: в датасете нет количества говорящих. Поэтому выводы проекта относятся не к числу людей, говорящих на языках, а к количеству самих языков и их классификационным признакам.

Основной вывод

Языковое разнообразие распределено неравномерно. В одних macroarea сосредоточены тысячи языков, в других — значительно меньше. При этом крупные языковые семьи формируют большие классификационные ветви, а изоляты выглядят как отдельные острова внутри общего атласа.

Главный вывод проекта: языковая карта мира — это не карта большинства, а карта разнообразия. Она показывает не то, где живёт больше людей, а где сосредоточено больше языковых форм, связей и уникальных систем.

График 1. Языки по macroarea

Первый график показывает, сколько языков относится к каждой macroarea. Этот блок задаёт масштаб проекта и показывает, что языки распределены по регионам неравномерно.

Исходный размер 3840x2400

График 2. Карта языковых координат

Второй график показывает языки как точки на карте по широте и долготе. Это не карта границ, а карта присутствия языков.

Исходный размер 4050x2340

График 3. Крупнейшие языковые семьи

Третий график показывает крупнейшие языковые семьи по количеству языков. Здесь важно, что речь идёт именно о числе языков внутри семьи, а не о числе говорящих.

Исходный размер 3900x2550

График 4. Статусы языков

Четвёртый график показывает распределение языков по status_label. Этот слой добавляет к атласу состояние языков.

Исходный размер 3750x2400

График 5. Изоляты и языки с семьями

Пятый график сравнивает языки-изоляты и языки, связанные с языковыми семьями, по macroarea. Изоляты воспринимаются как отдельные языковые острова внутри общего атласа.

Исходный размер 3900x2460

Визуальное решение

Для проекта была разработана отдельная дизайн-система — Linguistic Atlas / Living Voices.

Её основа — образ живого языкового атласа. Визуальная система объединяет картографию, топографические линии, точки координат, волны и слои данных. Языки представлены не как флаги стран и не как декоративные буквы, а как точки, связи, контуры и плотности.

Цветовая палитра построена на глубоком atlas blue, ocean teal, parchment sand, language gold и signal coral. Она отсылает к старым картам и научным атласам, но не уходит в музейную сухость.

Обложка

Обложка сделана как самостоятельный визуальный образ. Она не повторяет постер и не содержит слов, букв, цифр, логотипов или флагов.

Визуально обложка работает как абстрактный языковой атлас: тёмный фон, контуры материков, точки голосов, топографические линии и волновые структуры.

Исходный размер 1122x1402

Инфографика

Финальная инфографика выполнена в формате вертикального постера. Она объединяет пять аналитических блоков: языки по macroarea, карту координат, крупнейшие языковые семьи, статусы языков и изоляты.

Постер построен как картографическая система. Главная карта задаёт общий образ языкового мира, а нижние блоки раскрывают отдельные слои данных.

Исходный размер 1024x1536

Мокапы

Для демонстрации носителя подготовлены три отдельных мокапа с разными ролями.

Первый мокап показывает общий вид постера в выставочной или учебной среде. Второй показывает крупный фрагмент печати: фактуру бумаги, рельефные точки, золотые линии и детализацию карты. Третий мокап показывает постер в рабочем сценарии исследователя или картографа.

Исходный размер 1536x1024
Исходный размер 1536x1024
Исходный размер 1536x1024

Использование ИИ

ИИ использовался для поиска визуальной метафоры, генерации обложки, финальной инфографики и мокапов. Также с помощью ChatGPT была выстроена структура проекта и подготовлен текст лонгрида. Анализ данных, расчёты и построение графиков выполнялись отдельно в Python.

Процесс

Работа началась с анализа CSV-файла. На этом этапе были проверены структура данных, пропуски, дубликаты и доступные переменные.

После первичного анализа стало понятно, что в датасете нет количества говорящих. Поэтому концепция была перестроена: вместо сравнения языков по популярности проект сосредоточился на географии, языковых семьях, статусах и изолятах.

Затем в Python были построены пять графиков. Данные были агрегированы по macroarea, языковым семьям, статусам и признаку изолята. Координаты широты и долготы использовались для создания карты языковых точек.

После аналитического этапа была разработана отдельная дизайн-система проекта. На её основе были созданы обложка, финальная инфографика и три мокапа, демонстрирующие разные сценарии существования постера.

Итог

Проект показывает, что языковое разнообразие мира нельзя свести к числу говорящих или к списку крупнейших языков. Даже без данных о населении можно увидеть сложную структуру: регионы с высокой плотностью языков, крупные семьи, разные статусы и отдельные языки-изоляты.

Главный вывод проекта: языки мира образуют живой атлас. Это не просто набор названий, а сеть координат, родственных связей, статусов и уникальных культурных точек.

Атлас языкового разнообразия
Проект создан 14.06.2026
Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную...
Показать больше