Человек, Россия, дело. Какие слова появлялись на «Медузе» чаще всего? Бонус: самые длинные заголовки, материалы и слова за всю историю издания
За пять лет существования «Медузы» мы выпустили больше 80 тысяч материалов — новостных, репортажных, разборных, развлекательных и рекламных. На русском и английском языке. Это почти 30 миллионов (!) слов. Мы проанализировали их — и выявили некоторые интересные факты и закономерности. Спойлер: в самом длинном тексте «Медузы» — больше 100 тысяч знаков.
Топ-10 слов по количеству употреблений в материалах «Медузы»*:
- человек
- Россия
- дело
- российский
- другой
- время
- сообщать
- новый
- говорить
- компания
*Из этого топа для наглядности мы исключили предлоги, местоимения и некоторые служебные глаголы. Перед тем, как анализировать слова, мы подвергли их лемматизации — проще говоря, привели их в словарную форму (именительный падеж, единственное число и так далее). Поэтому «человека» и «человеку» считались за одно и то же слово, а «человек» и «человеческий» — разные.
Самые популярные слова по рубрикам*
Новости
- сообщать
- заявлять
- РФ
- задерживать
- ранее
- сообщаться
- Интерфакс
- приговаривать
- фигурант
- подозреваемый
Истории
- говорить
- думать
- казаться
- кино
- вспоминать
- уезжать
- взгляд
- Антон
- поговорить
- муж
Разбор
- короче
- казак
- продолжительность
- депрессия
- теоретически
- антибиотик
- столовый
- грипп
- донор
- потепление
Шапито
- песня
- видео
- альбом
- трейлер
- ролик
- клип
- актер
- музыкант
- шоу
- робот
Партнерский материал
- онлайн
- верно
- отель
- угадывать
- бренд
- обучение
- зуб
- ошибаться
- дизайн
- миля
*Поскольку общеупотребительные слова встречаются одинаково часто во всех рубриках, в эти топы мы их не включали. Здесь представлены только такие слова, которые встречаются в соответствующих рубриках в несколько раз чаще, чем в среднем. Перед подсчетом все эти слова также лемматизировали.
Эмодзи, которые чаще всего употреблялись в разных рубриках*:
Новости 🎉👍🌈
Истории ✅🥉❌
Разбор ✔🍷🚭
Шапито 🤔😂✅
Партнерские материалы 🚗📖🚄
*Этот топ составлен по абсолютному количеству употреблений эмодзи в материалах каждой из рубрик.
Самый длинный заголовок (192 знака)
В топ-20 самых длинных заголовков — 18 у материалов англоязычной версии «Медузы». Самый длинный русскоязычный заголовок (175 знаков):
Самые длинные тексты «Медузы»
«Монитор-1» Главу грозненского «Мемориала» Оюба Титиева судят за наркотики. Шура Буртин рассказывает его историю — и историю современной Чечни (104252 знаков)
Встреча Михаила Лесина с сотрудниками «Эха Москвы» Полная расшифровка беседы (94567 знаков)
The Novocherkassk massacre How the Soviet authorities murdered peaceful demonstrators in 1962 and kept it a secret for decades, until the victims fought back (76357 знаков)
Диссидент, который стал идеологом Путина Полная история Глеба Павловского — человека, придумавшего современную российскую власть (73635 знаков)
Два суда одного человека Таисия Бекбулатова — о том, как председатель Конституционного суда Валерий Зорькин поменял историю России. И поменялся сам (66665 знаков)
Самые длинные слова в материалах «Медузы»:
#ВсеЕщеБезымянноеШоуКларксонаХаммондаМэя-НаAmazonPrimeКотороеВыходитОсенью2016
Из материала про то, как бывшие ведущие Top Gear не могут придумать свое новое автомобильное шоу. В итоге его назвали чуть короче: The Grand Tour.
Лланвайрпуллгвингиллгогерыхверндробуллллантисилйогогогох
Из заметки про телеведущего, который рассказал о погоде в этой замечательной деревне на севере Уэльса.
Тауматохакатангихангакоооотаматпокайухенукитанатау
Из материала про украинскую телеведущую, которая тоже произнесла название деревни из пункта выше — и про ведущего «Дождя» Павла Лобкова, который запнулся на названии холма в Новой Зеландии (том самом Таумато-что-то-там).
Коммунистически-националистически-сталинистской [направленности]
Из интервью Николая Рыбакова — руководителя штаба Григория Явлинского на президентских выборах 2018 года.
Дебильно-постановочно-пропагандистско-совковая [фотография]
Это фотограф Сергей Максимишин пересказывал комментарий к обложке своей книги «Последняя империя: 20 лет спустя».