Перейти к материалам
истории

Человек, Россия, дело. Какие слова появлялись на «Медузе» чаще всего? Бонус: самые длинные заголовки, материалы и слова за всю историю издания

Источник: Meduza

За пять лет существования «Медузы» мы выпустили больше 80 тысяч материалов — новостных, репортажных, разборных, развлекательных и рекламных. На русском и английском языке. Это почти 30 миллионов (!) слов. Мы проанализировали их — и выявили некоторые интересные факты и закономерности. Спойлер: в самом длинном тексте «Медузы» — больше 100 тысяч знаков.

Топ-10 слов по количеству употреблений в материалах «Медузы»*:

  1. человек
  2. Россия
  3. дело
  4. российский
  5. другой
  6. время
  7. сообщать
  8. новый
  9. говорить
  10. компания

*Из этого топа для наглядности мы исключили предлоги, местоимения и некоторые служебные глаголы. Перед тем, как анализировать слова, мы подвергли их лемматизации — проще говоря, привели их в словарную форму (именительный падеж, единственное число и так далее). Поэтому «человека» и «человеку» считались за одно и то же слово, а «человек» и «человеческий» — разные.

Самые популярные слова по рубрикам*

Новости

  1. сообщать
  2. заявлять
  3. РФ
  4. задерживать
  5. ранее
  6. сообщаться
  7. Интерфакс
  8. приговаривать
  9. фигурант
  10. подозреваемый

Истории

  1. говорить
  2. думать
  3. казаться
  4. кино
  5. вспоминать
  6. уезжать
  7. взгляд
  8. Антон
  9. поговорить
  10. муж

Разбор

  1. короче
  2. казак
  3. продолжительность
  4. депрессия
  5. теоретически
  6. антибиотик
  7. столовый
  8. грипп
  9. донор
  10. потепление

Шапито

  1. песня
  2. видео
  3. альбом
  4. трейлер
  5. ролик
  6. клип
  7. актер
  8. музыкант
  9. шоу
  10. робот

Партнерский материал

  1. онлайн
  2. верно
  3. отель
  4. угадывать
  5. бренд
  6. обучение
  7. зуб
  8. ошибаться
  9. дизайн
  10. миля

*Поскольку общеупотребительные слова встречаются одинаково часто во всех рубриках, в эти топы мы их не включали. Здесь представлены только такие слова, которые встречаются в соответствующих рубриках в несколько раз чаще, чем в среднем. Перед подсчетом все эти слова также лемматизировали.

Эмодзи, которые чаще всего употреблялись в разных рубриках*:

Новости 🎉👍🌈 

Истории ✅🥉❌

Разбор ✔🍷🚭

Шапито 🤔😂✅

Партнерские материалы 🚗📖🚄

*Этот топ составлен по абсолютному количеству употреблений эмодзи в материалах каждой из рубрик.

Самые длинные тексты «Медузы»

«Монитор-1» Главу грозненского «Мемориала» Оюба Титиева судят за наркотики. Шура Буртин рассказывает его историю — и историю современной Чечни (104252 знаков)

Встреча Михаила Лесина с сотрудниками «Эха Москвы» Полная расшифровка беседы (94567 знаков)

The Novocherkassk massacre How the Soviet authorities murdered peaceful demonstrators in 1962 and kept it a secret for decades, until the victims fought back (76357 знаков)

Диссидент, который стал идеологом Путина Полная история Глеба Павловского — человека, придумавшего современную российскую власть (73635 знаков)

Два суда одного человека Таисия Бекбулатова — о том, как председатель Конституционного суда Валерий Зорькин поменял историю России. И поменялся сам (66665 знаков)

Самые длинные слова в материалах «Медузы»:

#ВсеЕщеБезымянноеШоуКларксонаХаммондаМэя-НаAmazonPrimeКотороеВыходитОсенью2016

Из материала про то, как бывшие ведущие Top Gear не могут придумать свое новое автомобильное шоу. В итоге его назвали чуть короче: The Grand Tour.

Ллан­вайр­пулл­гвин­гилл­го­ге­рых­верн­дро­булл­ллан­ти­си­лйо­го­го­гох

Из заметки про телеведущего, который рассказал о погоде в этой замечательной деревне на севере Уэльса.

Тауматохакатангихангакоооотаматпокайухенукитанатау

Из материала про украинскую телеведущую, которая тоже произнесла название деревни из пункта выше — и про ведущего «Дождя» Павла Лобкова, который запнулся на названии холма в Новой Зеландии (том самом Таумато-что-то-там).

Коммунистически-националистически-сталинистской [направленности]

Из интервью Николая Рыбакова — руководителя штаба Григория Явлинского на президентских выборах 2018 года.

Дебильно-постановочно-пропагандистско-совковая [фотография]

Это фотограф Сергей Максимишин пересказывал комментарий к обложке своей книги «Последняя империя: 20 лет спустя».

Александр Ершов, Султан Сулейманов

Для анализа данных мы использовали программу Mystem, разработанную Ильей Сегаловичем и Виталием Титовым