МГУ построил новый суперкомпьютер почти за три миллиарда рублей. Его задача — развитие технологий искусственного интеллекта. За них в университете отвечает дочь Путина Расследование T-invariant
МГУ объявил о создании «второго-третьего в мире по мощности» суперкомпьютера, закупив для этого комплектующие через китайскую фирму, торгующую на AliExpress. «МГУ-270» обошелся федеральному бюджету как минимум в 2,8 миллиарда рублей: именно столько, судя по данным сайта госзакупок, МГУ заплатил за комплектующие под торговой маркой, которой не существует на мировом рынке. Работать с машиной при этом позволено только сотрудникам самого МГУ, тогда как ранее заявки на вычисления на топовых суперкомпьютерах университета могли подавать любые российские академические НИИ и вузы. Главный академический супервычислитель будет специализироваться на тематике искусственного интеллекта (ИИ), а профильный институт ИИ в МГУ возглавляет Катерина Тихонова. Издание T-invariant рассказывает, почему самый современный университетский суперкомпьютер России, который по всем показателям должен оказаться в верхней части мирового Топ-500, там не числится. «Медуза» публикует материал T-invariant с незначительными правками.
Запуск «МГУ-270» стал сюрпризом даже для сотрудников самого университета
Коллектив МГУ — даже научные сотрудники, проводящие вычисления на суперкомпьютере «Ломоносов-2» и находящиеся в контакте с профильным университетским Научно-исследовательским вычислительным центром (НИВЦ), — узнали о запуске «МГУ-270» из СМИ. Об этом T-invariant заявили не менее 10 собеседников в университете.
О запуске ректор МГУ Виктор Садовничий объявил 30 августа 2023 года:
Мы официально открываем новый, созданный нами, супервычислитель. Это 400 петафлопс. Он, может быть, будет вторым-третьим в мире по мощности.
Пресс-служба МГУ распространила более подробную информацию спустя два дня: на машине планируют создавать российские языковые модели, аналогичные ChatGPT.
Пресс-служба МГУ сообщает следующую информацию. Компьютер поможет в проведении научных исследований в области искусственного интеллекта (ИИ) и решении задач по разработке российского программного обеспечения. Компьютер с новой архитектурой, основанной на активном использовании графических процессоров, составит единый вычислительный кластер с суперкомпьютером «Ломоносов-2».
Суммарная производительность нового суперкомпьютера составит 400 AI Петафлопс (точность вычислений не указывается). Архитектура компьютерной системы была «вдохновлена» передовыми образцами реализованных проектов суперкомпьютеров в лучших университетах мира, а используемые технологии основаны на практиках и существующих разработках ведущих производителей.
В качестве вычислительной сети используется сеть с пропускной способностью 200 Гигабит в секунду. Она обладает высокой надежностью и характеризуется минимальными задержками. Сеть хранения имеет аналогичные показатели. Для управления и интеграции с внешними системами выбрана сеть с пропускной способностью 100 Гигабит в секунду и необходимым резервированием компонентов. В супервычислительный комплекс также входят новые системы энергообеспечения, охлаждения и коммуникации. При создании комплекса активно применялись отечественные узлы и компоненты.
«Мы узнали об этом из новостей. [Новый суперкомпьютер] вообще многих застал врасплох. Мы в нашей группе гуглили, что же получилось. Разные одиозные личности, не будем их называть, стали говорить, что это лучший компьютер в мире, «аналоговнет». Наша лаба постоянно работала на «Ломоносов-2», и мы вообще были не в курсе, начали связываться с коллегами, собирали информацию по крупицам. Стало ясно, что все делалось в обстановке секретности», — рассказывает бывший сотрудник университета с опытом расчетов на суперкомпьютерах МГУ.
Опрошенные T-invariant специалисты из индустрии отказались всерьез комментировать слова Садовничего о том, что получившаяся машина — «вторая-третья в мире по мощности». «Никто не будет обсуждать это профанство. Ими принято решение не подаваться в рейтинг [Топ-500] суперкомпьютеров. Ну, тогда и комментировать нечего», — заявил руководитель одной из суперкомпьютерных компаний.
По официальной версии, суперкомпьютер должен решать целый комплекс задач, связанных с ИИ
Приказ «Об эффективном функционировании исследовательского аппаратно-программного комплекса «270 лет МГУ»» появился 7 сентября 2023 года (есть в распоряжении T-invariant). Для реализации проекта в университете был сформирован управляющий комитет во главе с Садовничим, который включает в себя еще 13 человек.
В этом же приказе перечислены основные вычислительные задачи.
- прогнозирование качества гетерогенных каналов в сетях передачи данных на основе вероятностных моделей и методов машинного обучения;
- развитие комбинированных методов молекулярного моделирования и машинного обучения;
- разработка алгоритмов ИИ для работы с данными графового типа;
- разработка математических методов машинного обучения для обработки текстовой информации большого объема;
- интеллектуальный анализ изображений для широкого круга задач, включая высокопроизводительное фенотипирование растений и задачи точного земледелия;
- разработка нейросетевых подходов к задачам установок мегасайнс;
- интеллектуальный анализ больших данных многоволновых телескопов и космических миссий, динамическое моделирование эволюции галактик по 3D-стереоскопическим данным.
Все суперкомпьютеры МГУ обычно курируются Научно-исследовательским вычислительным центром (НИВЦ) МГУ. В этот раз в сообщении пресс-службы подчеркивалось, что «МГУ-270» станет рабочим инструментом механико-математического факультета и факультета вычислительной математики и кибернетики (ВМК), а также научно-образовательных школ МГУ «Математические методы анализа сложных систем» и «Мозг, когнитивные системы, искусственный интеллект».
«МГУ-270» может ускорить «появление решений, которые смогут помочь преподавателям контролировать внимание младших школьников на уроках, — рассказал тогда ТАСС декан факультета ВМК МГУ Игорь Соколов:
Мы занимаемся сейчас помощью учителям: младшие школьники очень быстро теряют внимание. Учитель должен быстро это отслеживать и реагировать, а это буквально несколько минут. Поэтому <…> [необходимы] системы, которые будут подсказывать учителю, на кого обратить внимание.
На «МГУ-270» потратили не менее 2,8 миллиарда рублей. Это почти в десять раз меньше, чем может стоить суперкомпьютер такого уровня
Известно о двух распоряжениях правительства РФ по выделению финансирования на «МГУ-270». 16 декабря 2021 года появился документ, в котором ставилась задача успеть выделить в том же году МГУ 1,182 миллиарда рублей на аппаратно-программный комплекс для исследования в области ИИ. Второй документ датирован 31 марта 2022 года — в нем говорится о 2,424 миллиарда рублей на те же цели.
Судя по сайту госзакупок (первый и второй контракты), МГУ провел два тендера с единственным участником. Один контракт — на 1,935 миллиарда рублей, второй — на 899 миллионов. То есть всего потратили около 2,8 миллиарда.
Можно ли оценить бюджет «МГУ-270»? Открытой информации, сколько стоила тем или иным странам сборка суперкомпьютеров, входящих в мировой Топ-50, не существует. Есть только предположения экспертов. По мнению крупнейшего российского специалиста по суперкомпьютерам Сергея Абрамова, супервычислитель номер один в рейтинге Топ-500 может стоить до 250 миллионов долларов.
Если считать формально, то «МГУ-270» обошелся российскому бюджету в 25-28 миллионов долларов. Сколько из этой суммы осело в цепочках импорта, опрошенные T-invariant эксперты оценивать не берутся. Однако схема покупки была достаточно типичной для последних «санкционных» лет, о чем более подробно речь пойдет ниже.
Строитель «МГУ-270» давно занимается импортозамещением западных технологий и имеет клиентов среди организаций российского ВПК
Исполнителем обоих контрактов на создание суперкомпьютера МГУ стала компания ООО «Арго Технолоджи Ист». Один из ее учредителей — Андрей Кучинский. Ранее он работал директором по продажам в компаниях Hewlett-Packard, EMC, Dell EMC, Lenovo. В EMC Россия и СНГ предприниматель занимал должность директора по работе с партнерами.
Сейчас на рынке больше известна другая компания — ООО «Майнд Софт», — в которой Кучинский занимает должность генерального директора. Наиболее заметны ее контракты по созданию облачных сервисов в качестве импортозамещения ушедших западных компаний: для «Мегафона» или «Билайна», а также для государственной облачной системы «Базис». Также «Арго Технолоджи Ист» была запатентована система хранения данных (СХД) «Арго». Ее активно продвигал на российский рынок крупнейший вендор — ГК «Ланит». «Арго Технолоджи Ист» давно занимается импортозамещением ключевых технологий, а о существовании швейцарской компании с аналогичным названием (Argo Technologie S.A.) известно как минимум с 2015 года.
Еще в 2021 году сообщалось, что СХД «Арго» используется в системе взимания платы с грузовых автомобилей «Платон», а также в инфраструктуре НТЦ «Модуль» (создан в начале 1990-х, учредители — крупнейшие организации военно-промышленного комплекса (ВПК) РФ: НПО «Вымпел» и НИИ «Радиоприборостроения»). При этом в работе «Модуля» применялась высокопроизводительная СХД «Арго» с прицелом на задачи ИИ. Портал Cnews сообщал, что там установлен «второй по производительности в России кластер DGX NVIDIA». Поэтому можно сделать вывод, что «Арго Технолоджи Ист» была выбрана для поставок оборудования для «МГУ-270» не случайно.
Кучинский — также гендиректор ООО «ЦТТ МИРЭА». Эта компания создана Центром технологической поддержки образования крупнейшего технического университета России, более 70 лет работающего на российский ВПК — МИРЭА (Российский технологический университет; ранее — Московский институт радиотехники, электроники и автоматики). Центр базируется в Институте искусственного интеллекта этого вуза.
T-invariant попросил Кучинского о комментарии, но на момент публикации не получил ответа.
В МИРЭА много занимаются тематикой БПЛА, в том числе с помощью возможностей ИИ. Вуз сообщает, что в ускоренном режиме производит БПЛА, которые тестируются 45-й бригадой ВДВ Вооруженных сил РФ. А еще в вузе разработали комплекс антидронного радиопротиводействия в двух версиях: «Вивальди-К» и «Вивальди-Р». При этом в это же время МИРЭА в обход санкций Канады купил за 4,5 миллиона рублей канадский радар-детектор для обнаружения беспилотников и три антидроновых ружья «Дрон 1200» за 400 тысяч рублей.
Суперкомпьютер для МГУ собрали из комплектующих несуществующего бренда из КНР. На самом деле это могут быть технологии Nvidia
До полномасштабного вторжения России в Украину суперкомпьютеры в России собирались в прямой коммуникации с ведущими технологическими гигантами: NVIDIA, Intel, IBM, HPE и другими. Закупка комплектующих сопровождалась сервисной и инженерной поддержкой. Вот как описывал процесс в интервью T-invariant Сергей Абрамов:
Серьезный чип через параллельный импорт привезти — полдела. Каждый проект уровня Топ-500 (тем более Топ-100) — это не просто закупка железок. Когда все было нормально, мы не просто закупали, мы напрямую общались с компаниями. Как пример: мне приходилось общаться с вице-президентами Intel. Мы с ними обсуждали проект, чтобы определенная партия процессоров была в срок нам доступна, чтобы они вписывали ее в свои планы, чтобы были правильные цены и чтобы мы вместе продвигали проект в СМИ. Нам выделялась горячая инженерная поддержка в случае проблем. Инженерная поддержка критична: такие системы строятся на самых новых, не совсем обкатанных чипах. И если возникали проблемы, то наши разработчики и инженеры Intel (или AMD, или Mellanox, или NVIDIA, или Dolphin) порою часами и днями плотно общались (email, телефон — проблема должна быть решена).
Как собирался суперкомпьютер «МГУ-270»? В документации на сайте госзакупок все закупаемые комплектующие значатся под брендом SOLAR PEAK («Солнечный пик»). Эта торговая марка значится в декларациях Евразийского экономического союза (ЕАЭС), однако такого бренда на мировом рынке не существует.
T-invariant смог найти упоминание SOLAR PEAK в декларациях о соответствии с требованиями технического регламента ЕАЭС самой «Арго Технолоджи Ист». Там же указана китайская компания, поставляющая продукцию под этим брендом. Она называется GREATZC TECHNOLOGY (HK) LIMITED и, например, торгует техникой на сайте AliExpress.
Также компания находится в списках организаций, поставляющих товары в Казахстан. Встречается упоминание марки SOLAR PEAK от GREATZC TECHNOLOGY в декларациях компании «Имэкспрофи». Последняя специализируется на поставках из Китая и разместила на сайте такой рекламный текст (стилистика, пунктуация и орфография сохранены):
В новых логистических реалиях командой из 25 сотрудников, начиная со сложного 2022 года, мы привезли более 900 поставок из-за рубежа, в основном с оборудованием.
T-invariant отправил запрос о комментарии на почту GREATZC TECHNOLOGY, но на момент публикации не получил ответа.
Все комплектующие в тендерной заявке подписаны как SOLAR PEAK, но если искать информацию по другим параметрам закупаемых кабелей, узлов, модулей и прочего, оборудование идентифицируется как продукция Nvidia (а коммутаторы — как Huawei), которая прекратила все официальные отношения с российским рынком после 24 февраля 2022 года. T-invariant отправил запрос в европейский, китайский и американский офисы Nvidia и на момент публикации не получил ответов.
Компания GREATZC TECHNOLOGY, судя по ее сайту, преимущественно торгует встраиваемой компьютерной техникой. «Сегмент очень специфичный. Чаще всего это бортовая техника для авиации, транспорта, включая военную технику, конечно. Стационарная тоже может быть, но реже — для работы в тяжелых условиях: пыль, грязь, карьеры, шахты, химпроизводство, что-то такое», — объясняет T-invariant эксперт рынка.
В свою очередь инженер, знакомый с правилами работы Nvidia, комментирует предполагаемые поставки комплектующих компании в Россию так:
У Nvidia жесткая политика по противодействию нелегальному импорту и обходу санкций. Проводятся регулярные тренинги среди сотрудников. Но если китайская компания купила ее легально, то дальше она может перепродать комплектующие, и что с этим можно сделать?!.. Что касается сервисной и инженерной поддержки, то тут могут быть два варианта. В первом случае «черный» конечный покупатель, не имея саппорта с нашей стороны, теряет в производительности 20-30%, но получает, тем не менее, рабочую машину. Во втором случае условная китайская компания может собрать тестовый кластер у себя, апробировать новое «железо», процессоры, посмотреть, все ли работает, получив всю необходимую поддержку от Nvidia.
Работать на «МГУ-270» смогут только сотрудники МГУ (и то, вероятно, не все). «Чужакам» машина будет доступна в исключительных случаях
На предыдущих суперкомпьютерах МГУ («Чебышев», «Ломоносов» и «Ломоносов-2») заявку на вычисления мог оставить любой коллектив из любого вуза или НИИ России.
«Я не помню, чтобы кому-то с адекватным запросом отказывали. Более того — самыми интересными работами других организаций отчитывались перед чиновниками, самыми передовыми исследованиями гордились и собирали в годовой отчет. Момент престижа очень важен: МГУ показывал, что хорошая наука делается на «Ломоносове». А сами научные группы должны были в своих отчетах (например, грантовых) сообщать, что результаты были получены с помощью «Ломоносова» и присылать в НИВЦ отчеты на полстранички о результатах. Особенно региональным ученым помогали с доступом инфраструктурные гранты РНФ. С «МГУ-270» это работает не так: на нем, как я понимаю, считают только МГУшники», — рассказывает T-invariant бывший сотрудник университета с опытом расчетов на суперкомпьютерах МГУ.
С ним согласен и руководитель одной из крупнейших компаний отрасли: «Машину контролируют специальные люди, которые теперь гораздо бóльшую роль играют в любом университете, — люди в погонах. Насколько я знаю, доступ ограничен даже внутри МГУ, работать дают только отдельным группам и людям, политически зрелым и проверенным».
«Процедура получения доступа всегда была очень прозрачна, — рассказывает один из сотрудников МГУ. — В публичном доступе есть документы и список организаций, которые работали на суперкомпьютерах «Ломоносов». Раньше для получения доступа писали письмо на имя ректора МГУ с просьбой предоставить доступ конкретным сотрудникам (примеры есть в распоряжении T-invariant)».
Сейчас же правила изменились, и формулировка звучит так: «Руководителем и ответственным исполнителем планируемых работ должны являться штатные сотрудники Московского университета. В рамках последующего исполнения работ возможно сотрудничество коллективов МГУ с другими организациями». Оригинал сообщения сохранился в архиве, также есть пример с сайта химфака МГУ. Желающим дают опросный лист, в котором значится следующее:
На суперкомпьютере «270 лет МГУ» будут выполняться вычислительные эксперименты по решению задач, связанных с технологиями искусственного интеллекта (ИИ). Архитектура суперкомпьютера «270 лет МГУ» основана на использовании высокопроизводительных графических ускорителей. Суперкомпьютер планируется использовать для решения задач, требующих больших вычислительных ресурсов (связанных с анализом больших объемов данных). Для получения доступа к суперкомпьютеру необходимо пройти первичный отбор проектов.
«На вычисления всегда были долгие очереди в МГУ, и внутри университета было очень много желающих. Возможно, сейчас «МГУ-270» используется для задач по ИИ, а они [задачи] жутко прожорливые и требуют много ресурсов», — рассказывает один из бывших сотрудников НИВЦ МГУ.
Новый суперкомпьютер, видимо, будет также использоваться руководством МГУ в качестве щедрого жеста в адрес избранных коллег и институций. Например, в конце ноября 2023 года соглашение о сотрудничестве подписали МГУ и Объединенный институт ядерных исследований (Дубна). В пресс-релизе Садовничий, помимо прочего, говорит, что «готов задействовать потенциал Научно-исследовательского вычислительного центра МГУ, в том числе новейший, введенный в строй 1 сентября этого года суперкомпьютер «МГУ-270» с уникальными вычислительными характеристиками». Это единственное найденное T-invariant публичное заявление МГУ о предоставлении доступа к новому супервычислителю кому-либо вне университета.
У ОИЯИ есть свой суперкомпьютер под названием «Говорун», но он, по словам опрошенных в Дубне ученых, «устарел и постоянно ломается», а для полноценной работы нового коллайдера NICA понадобятся немалые вычислительные мощности.
Если обратить внимание на фотографии «МГУ-270», можно заметить поразительное сходство новой машины со старыми «Ломоносовыми», обращают внимание собеседники T-invariant. Отчасти это объясняется в пресс-релизе университета: «Компьютер с новой архитектурой, основанной на активном использовании графических процессоров, составит единый вычислительный кластер с суперкомпьютером «Ломоносов-2»». Один из участников вычислений в МГУ комментирует это так: «Важно заявлять, что строилось новое, а не модернизировалось старое: и чисто по маркетинговыми причинам, и гораздо приятнее отчитываться и интервью потом давать».
«Черные ящики на фото не Nvidia, а обычные Supermicro (но внутри все равно карточки Nvidia и процессоры AMD. Это своего рода «клон», дженерик оригинального DGX от Nvidia. Выглядит так, что они просто убрали все панели «T-Платформ» (компания, которая собирала «Ломоносовых», — T-invariant), а шкафы остались еще от давно разобранного «Ломоносов-1», их снова использовали», — рассказал бывший сотрудник МГУ, ранее работавший на «Ломоносове-2».
Эффективность «МГУ-270» очень трудно оценить со стороны, а открытый рейтинг суперкомпьютеров не обновляется с начала войны
Опрошенные T-invariant эксперты неохотно берутся оценивать уровень нового суперкомпьютера МГУ, потому что университет не предоставил данные в мировой Топ-500, а российский рейтинг, который много лет вел НИВЦ МГУ, перестал обновляться после вторжения России в Украину. Эта причина, естественно, не названа напрямую, но на сайте значится следующее объявление:
В сложившихся условиях сформировавшаяся практика списков Топ-50 объективно отразить изменения как в области применения высокопроизводительных вычислительных систем, так и касательно передовых суперкомпьютерных технологий не способна и может способствовать некорректной трактовке статистики, что противоречит целям проекта. В связи с этим мы приняли решение временно приостановить публикацию новых редакций рейтинга. Мы признательны всем тем, кто на протяжении многих лет делал свой вклад в развитие данного проекта и пополнял его, и искренне надеемся, что в обозримом будущем сможем анонсировать возобновление публикации списков.
Рейтинг перестал обновляться, потому что после 24 февраля 2022 года все комплектующие (как для «МГУ-270», так и для апгрейда остальных российских машин — трех у «Яндекса», двух у Сбера и одной у МТС) поставляются с помощью серого или черного импорта, считают несколько опрошенных участников рынка.
Технологии ИИ в МГУ курирует Катерина Тихонова. Среди ее задач не только создание «нашего ChatGPT», но и развитие БПЛА
В последнем послании Федеральному собранию в начале 2024 года Владимир Путин заявил, что Россия «должна достичь технологического суверенитета в областях генеративного искусственного интеллекта и больших языковых моделей». Он отметил, что утверждена новая государственная стратегия развития ИИ: «Мощность отечественных суперкомпьютеров до 2030 года должна быть увеличена в 10 раз». Тема суперкомпьютеров (как и все цифровое) включена в нацпроект «Экономика данных», на который власти РФ запланировали потратить 700 миллиардов рублей до 2030 года (конец нынешнего срока Путина).
Ведущий центр искусственного интеллекта должен быть создан в МГУ — об этом еще в мае 2019 года гендиректор Российского фонда прямых инвестиций (РФПИ) Кирилл Дмитриев заявил на совещании с участием Путина. Тот идею поддержал и назвал важнейшим элементом при выработке национальной стратегии ИИ. В итоге в 2020 году в МГУ был создан Институт искусственного интеллекта, который, по информации ряда СМИ, возглавила Катерина Тихонова — дочь Путина и генеральный директор фонда «Национальное интеллектуальное развитие» (работает под брендом «Иннопрактика», учредитель — МГУ). Связь двух организаций описана в новостях сайта фонда. Помимо этого «Иннопрактика» реализует масштабный многомиллиардный инвестиционный проект по созданию в Москве научно-технологической долины МГУ.
Информации об участии Тихоновой в жизни МГУ на официальных страницах университета мало (есть упоминания на страницах «Иннопрактики» и страница на портале научной активности МГУ «Истина»). Среди прочего, Тихонова фигурирует и как член Ученого совета МГУ (архив, 2015 год).
У Института ИИ много интересных исследований и публикаций (вот годовой отчет за 2023 год), в том числе работа над языковыми моделями, аналогичными популярным чат-ботам. Обсуждается задача создать отечественный ответ ChatGPT, и этим сейчас занимаются в университетах, подтвердили несколько собеседников T-invariant.
В апреле 2023 года сотрудники МГУ и Сколтеха, выступая на конференции Data Fusion, говорили, что предполагаемая дата появления «российского ChatGPT» — 2025 год. Руководитель лаборатории семантического обучения ИИ (в составе Института ИИ МГУ) Константин Воронцов тогда предлагал назвать его «Наш GPT», а директор Центра технологий ИИ Иван Оселедец рассуждал, что «обучение ИИ языкам и культурам народов страны требует значительных инвестиций и ресурсов, включая этнографические экспедиции, филологов и философов».
«До февраля 2022 года у института Тихоновой были свои вычислительные мощности, и они считали многое на своей базе. У Тихоновой и так целый свой корпус в МГУ, и насколько под них строился «МГУ-270», трудно сказать. Но в деньгах и ресурсах она не нуждается, «Иннопрактику» поддерживает практически весь крупный бизнес России», — говорит один из бывших сотрудников НИВЦ МГУ, уже не работающий в университете.
Большие языковые модели и конкуренция с компаниями типа OpenAI или Google в других областях — это красиво и эффектно, но, по мнению самой Тихоновой, в стране «более прагматичный подход в развитии ИИ», «обусловленный задачами и вызовами, стоящими перед Россией», — это «применение в БПЛА и в нефтегазовой отрасли». Об этом она рассказала на конференции Data Fusion-2024. Пятиминутное видео выступления Тихоновой названо «Многополярность технологического мира будущего: роль России».
«У российского искусственного интеллекта есть своя национальная специфика, есть свои исследования по большим языковым моделям и генеративному ИИ, но Россия отстает в темпе развития от общемирового и пока мы скорее следуем за трендами, чем создаем их», — считает Тихонова. Не страшны, по ее мнению, и международные санкции для университетов и институтов: «Россия не была полностью исключена из мирового контекста, ученые продолжают публиковаться в топовых мировых журналах и выступать на топовых мировых конференциях. У нас есть всё: люди, кадры».
Кроме многополярности, Тихонову очень волнует суверенитет. Так, открытие Института ИИ МГУ «при экспертной поддержке» «Иннопрактики» было «согласовано со стратегией безопасности РФ». Об этом дочь Путина рассказывала крупнейшим бизнесменам и чиновникам на последнем форуме «Иннопрактики», тематикой которого стал «Совокупный суверенитет».
Чем занимается Институт ИИ МГУ и при чем тут технологии двойного назначения?
Полное название центра Тихоновой — «Институт перспективных исследований проблем искусственного интеллекта и интеллектуальных систем МГУ имени М. В. Ломоносова». Если судить по отчету за 2023 год, центр производит вполне живое впечатление. Работы публикуются в нормальных журналах (в том числе журналах группы Nature). Темы, которыми занимаются сотрудники Института, актуальны для современной научной повестки. Среди ученых, работающих с Институтом ИИ, необходимо отметить известного специалиста — нейробиолога Михаила Лебедева. По информации на сайте, в Институте ИИ работают четыре лаборатории:
- Машинное обучение и семантический анализ;
- Интеллектуальный анализ видео;
- Искусственный интеллект в биоинформатике и медицине;
- Разработка инвазивных нейроинтерфейсов.
Есть еще четыре научные группы, которые, вероятно, имеют перспективу стать полноценными лабораториями.
Первые две лаборатории — это чистая «цифра», третья и четвертая — это, в том числе, «мокрая» биология и нейробиология. Ученые много выступают и на научных конференциях (в основном в Китае), и перед широкой публикой, публикуют статьи, в том числе и научно-популярные.
Большинство работ во всех четырех лабораториях, которые отражены в отчете за 2023 год, — это, так сказать, наука двойного назначения. Практически про любой проект можно рассказать, как он работает на войну, хотя и в гражданских целях полученные результаты тоже можно использовать.
Самый известный проект лаборатории «Машинное обучение и семантический анализ» — нейросеть поиска релевантной научной информации SciRus-tiny. Академик Алексей Хохлов так охарактеризовал эту работу в своем телеграм-канале: »…нейросеть SciRus-tiny теперь применена в варианте, когда пользователь может загружать в поисковое поле произвольный текст любой длины. Нейросеть тогда определит те статьи из базы данных eLIBRARY, которые ближе всего по тематике к введенному тексту». Правда, следует отметить, что eLIBRARY не самая полная и не самая авторитетная научная библиотека.
Меньше известно о другом проекте лаборатории, получившем название «Новостной коллайдер». Разработчики пишут в отчете, в частности, следующее:
Инструмент обработки больших текстовых массивов «Новостной коллайдер». В ходе проекта разрабатываются технологии семантической разметки текстов, используемых в социогуманитарных исследованиях. Основные операции включают выделение текстовых фрагментов, их классификацию, связывание и комментирование при необходимости. Такие методы позволяют анализировать большие объемы данных (СМИ, соцсети, архивы) для исследований, например, воздействия на общественное мнение и выявления потенциально опасных дискурсов.
Какие дискурсы сегодня считаются российскими властями «опасными», хорошо известно. Как и то, что для «прочесывания» соцсетей и публикаций СМИ можно использовать нейросетевые инструменты. Так что вероятное применение «новостного коллайдера» вполне можно себе представить. Скорее всего, это и будет поиск «опасного дискурса».
Не менее важным делом занимается лаборатория «Интеллектуальный анализ видео». Судя по отчету, важное направление работы лаборатории — нейросетевые методы сжатия видео и восстановления высокой четкости. Эти методы могут использоваться, например, при передаче видео по узким каналам, в том числе — по спутниковым. Во время войны спутниковая съемка для военной разведки очень важна.
Лаборатория «Искусственный интеллект в биоинформатике и медицине» занимается мультиомикой, то есть самыми разными направлениями геномики, протеомики (исследования белков) и т. д. Здесь суперкомпьютер просто необходим, чтобы использовать такие передовые методы, как предсказание структуры белков по аминокислотной последовательности. Это делает, например, нейросеть AlphaFold компании Google DeepMind, но есть и другие подобные решения. Главные направления работы лаборатории — это фармакология и диагностика на основе машинного обучения.
Лаборатория «Разработка инвазивных нейроинтерфейсов» занимается созданием нейропротезов и разными методами нейрореабилитации. Здесь работают над лечением нейропатических и фантомных болей, которые часто сопутствуют травмам и ампутациям. Война — это эпидемия травматизма.
Необходимо отметить, что пока этот центр сравнительно небольшой. В мире существуют сотни куда более мощных исследовательских центров, занятых исследованием ИИ, мультиомики и нейроинтерфейсов (в основном в США и Китае). Когда Илон Маск решил создать свой суперкомпьютер, он его построил меньше чем за год. И его детище, насколько можно судить по открытой информации, примерно на порядок мощнее, чем «МГУ-270». Вычислительные возможности — даже с учетом запуска суперкомпьютера — у Института ИИ довольно скромные. Охват тем — довольно ограниченный, даже по сравнению с отделениями Сбера, занятыми ИИ, или с «Яндексом». Но это вполне современный центр.
Как использовать суперкомпьютер, ученые Института ИИ, судя по всему, понимают. Простаивать он не будет. Скорее всего, большинство приложений будет иметь военное или двойное назначение и о многих из них открытой информации мы в ближайшие годы не получим.
Фото на обложке: Vasiliy Koval / Shutterstock