разбор

Две тысячи лет назад пепел Везувия почти уничтожил огромную библиотеку на вилле тестя Цезаря. В 2023-м ученые смогли прочесть обугленные свитки — благодаря искусственному интеллекту Если повезет, нас ждут свежие Гомер и Аристотель (!)

Источник: Meduza

С середины XVIII века папирусы из Геркуланума — города на юге Италии — остаются одной из крупнейших загадок для историков и археологов. Они были найдены на развалинах римской виллы, засыпанной пеплом в 79 году нашей эры во время извержении Везувия. Содержание документов до сих пор оставалось неизвестным, поскольку сильно поврежденный огнем папирус было невозможно развернуть, полностью не разрушив. В 2023 году по инициативе предпринимателя из Кремниевой долины Нэта Фридмана стартовал конкурс на разработку программного обеспечения, которое позволило бы прочитать хотя бы несколько отрывков бесконтактно — используя трехмерную томографию документов. В феврале 2024-го стало известно, что такая программа действительно появилась. «Медуза» рассказывает о технологии, которая обещает произвести настоящую революцию в античной филологии открыв содержание текстов, которые считались потерянными почти две тысячи лет.


Виллой, где были обнаружены геркуланумские свитки, предположительно владел отец жены Гая Юлия Цезаря — древнеримский консул и цензор Луций Кальпурний Пизон Цезонин. В его обширной библиотеке могли содержаться тысячи или даже десятки тысяч папирусов, из которых в распоряжении ученых сейчас находится лишь малая часть.

Свиток, отрывок из которого удалось прочесть команде, победившей в конкурсе Vesuvius Challenge

Vesuvius Challenge

Располагалась вилла в городе Геркуланум на юге современной Италии, на берегу Неаполитанского залива. Геркуланум прекратил свое существование в августе 79 года, когда его накрыли пирокластические потоки от извержения Везувия. В отличие от Помпей, принявших на себя прямой удар, Геркуланум накрывало лавой постепенно, слой за слоем. Это позволило многим жителям спастись. Сам город, затопленный вулканической породой, ушел под землю и дошел до нашего времени почти нетронутым.

В середине XVIII века итальянские землекопы случайно наткнулись на мраморные статуи из вымершего Геркуланума, а ровно в 1750 году они достигли мраморного пола виллы. Королевская семья Бурбонов инициировала раскопки, в ходе которых из здания удалось извлечь множество бронзовых и мраморных скульптур и предметов домашней утвари. Свитки, которые валялись на полу одного из помещений, часто принимали за поленья и бросали в огонь. Так продолжалось до тех пор, пока кто-то не заметил, что обычно их находят в библиотечных залах или в читальных комнатах. Тогда стало ясно, что загадочные объекты на самом деле представляют собой свернутые и обожженные папирусы. Однако при попытке раскрыть их, как бы осторожно ни действовали участники раскопок, хрупкие свитки рассыпались на маленькие кусочки.

3D-иллюстрация процесса погребения библиотеки под горячим пеплом и лавой Везувия

Vesuvius Challenge

В последующие десятилетия светские и церковные исследователи пробовали разработать технику разворачивания папируса, которая позволила бы изучить содержание. На свитки воздействовали ртутью и газом, некоторые из них разрезали пополам, но ничто не помогало принципиально изменить состояние материала. Даже когда ученым удавалось сохранить относительно крупный фрагмент папируса, символы на нем оставались неразборчивыми из-за воздействия высокой температуры.

Ближе всех к тому, чтобы раскрыть свитки, подобрался итальянский священник и исследователь конца XVIII века Антонио Пьяджо. Спроектированная им специальная машина использовала шелковые нити, крепившиеся к краями папируса, чтобы раскручивать документы максимально медленно и осторожно — по несколько сантиметров в день. Хотя некоторые свитки таким образом удалось раскрыть, в процессе они все равно получили слишком много повреждений, чтобы можно было всерьез изучить содержание документов. В последующие десятилетия многие европейские правители, включая Наполеона, собирали для той же задачи команды выдающихся интеллектуалов, которым даже удалось реконструировать несколько отрывков, но в целом задача чтения поврежденных папирусов оставалась неподъемной для исследователей.

Свиток из Геркуланума, рассыпавшийся при попытке исследователей развернуть его

Vesuvius Challenge

Уже в современности дальше всех в работе со свитками продвинулся профессор компьютерных наук из университета Кентукки Брент Силс. Последние 20 лет он использовал для расшифровки и анализа разнообразных древних текстов метод компьютерной томографии — облучения материала рентгеновскими лучами с его последующей трехмерной реконструкцией. Идея состояла в том, чтобы использовать трехмерную томографическую модель свитка, чтобы раскрутить его виртуально, без риска повреждения самого документа. Несмотря на первые успехи, испытание 2009 года показало, что программа Силса не приспособлена к работе с настолько сложным и хрупким материалом.

«Трудности, с которыми мы столкнулись, сокрушили мое ПО, — признал Силс. — Слои внутри папирусов оказались неоднородными. Они все запутались и перемешались между собой. Мое программное обеспечение не могло разобраться [в их последовательности и содержании]».

В 2016-м Силсу с группой студентов удалось прочитать найденный в Израиле свиток Эйн Геди, содержащий фрагмент текста Пятикнижия. Свиток был так же сильно поврежден огнем, как и геркуланумские папирусы, однако чернила, которыми он был написан, оказались сделаны на основе солей железа и свинца — материалов, которые хорошо поглощают рентгеновское излучение и поэтому выступают яркими пятнами на фоне более темного папируса. Это позволило программе Силса и его учеников раскрутить свиток и распознать символы на темном фоне. Однако для геркуланумских папирусов этот метод оказался бесполезен: для их создания использовались чернила на основе сажи, поэтому на уровне химического состава между обугленным папирусом и угольными чернилами нет никакой разницы.

В последние несколько лет Силс начал экспериментировать с технологиями машинного обучения и искусственного интеллекта. Вместе с командой исследователей он сканировал свитки в самых совершенных томографах и тренировал алгоритмы для распознавания паттернов чернил. Силс надеялся, что такой подход позволит разглядеть детали, недоступные человеческому глазу. Однако содержание текстов по-прежнему оставалось недоступным из-за состояния чернил и папирусов.

Инфракрасное изображение фрагмента одного из геркуланумских свитков, использованного в качестве контроля метода получения томографических изображений. Сопоставление инфракрасных и рентгеновских изображений позволяет вычленить особенности последних для последующего анализа

Vesuvius Challenge

Прорыв наметился в 2022 году, когда с Силсом связался предприниматель из Кремниевой долины Нэт Фридман. Тот заинтересовался историей свитков, когда изучил доклад Силса о попытках расшифровать их содержание. Фридман захотел помочь ученому — и предложил пожертвовать 125 тысяч долларов в качестве приза за разработку технологии реконструкции текстов. Сам Фридман, в прошлом генеральный директор GitHub, занимался разработкой программного обеспечения и инвестициями в сфере ИИ, поэтому с энтузиазмом отнесся к технологическим идеям Силса. Несколько его партнеров тоже вложились в проект по расшифровке папирусов.

В марте 2023 года Фридман и Силс запустили Vesuvius Challenge — проект, в рамках которого они предлагали 700 тысяч долларов за расшифровку четырех фрагментов с одного папируса. Еще 300 тысяч организаторы разделили на промежуточные призы суммами от тысячи до 100 тысяч долларов. Получить их можно было за разные достижения в процессе расшифровки — например, разобрав первые буквы на свитке или разработав ПО, которое позволило бы более эффективно анализировать изображение. Одним из главных принципов конкурса стала открытость: участники должны были делиться достижениями друг с другом, а в случае успеха объяснять, как добились результата.

Один из двух свитков Геркуланума, сканированных на синхротроне Diamond Light Source

Digital Restoration Initiative / University of Kentucky

Фридману удалось уговорить коллекционеров в Италии и Британии отсканировать свитки. Чтобы защитить их при транспортировке, помощники предпринимателя разработали специальные защитные чехлы. Сканирование двух свитков, которое проводилось на британском синхротроне Diamond Light Source, обошлось энтузиастам примерно в 70 тысяч долларов.

Процесс был устроен следующим образом:

  • На первом этапе свитки сканировали в рентгеновских лучах синхротрона, получая трехмерное изображение высокого разрешения. Яркость каждого объемного пикселя этого изображения (вокселя) зависела от плотности материала в данной точке свитка. Синхротрон оказался более подходящим для решения задачи, чем обычный компьютерный томограф, из-за своей высокой яркости, однородности и параллельности рентгеновского излучения. С помощью такого источника удалось добиться наилучшего доступного на сегодня разрешения рентгеновской томографии.
  • Трехмерную модель свитка затем разворачивали в плоское изображение. Для этого несколько человек вручную размечали на компьютерной модели линии сгиба папируса, а программа реконструировала плоское изображение из трехмерного оригинала.
  • После этого на изображении необходимо было найти следы чернил. Которые, следует повторить, никак не отличались от нетронутого папируса по плотности вещества и его химическому составу.
  • Чтобы избежать риска переобучения и галлюцинирования — проблем, которые характерны для нейросетей, — участники конкурса применяли несколько подходов. Помимо того, что разные команды работали независимо друг от друга, важной гарантией надежности результата было то, что программы работали не на уровне распознавания букв (как можно было бы подумать), а на более глубоком уровне — яркости изображения. Другими словами, то, что системе машинного обучения необходимо было предсказать по плоскому изображению свитка, — это наличие или отсутствие в конкретной точке чернил, а не буквы.
  • Полученные таким образом изображения передавали команде филологов, которые самостоятельно пытались прочитать и перевести получившийся текст на основе своих знаний языка и контекста античной культуры. Они же выступали судьями, оценивавшими качество работы предложенных алгоритмов «проявления» текста на свитках.

Чтобы облегчить процесс работы, Фридман нанял команду сотрудников, которые каталогизировали доступные изображения и вручную размечали томограммы свитков для их последующего разворачивания.

Реконструкция процесса создания трехмерной модели свитка

Vesuvius Challenge

Первого значимого успеха в рамках Vesuvius Challenge добился австралийский математик и физик Кейси Хандмер. Сначала он, как и другие участники, хотел разработать программу, чтобы разобрать символы на папирусах, но затем отказался от этой идеи и попытался невооруженным взглядом найти закономерности в похожих на потрескавшуюся грязь образованиях на поверхности свитков. Ему это удалось — оказалось, что некоторые из них формой напоминали буквы греческого алфавита. Ученый предположил, что паттерны представляли собой выступившие чернила.

Хандмер поделился находкой с другими участниками конкурса. Один из них, 22-летний студент факультета информатики в университете Небраски в Линкольне Люк Ферритор, на основе обнаруженных Хандмером паттернов разработал алгоритм машинного обучения, благодаря которому расшифровал первое слово из свитка — «пурпурный». За это он получил промежуточный приз в 40 тысяч долларов. Программа Ферритора использовала паттерны трещин, доступные человеческому глазу, чтобы на их основе распознавать более сложные закономерности на изображении.

В конце прошлого года Ферритор объединил усилия с двумя другими энтузиастами, египтянином Юссефом Надером и швейцарцем Юлианом Шиллигером. Вместе им удалось усовершенствовать программу и разобрать необходимое по условиям конкурса количество фрагментов текста. Их совместная заявка стала одной из 18-ти, претендовавших на главный приз, но единственной, которая полностью соответствовала поставленной задаче. Благодаря ПО, созданному Надером, Шиллигером и Ферритором, участки свитков, раньше напоминавшие бесформенные пятна, преобразились в осмысленные фрагменты текста. Достижение трех студентов произвело настоящую сенсацию в мире исследователей и энтузиастов античной культуры.

Схема работы классификатора, распознающего наличие или отсутсвие чернил во фрагменте свитка. Нейросеть сканирует развернутую томограмму небольшим «окном» внимания, выдавая вероятность наличия в нем чернил либо, как в этом конкретном примере, двоичный ответ — наличие или отсутствие. В результате получается изображение, которое может прочитать человек. Небольшой размер окна защищает систему от галлюцинирования, то есть выдумывания правдоподобного ответа, т. к. конечный результат работы нейросети неизвестен

Vesuvius Challenge

«Это уникальная ситуация для антиковеда, — признался профессор древней философии и римской литературы в Оксфорде Тобайас Рейнхардт. — Ты почти всегда имеешь дело с текстами, которые до тебя видел кто-то еще. Одна мысль о том, что ты читаешь свиток, который в последний раз разворачивали 1900 лет назад, завораживает».

***

Жюри из авторитетных ученых проанализировало заявки и присудило Ферритору, Надеру и Шиллигеру приз в 700 тысяч долларов. Фрагменты текста, которые им удалось расшифровать, по мнению антиковеда Боба Фаулера и папиролога Федерики Николарди, скорее всего, принадлежат Филодему, последователю эпикурейской школы философии. Они посвящены рассуждениям об удовольствии от употребления пищи (в частности, каперсов) и прослушивания музыки, а также о том, как эти занятия воздействуют на органы чувств. Теперь ученые предвкушают, как с помощью созданной системы смогут расшифровать другие исторические и философские манускрипты Геркуланума.

Пока команде, выигравшей конкурс, удалось расшифровать всего пять процентов текста всего одного свитка. При этом сейчас в различных музеях, прежде всего в Национальном археологическом музее Неаполя, хранится более 800 геркуланумских свитков — а потенциально их может быть гораздо больше. Сейчас чтение документов сдерживает лишь необходимость ручной разметки томограмм на первых этапах работ — процессом, который требует значительного опыта и навыков. Однако в будущем, возможно, этот этап также можно будет автоматизировать.

«Настоящие достижения еще впереди, — констатировал куратор зала Античности в музее Гетти в Лос-Анджелесе Кеннет Лапатин. — Меня больше волнует даже не то, что говорится в этом папирусе, а то, что его расшифровка позволяет рассчитывать на расшифровку сотен папирусов, которые раньше считались безнадежными».

Текст, расшифрованный командой победителей Vesuvius Challenge, с подложкой, раскрашенной в цвет папируса. В реальности и томографическое изображение, и результат анализа распределения чернил на нем монохромны

Vesuvius Challenge

Ученые считают, что за все время раскопок археологи так и не добрались до главной библиотеки на вилле, поэтому большинство папирусов по-прежнему находятся под землей. Фридман уже анонсировал новый этап конкурса расшифровки, который продлится до конца 2024 года. Если в прошлом году от участников требовалось восстановить примерно пять процентов текста с одного свитка, то в этот раз им предстоит восстановить уже 85 процентов. А еще Фридман планирует закупить специальные томографы, которые можно будет установить на вилле, чтобы сканировать папирусы на месте и не рисковать их сохранностью при перевозке.

Серьезной помехой на пути к расширению исследования может стать современный итальянский Эрколано с населением около 50 тысяч человек, выросший на месте древнего Геркуланума. Жилые дома над местом, где предположительно находятся неисследованные участки виллы, могут осложнить раскопки, если только археологам не удастся согласовать массовое переселение их жителей. «Чтобы проникнуть в древний город, фактически придется выгнать жителей Эрколано и все снести», — опасается папиролог Федерика Николарди.

Однако пока у организаторов и участников конкурса достаточно уже имеющегося материала, чтобы продолжать работу. «Мы можем обнаружить новый диалог Аристотеля, считавшуюся утерянной поэму Гомера или отчет римского генерала о парне по имени Иисус Христос, — рассуждает запустивший Vesuvius Challenge Нэт Фридман. — Одной такой находки хватит, чтобы вся затея полностью окупилась».

«Медуза»

Magic link? Это волшебная ссылка: она открывает лайт-версию материала. Ее можно отправить тому, у кого «Медуза» заблокирована, — и все откроется! Будьте осторожны: «Медуза» в РФ — «нежелательная» организация. Не посылайте наши статьи людям, которым вы не доверяете.