×

Та самая люстра Пизанского собора. Изображение terra-svet.com

Два года назад Тайлин Ву и Макс Тегмарк, двое учёных из Массачусетского института технологий (MIT), представили научному миру свою модель нейросети, названную ими AI Physicist Искусственный-Интеллект-Физик. Тогда суть новаторства заключалась в том, что нейромодель обучалась не столько конкретным данным, сколько начальным методам научных изысканий. А именно – наблюдениям за вселенными-симуляторами сложностей нашего мира, коих авторы создали аж сорок штук, и построению выводов по полученным данным о законах, управляющих этими симуляциями.

Работа удалась на славу. Тогда ИИ, конечно, не сравнился с гением Галилея, который путём сравнения темпа раскачивания люстры в Пизанском соборе с собственным пульсом выяснил, что периодичность колебаний постоянна независимо от их амплитуд. А это открытие – заметьте – не только позволило предположить возможность маятникового устройства часов, но также считается олицетворением простейшей основы и первого этапа эволюции научного метода. Однако же несмотря на всё несовершенство модели и вытекающую из него ограниченность, AI Physicist дал толчок новому витку развития научного метода.

И вот, всего несколько дней назад стало известно, что другой исследовательской группе (на этот раз из Японии), возглавляемой доцентами Ягути Такахару из Высшей школы системной информатики и Мацубара Такаши из Высшей школы инженерных наук при Университете Осаки, удалось разработать технологию для моделирования явлений, подробный механизм или формула которых не имеют объяснения. Общим в этих двух работах является и участие нейросетей, и учёт закономерностей реального мира. А разница – в том, что если в экспериментах MIT нейросеть формулировала выводы о физических законах на основе наблюдений за моделями искусственных вселенных, то японские исследования, наоборот, используют машинное обучение для создания модели реальности с опорой на действующие законы физики, основываясь при этом на данных от множества наблюдений. То есть фактически новые изыскания носят прогнозирующий, предсказательный характер.

А пикантности данному исследованию придаёт то, что его устроители сумели создать технологию моделирования событий, не имеющих пока подробных объяснений причин и механизмов их развития. Это касается, например, распространения трещин и других видов механики разрушения, роста кристаллических структур и волнового движения.

«Мы надеемся, что эта технология позволит более точно предсказывать подобные явления с помощью компьютерного моделирования, – говорят авторы. – Есть надежда, что это развитие позволит предсказать явления, которые до сих пор было трудно воссоздать, потому что лежащие в их основе подробные механизмы были неизвестны. Также ожидается увеличение скорости самих симуляций».

Основным достоинством разработки является, как уже сказано, применение машинного интеллекта для предсказания физических реалий – возможность, которая может привести к чрезвычайно точному и высокоскоростному моделированию. Это вполне реализуемо благодаря устранению погрешностей предыдущих способов: ещё недавно методы прогнозирования оперировали округлёнными и приближёнными данными, потому что сложность оцифровки ситуаций означает, что многие физические параметры (как, например, закон сохранения энергии) берутся в константе, а их незначительные, но нередко критичные изменения не учитываются. Как следствие – мы имели не вполне достоверные, часто завышенные результаты.

Теперь же у науки есть технология, которая может запускать создание имитаций при сохранении и учитывании законов физики. Искусственным нейросетям это под силу – с помощью цифрового анализа физики явлений и событий, компьютер распознаёт изменчивость данных в цифровом виде. Кроме того, предвкушается использование технологии в уточнении нюансов чего-либо малоизученного вследствие сложности и подверженности многим факторам и переменным. При условии достаточного количества данных, учёные могут воссоздать в моделях даже очень скоротечные процессы, что позволит провести гораздо более подробные их исследования.

Предпосылки.

Обычно в моделировании с опорой на законы физики используются основанные на них уравнения и суперкомпьютеры для расчётов. Но, хотя уравнения очень универсальны, они способны идеально воспроизводить индивидуальность протекания отдельных явлений далеко не всегда.

Вернёмся к Галилею. Вернее, к его пизанским наблюдениям за раскачиваниями люстры.  Физику движения маятника проходят в средней школе. Так что и тема, и эксперимент по ней как один из способов её симулирования – довольно просты. Однако в реальном опыте, если бы вы сделали маятник и попытались его раскачать, совсем небольшой производственный дефект либо конструкции, либо самого маятника мог бы привести к тому, что его движения не вполне бы совпали с теоретическими расчётами. А это означает ошибку в прогнозах моделирования. 

Но герои данной статьи демонстрируют устойчивое движение вперёд в нелёгком деле исследований по созданию моделей развития явлений с помощью машинного обучения. И при дальнейшем росте в этой сфере, реализация уверенного и достаточно точного прогнозирования посредством симуляции (с соблюдением физической достоверности и на основе реальных данных), открывает перед мировым сообществом невероятные перспективы. Для науки это новый инструмент познания мира и его закономерностей; для инженерии – новое средство предварительного тестирования разработок; для медицины – способ сделать оптимальный выбор в методике лечения. Собственное прогнозирование реальных итогов для каждой из областей деятельности человека способно приблизить ранее недосягаемые горизонты.

Однако вернёмся с небес на землю: ввести законы физики, которые управляют явлениями в настоящем мире, в технологию прогнозирования с использованием современных нейросетей оказалось весьма непросто. Компьютеры – это цифровые устройства, поэтому точно воспроизвести физические законы вроде закона сохранения энергии довольно трудно, что, как сказано выше, может стать причиной неточностей. Так, в долгосрочных прогнозах возможно неестественное увеличение или уменьшение энергии, что может привести к неверной оценке многих параметров системы (от скорости объекта до высоты волны), а значит – и к неуправляемому снижению надёжности прогноза.

Результаты исследований

Исследовательская группа Ягути Такахару и Мацубара Такаши разработала свою технологию, руководствуясь вопросом о том, как происходило бы машинное обучение «если бы мир был цифровым». Опираясь на этот образ мышления и представления о таком мире, физические законы, которые необходимо применить нём, были приведены учёными в соответствующий вид. Для этого была проделана довольно трудоёмкая работа по переписи их в цифровом исчислении, основанная на том факте, что любые физические законы записываются в терминах математического анализа.

Техническая реализация поставленной задачи, потребовала разработки цифровой версии так называемого обратного распространения ошибки – алгоритма правки неправильных ответов ИИ в период обучения, который производится с помощью автоматического дифференцирования. Этот подход сохраняет учёт изменчивости силы влияния физических законов вроде сохранения энергии в цифровом выражении. А значит, и в симуляциях на базе искусственного интеллекта эти нюансы будут реализованы правильно. Таким образом, использование этой новой методологии многократно повышает надёжность прогнозов и расчётов.

Сначала нейромодель в описываемом исследовании изучает функцию энергии на основе данных наблюдений за реальными физическими явлениями. А затем уже сама генерирует уравнения движения в цифровом мире. Примечательно, что они могут быть использованы программой моделирования по принципу «как есть». Авторы полагают, что применение этих уравнений должно поспособствовать будущим научным успехам. Кроме прочего, такой способ кодирования физических законов в цифровом виде сам собой отменяет необходимость переписывать уравнения движения для компьютерного моделирования.

Чтобы ввести физические законы в цифровой мир, также использовались подходы, свойственные геометрии. Это, прежде всего, симплектическая геометрия (если катко – это такая «геометрия без координат, со множеством решений») и риманова геометрия («геометрия искривлений многомерных пространств»). Этот частный манёвр позволяет применять разрабатываемую технологию для прогнозирования протекания более широкого спектра метаморфоз. 

Например, такой процесс как объединение двух капель в одну характеризуется потерей энергии, происходящей во время слияния капель. Этот феномен наиболее удачно описывается римановой геометрией. То есть фактически – и сохранение, и рассеяние энергии могут быть показаны в аналогичном уравнении с геометрической точки зрения. А это подводит нас к созданию единой системы, способной справиться с обоими типами изменений, что и стали делать исследователи. Такой образ мышления помог расширению возможностей нового виртуального моделирования, добавив ко всему прочему учёт эффекта рассеяния энергии, свойственного реальному миру.

Примеры таких явлений включают структурную организацию материалов, рост кристаллов и механику расширения трещин, и есть надежда, что дальнейшее развитие технологии искусственного интеллекта позволит предсказывать подобные вещи с потрясающей точностью.

Более того оказалось, что, косвенно, новый метод также повысил эффективность обучения искусственных нейросетей. Проведённые исследовательской группой эксперименты показали, что в сравнении с существующими разработками, скорости в их модели ИИ увеличились в 10 раз.

Дальнейшие исследования

Сформированный подход предполагает, что для прогнозирования тех или иных объектов изучения (ведь это могут быть не обязательно физические явления, но также и развитие событий, материалы, реакции и прочее) вполне целесообразно было бы создавать индивидуальные модели, имитирующие подробные аспекты этих объектов. С одной стороны это приведёт к сокращению времени, затрачиваемого на вычисления для различных физических симуляций, а с другой – позволит резко повысить точность моделирования, в сумме тем самым увеличив эффективность прогнозов и вручив учёным новый инструмент познания в виде полноценного виртуального опыта или даже целой лаборатории.

Кроме того, использование технологий машинного обучения для извлечения физических законов из данных наблюдений позволит по-новому взглянуть на малопонятные прежде явления со множеством подводных камней в виде неизвестности подробностей обусловливающих их механизмов.

Авторы надеются, что этот метод покажется интересным их коллегам ещё и эффектом обратного распространения, которое обычно используется в обучении ИИ. Ведь сделанные ими наработки могут улучшить скорость различных типов машинного обучения за пределами описанной технологии.

 


 

АРМК, по материалам Kobe University