×

Вид изнутри реактора на 0.6 секунде реакции. Источник

Перспектива неограниченной чистой энергии все ещё далека, но активность изысканий в этой сфере столь высока, что со стороны кажется, будто учёные мужи наткнулись на какое-то месторождение идей. 

Например, стоящие перед миром сложные проблемы климатических реалий, о которых мы рассказывали и ещё не раз поговорим, благоприятствуют развитию многих направлений научной, экономической, политической и законотворческой мысли. Но всё это касается «чистоты» энергии в плане экологичности, а как обстоят дела с точки зрения ресурсоёмкости? Как нам добывать энергию, не только не убивая планету, но и не умаляя мировых запросов на энергопотребление и даже предвосхищая их рост?

Компания DeepMind, об успехах искусственного программиста которой мы недавно вам рассказывали, продолжает применять свои интеллектуальные модели глубокого обучения мирового класса для решения сложных научных задач. Так, в рамках сотрудничества со Швейцарским центром плазмы, был создан и обучен алгоритм ИИ, цель которого – управление перегретым «супом материи» – так называют состояние плазмы внутри ядерного реактора во время термоядерной реакции, когда все частицы находятся словно во взвешенном состоянии, и будто пребывают в замешательстве. 

Результаты, которых удалось достичь, позволят физике лучше понимать, как работает термоядерный синтез, а также ускорить появление неограниченного источника чистой энергии в перспективе.

«Это одно из самых сложных применений обучения с подкреплением в реальной системе», – говорит Мартин Ридмиллер, исследователь из DeepMind.

Схематично явление ядерного синтеза можно свести к объединению атомных ядер водорода с образованием более тяжёлых атомов – например, гелия. Этот процесс сопровождается выделением энергии гораздо большей по сравнению с количеством участвующего в нём топлива. Таким образом, подобные реакции считаются крайне эффективными источниками энергии. 

Кроме того, такой вариант добычи энергоресурсов намного чище и безопаснее уже набившего оскомину ископаемого топлива. Но ещё он имеет преимущества и перед традиционной ядерной энергетикой, которая зиждется на расщеплении ядра атома. Да к тому же синтезу благоволит сама природа, ибо это то, что питает звезды!

Однако в космосе для подобных реакций есть все условия, а на Земле контролировать ядерный синтез ой как непросто. Ключевая проблема в том, что атомные ядра склонны отталкиваться друг от друга, и столкновение их возможно только при чрезвычайно высоких температурах. Учитывая реалии реактора, а не звезды в качестве места действия, и сотен миллионов градусов, нередко достижимых в ходе этого ритуала – а это жарче, чем даже в центре Солнца! – нетрудно представить, насколько сложные задачи стоят перед учёными. При этих температурах вещество теряет привычное нам агрегатное состояние: оно перестаёт быть твёрдым, жидким, газообразным. Материал становится сплошной плазмой: это кипящее варево из разрозненных частиц.

Вследствие сказанного, сверхзадача сейчас состоит в том, чтобы удерживать плазму внутри реактора столь долго, сколько понадобится для извлечения из неё энергии. Но если звёзды в этом в этом вопросе могут целиком и полностью положиться на её величество гравитацию, то здесь, на Земле, приходится использовать различные ухищрения. Например, лазеры и магниты. В модели реактора, называемой токамак, плазма удерживается посреди электромагнитной клетки, позволяя нам сохранять её форму и не давать ей касаться стенок реактора. Последнее, как не трудно догадаться, чревато довольно неприятными последствиями помимо охлаждения вещества: реактор может не вынести таких объятий. 

Да, реакция возможна вне космических масштабов, но в условиях нашей планеты управление плазмой требует постоянного контроля и управления магнитным полем – тонкого, точного и своевременного. Команда обучила свой алгоритм делать это в симуляции. Этот формат называется обучение с подкреплением и представляет собой способ машинного обучения в условиях какой-либо среды и взаимодействия с ней.

И вот час «икс». Наученному контролировать и изменять форму плазмы внутри виртуального реактора алгоритму доверили контроль над магнитами настоящего токамака переменной конфигурации (TCV) – экспериментального реактора в Лозанне. И в ходе эксперимента обнаружено, что ИИ может управлять настоящим реактором без какой-либо дополнительной тонкой настройки. И пусть искусственный оператор контролировал плазму всего пару секунд, важно другое: чтобы не стать слишком горячим, реактор TCV не может работать дольше. Другими словами, нейросеть выполнила задачу полностью.

Для этого она проводила 90 различных измерений десять тысяч раз в секунду. Данные, описывавшие форму и положение плазмы, вызывали отклик в виде индивидуальной регулировки напряжения в 19 магнитах. Одно из условий успеха в том, что в этой сети цикл обратной связи работает намного быстрее, чем в предыдущих алгоритмах обучения с подкреплением. Для ускорения процесса, модель была разделена на две нейронные сети. Большая сеть, называемая критиком, методом проб и ошибок научилась управлять реактором внутри симуляции. Затем способность критика была закодирована в более быстрой сети меньшего размера, называемой актором, которая работает на самом реакторе.

«Это невероятно мощный метод, – говорит Джонатан Ситрин из Голландского института фундаментальных энергетических исследований, не участвовавший в работе. – Это важный первый шаг в очень захватывающем направлении».

Исследователи считают, что использование ИИ для управления плазмой облегчит эксперименты с различными условиями внутри реакторов, поможет им понять процесс и потенциально ускорит разработку коммерческого ядерного синтеза. Ко всему прочему, обязательно стоит отметить, что нейросеть научилась управлять плазмой, регулируя магниты таким образом, каким люди раньше не пробовали. А это позволяет нам предположить возможность реализации новых конфигураций реакторов.

«С такой системой управления мы можем пойти на риск, на который в противном случае мы не осмелились бы пойти», — говорит Амброджо Фазоли, директор Швейцарского центра плазмы и председатель консорциума Eurofusion, имея в виду, что в чрезвычайно рискованных мероприятиях человек склонен перестраховываться, поэтому нежелание выталкивать плазму за определенные пределы часто побуждает живого оператора осторожничать и, в ущерб цели, даже не приближаться к позволенным рубежам. «Есть события, которых нам абсолютно необходимо избегать, потому что они повреждают устройство, – поясняет он. – Если мы уверены, что у нас есть система управления, которая приближает нас к пределам, но не выходит за них, тогда мы можем исследовать больше возможностей. Мы можем ускорить исследования».


 

АРМК, по материалам MITTechnologyReview.