×

Последний месяц года ознаменовался множеством славных событий в научном мире. Человеку, не связанному с научной деятельностью, большая часть из них мало что может сказать о грандиозности открываемых ими перспектив, однако есть ниша, за которой с любопытством следят даже обыватели: это искусственные нейросети. Так случилось, что в последнюю декаду декабря широким массам представлены сразу несколько интереснейших прорывов в этой области. Мы выделили три из них, как наиболее интригующие и значимые для будущего.

Перцептейн: ИИ в живой клетке.

Международная команда специалистов из китайского университета Уэстлейк и Калифорнийского технологического института разработала «интеллектуальную» систему, которая может обрабатывать несколько сигналов и принимать решения на их основе. Особенность её, в том, что она построена на белках и способна функционировать (читай — проводить вычисления) внутри живых клеток.

Собственно, об этом же говорит её название — «перцептейн», — состоящее из двух наименований: перцептрона как базовой концепции искусственной нейросети для решения задач бинарной классификации, и протеина или, по-русски говоря, белка. Ключевое достижение учёных в том, что, объединив концепции теории нейросетей с белковой инженерией, им удалось создать биологический вычислительный классификатор, способный проводить операции на уровне белка.

Наука многому учится у живой природы, поскольку это настоящий кладезь знаний, примеров и методов решения каких бы то ни было задач. Так, клетка естественным образом обрабатывает множество сигналов — как от внешних раздражителей, так и от внутренних команд к определённому поведению, — что всегда интересовало учёных, представляющих весьма отличающиеся области знаний. Скажем, иммунные клетки — самый наглядный пример избирательной реакции на угрозу в зависимости от её вида, но, кроме этого, внутренние «понятия о целесообразности» позволяют клетке самой включать нужные функции из всего своего арсенала для достижения конкретных результатов в собственном развитии. Так действуют, например, клетки меристемы (точки роста растений) и стволовые, которые словно выбирают чем им стать: стволом, веточкой или листочком — в одном случае; и мышцей, костью, мозгом и так далее — в другом.

Попытки воспроизвести в искусственных системах внутриклеточный процесс принятия решений предпринимаются уже давно. Большинство из них основаны на ДНК или РНК, что сказывается на замедлении вычислений и снижении их эффективности. Теперь же получилось обойти существующие ограничения именно благодаря использованию белков, гетеродимеров белков de novo (словно бы «случайные» бесструктурные белки из некодирующей ДНК) и искусственных протеаз (ферментов, расщепляющих связи между аминокислотами в белках и ускоряющих образование новых белков).

Создавая посредством последних белковые пары, связанные определённым образом, белки выстраиваются в так называемую перцептивную сеть, в которой одни белки активируют другие. Это гарантирует, что при наличии нескольких сигналов только самый сильный из них вызывает реакцию, игнорируя более слабые сигналы.

В исследовании «Синтетическая нейронная сеть на уровне белков в клетках млекопитающих», опубликованном в Science, исследователи показали, что перцептивные схемы могут различать входные сигналы с настраиваемыми границами принятия решений. Это даёт возможность управлять сложными клеточными реакциями, не прибегая к регуляции транскрипции при синтезе РНК, без чего нельзя было обойтись в методах, основанных на РНК и ДНК.

Для проверки активации перцептивного контура исследователи создали стабильную линию репортёрных клеток, содержащей конструкцию, которая одновременно экспрессировала два флуоресцентных белка: Citrine и mCherry. Каждый из них был помечен активируемым расщеплением N-дегроном, служащим сигналом деградации, специфичным для одной из двух входных протеаз в цепи перцептейна.

Таким образом, когда соответствующая протеаза была активна, она расщепляла дегрон, снижая флуоресценцию. Причём каждый вариант протеазы специфически снижал флуоресценцию только у своего репортёра-мишени, что дало возможность оценивать активность участка и визуально, и количественно.

Это открытие сулит нам новые методы лечения. Представьте: пациенту вводят адаптированные под его особенности и заболевание клетки, которые будут реагировать на специфические сигналы и выполнять строго определённые функции. Риски случайных взаимодействий такого «информационного биоагента» по сравнению с фармацевтическими лекарственными средствами снижается многократно, а точность и даже так называемая точечность возрастают в разы.

Лазерный нейрон быстрее живого.

лазерный нейрон 

Квантово-точечный лазер на основе чипа, который имитирует биологический градиентный нейрон и обеспечивает скорость обработки сигнала 10 гигабит в секунду. Источник.

Назвать это открытие революцией в области искусственного интеллекта в частности и вычислений вообще можно без каких-либо натяжек. Для понимания этого достаточно осознать следующее: появился искусственный нейрон, имитирующий биологический, но работающий в миллиард раз быстрее. Если точнее — информация обрабатывается со скоростью 10 гигабит/секунду (или, как говорят исследователи в статье10 гигабод). Для наглядности: обработка данных о 100 миллионах сердечных сокращений заняла всего за одну секунду, также как и распознавание 34 700 000 рукописных цифр из объёмной базы MNIST, сделанных разными почерками, сохраняя при этом высокую точность классификации.

Биологические нейроны бывают разных типов. Например, градуальные нейроны обрабатывают информацию с помощью непрерывных изменений мембранного потенциал, а спайковые используют потенциалы действия по принципу «всё или ничего», отправляя сигналы в привычном для ИТ двоичном формате — «включено» или «выключено».

Большинство искусственных нейронов, существующих сегодня, — это фотонные импульсные нейроны. Они стали резким прогрессом в своё время, но сейчас их преимущества нивелируются ограниченной скоростью отклика, рисками потери данных и необходимостью дополнительного аппаратного обеспечения. Касаемо скорости, неприятности связаны с тем, что фотонные нейроны, генерирующие спайки, обычно подают входные импульсы в усилительный элемент лазера. Это приводит к задержке, которая и ограничивает скорость реакции нейрона, так сказать, в общем зачёте.

Чтобы обойти эти препятствия, исследователи Китайского университета Гонконга разработали совершенно другую методику, основанную на лазере, позволяющем избежать этих задержек. Для этого понадобилось изобрести новый подход, о котором авторы говорят как о системе резервуарных вычислений на основе лазера.

Для своего нейрона с лазерной настройкой исследователи использовали подачу радиочастотных сигналов в элемент квантово-точечного лазера с насыщаемым поглощением. Помимо колоссального ускорения, проработка высокоскоростных радиочастотных элементов для насыщаемого поглощения позволила упростить систему и значительно увеличить её энергоэффективность.

Новая система использует особый тип сети для обработки данных, зависящих от времени, отражая нелинейную динамику и значительно повышая скорость обработки данных нейроном, делая его идеальным для высокоскоростных вычислений. Она продемонстрировала превосходное распознавание образов и прогнозирование последовательностей, особенно в долгосрочных прогнозах.

«Обладая мощными эффектами запоминания и превосходными возможностями обработки информации, один нейрон с лазерной обработкой может вести себя как небольшая нейронная сеть, — заявляет руководитель исследовательской группы Чаоран Хуан. — Таким образом, даже один нейрон с лазерной обработкой без дополнительных сложных соединений может выполнять задачи машинного обучения с высокой производительностью».

Догнать человека.

шкала "общей" успеваимости ИИ 

Источник.

20 декабря новая модель искусственного интеллекта o3, разработанная OpenAI, показала сопоставимые с человеческими результаты в тесте, созданном для измерения так называемого общего интеллекта. Она набрала 85% баллов в тесте ARC-AGIАбстрактное и логическое основание для искусственного общего интеллекта») — эталоне для измерения эффективности приобретения ИИ навыков в решении неизвестных задач.

«Новая система OpenAI o3, обученная на общедоступном наборе данных ARC-AGI-1, показала прорывной результат 75,7% на наборе данных Semi-Private Evaluation при заявленном нами ограничении вычислительных ресурсов в 10 тысяч долларов, — пишет Франсуа Шолле, автор этого теста, в своей статье. — Конфигурация o3 с большим количеством вычислительных ресурсов (172x) показала результат 87,5%».

«Это неожиданное и важное скачкообразное увеличение возможностей ИИ, демонстрирующее новую способность к адаптации задач, которой раньше не было в моделях семейства GPT, — рассказывает исследователь. — Для сравнения: ARC-AGI-1 потребовалось 4 года, чтобы пройти путь от 0% с GPT-3 в 2020 году до 5% в 2024 году с GPT-4o. Все представления о возможностях ИИ придётся обновить для o3».

Да, эти результаты значительно выше предыдущего рекорда, но важнее то, что они соответствуют средним показателям человека — тем самым 85%. Помимо этих заданий, o3 также хорошо справилась с очень сложным математическим тестом.

Все крупные исследовательские лаборатории в области ИИ стремятся к созданию искусственного общего интеллекта (он же — AGI). На сегодня это основная цель всей отрасли, и команда OpenAI, похоже, значительно приблизилась к цели. Однако общий интеллект — слишком сложное понятие, и, вообще-то, учёный мир сам не может определиться как трактовать эту идею, и какие исключительные признаки могут нам безошибочно указать на достижение машинами этой категории интеллектуальности. 

Общий интеллект пока немногим проще для понимания, чем сознание, что является основной причиной преобладания некоторого скептицизма среди исследователей и разработчиков. Тем не менее, многие деятели из этой сферы признаются в ощущении, будто что-то уже изменилось, и перспектива создания общего ИИ теперь кажется им более реальной, насущной и близкой, чем ожидалось. Но «кажется» — категория не просто неточная, но и неисчислимая. Если хотите даже — совершенно не научная, а ведь нам нужно бы знать наверняка, чего мы можем ожидать от столь искусной машины: будет это, условно говоря, какая-то Кристина или Бамблби? В общем, насколько учёные правы в своём «кажется»?

Чтобы это понять, для начала нужно разобраться с результатами o3.

С технической точки зрения тест является проверкой «эффективности выборки» интеллектуальной системы во время адаптации к чему-то новому. Фактически это означает количество изучаемых примеров, необходимое ИИ для выведения закономерностей работы этих примеров. Например, ChatGPT (GPT-4), не очень эффективен в этом задании. Он был «обучен» на миллионах примеров человеческого текста, создавая вероятностные «правила» о том, какие комбинации слов наиболее часто встречаются. Объём данных — его слабое место. Он результативен для многих задач, и множество людей по всему миру используют его очень интенсивно, однако в решении необычных задач он почти бессилен — и как раз потому, что у него мало обучающих сведений. Поэтому, в пору «голода данных», такие системы ИИ упираются в потолок своих возможностей.

До тех пор, пока системы искусственного интеллекта не смогут обучаться на небольшом количестве примеров и адаптироваться с большей эффективностью, они будут использоваться только для очень повторяющихся задач и там, где допустимы случайные сбои. Способность точно решать ранее неизвестные или новые задачи на основе ограниченных выборок данных известна как способность к обобщению. Она считается необходимым и даже фундаментальным элементом интеллекта.

Тест ARC-AGI проверяет эффективную адаптацию образца, используя небольшие задачи с квадратами сетки, подобные приведённой ниже. ИИ должен вычислить шаблон, который превращает сетку слева в сетку справа.

задачка 

Пример задачи из эталонного теста ARC-AGI. Источник

В каждом вопросе приводятся три примера для изучения. Затем испытуемой системе необходимо определить правила, которые «обобщают» три примера и применимы к четвёртому. Эти задания очень похожи на школьные тесты IQ, которые вы, возможно, помните, и к научной состоятельности которых есть множество вопросов у нейролингвистики.

Итак, о3 это сделал, сравнялся с человеком. Мы не знаем точно, как именно OpenAI этого добился, но результаты показывают, что новая модель легко адаптируется, находя обобщающие правила для всего нескольких примеров. Это говорит о том, что она либо не делает лишних предположений, либо отметает их.

И действительно, чтобы выявить закономерности, мы также должны быть конкретными не больше, чем нужно, чтобы не забраться в дебри данных. Умение определять самые простые правила достижения цели максимально расширяет нашу способность адаптироваться. Например, в изображённом тесте она будет примерно такой: любая фигура с выступающей линией будет перемещаться к концу этой линии и перекрывать любые другие фигуры.

Некоторые учёные считают, что оптимизация системы o3 для поиска этих самых «слабых правил» маловероятна. Тем не менее, для успешного выполнения задач ARC-AGI, нейромодель всё-таки должна уметь их находить. Так, тот же Франсуа Шолле полагает, что o3 просматривает различные «мыслительные цепочки», описывающие шаги для решения задачи. Затем ИИ выбирает «лучший» вариант в соответствии с некоторым расплывчатым правилом или «эвристикой».

Это было бы «неотличимо» от того, как система AlphaGo (Google) искала различные возможные последовательности ходов, чтобы победить чемпиона мира по го Ли Седоля. Такие цепочки рассуждений можно рассматривать как программы на выявление соответствий. Для ИИ, играющего в го, этот эвристический поиск приблизительных правил категорически необходим, чтобы решить, какие ходы лучше.

Могут быть сгенерированы тысячи различных, казалось бы, одинаково эффективных программ. Среди них могут быть как вывод «выбери самую слабую», так и «выбери самую простую», однако, если это похоже на AlphaGo, то разработчики о3 просто заставили модель создать эвристику. Так было и с AlphaGo: Google обучил модель оценивать различные последовательности ходов как более или менее удачные, чем другие.

Тем не менее, никакие предположения о методах достижения такого результата не дают ответ на самый важный вопрос: действительно ли это ближе к общему ИИ?

С одной стороны, если o3 работает именно так, то базовая модель может быть совсем ненамного лучше предыдущих претендентов. С другой же — концепции, которые модель усваивает из языка, могут быть не более подходящими для обобщения, чем раньше. Скорее всего нам просто выпало наблюдать более обобщаемую «цепочку рассуждений», найденную с помощью дополнительных этапов обучения эвристики, специализированной для этого теста. Доказательством, как всегда, будет результат.

OpenAI ограничилась несколькими презентациями в СМИ и ранним тестированием для профильных специалистов. Поэтому, раз уж почти все о новой нейромодели остаётся неизвестным, подлинное понимание её потенциала требует проведения большой работы с натурой. Нужно изучить и оценить о3 с разных сторон: на распределение возможностей, на эффективность, на точность и отказоустойчивость. Когда модель наконец выйдет, исследователи смогут лучше понять её адаптивность к окружающей среде и сравнить с аналогичными показателями среднестатистического человека.

Если окажется, что новая версия ИИ действительно делает то, что показали тесты ARC-AGI, мы вступим в новую эру самосовершенствующегося ускоренного интеллекта. Вследствие этой революции в технологиях мы окажемся на развилке, которая потребует новых ориентиров для общего ИИ: не только технологических, но также экономических и политических. Нам предстоит серьёзное рассмотрение вопросов, связанных с управлением AGI, с регулированием гражданских и международных прав и свобод и экономических интересов. Это может начать новую эпоху.

Если же универсальная модель окажется не столь хороша, то продемонстрированные результаты всё равно останутся впечатляющими. Да, повседневная жизнь практически не изменится, перспективы останутся перспективами, зато и небывалых прежде забот и проблем в ближайшее время не прибавится. А посему есть время проработать для них упреждающие решения, поскольку, как известно, прогресс не стоит на месте, и, следовательно, эра общего искусственного интеллекта хоть когда-нибудь, да наступит. А значит что?

А значит «лучшее, конечно, впереди». Нас ждёт ИИ мало того что быстрее мозга, так ещё и «понимающий» (и в чём-то даже… живой?), — и это далеко не верхушка айсберга, а только намёк на неё. Новости из мира нейротехнологий прибывают ежедневно, и имя им — как говорится — легион. Что ж...

С наступающим будущим нас!

 


АРМК, по материалам Science X, Science, SciTechDaily, Optica, The Conversation, ARC Prize.