Вечером 24 апреля 1976 года жители крошечной итальянской деревушки Бова-Марина сообщили, что видели странный объект, похожий на блюдце, зависший над городом. В последующие недели эти воздушные наблюдения распространились по всей стране — явление, в конечном итоге известное как Инопланетное вторжение в Италию, навсегда изменило страну и, по сути, историю человечества.
Ни одно из этих исторических событий не происходило на самом деле. Они — плод воображения WebSim, инструмента искусственного интеллекта, созданного на хакатоне Mistral в Сан-Франциско в марте этого года.
Вот как это работает: Введите придуманный веб-адрес сайта, который вы хотели бы видеть существующим, и WebSim мгновенно создаст соответствующую веб-страницу. На прошлой неделе я попробовал, придумав этот URL:
https://en.wikipedia.org/wiki/Alien_invasion_of_Italy_(1976)
WebSim ответил впечатляющей статьей, которая начиналась в истинной манере Википедии: «Инопланетное вторжение в Италию — это серия необъяснимых событий, произошедших в Италии весной и летом 1976 года» — и продолжала развиваться дальше. Нажав на «Посмотреть историю», я даже попал в историю редактирования статьи, полную обычных для Википедии баталий по поводу того, какие части поддельного контента были настоящими, а какие — фальшивыми.
Мне было любопытно посмотреть, как далеко я смогу продвинуть это упражнение по созданию мира с помощью ИИ в WebSim, поэтому я создал URL-адрес для новостной статьи об инопланетном вторжении в Financial Times. Вот что я получил в ответ:
Это забавная игрушка, с которой можно поиграть. Она также напомнила мне о том, что вскоре может стать важной идеей в развитии ИИ: поиск новизны — метод создания ИИ, который поощряет поиск новых подходов, а не попытку сразу найти лучшее решение.
Подобная ориентация на мозговой штурм уже давно является популярным подходом к решению проблем. Большинство стратегий в области дизайна и инноваций намеренно являются бессрочными, в них используются «голубые штурмы», призванные стимулировать нестандартное мышление и неожиданные результаты.
Но «голубой» мозговой штурм — это не то, как сегодня работают большие языковые модели, такие как GPT. Генеративный ИИ скорее рекурсивный, чем дискурсивный — он обучается на огромных объемах существующей информации и предназначен для прямого продвижения к явным целям, оглядываясь на то, что было сказано и сделано вчера, а не на то, что может быть сказано и сделано завтра.
Поиск новизны меняет эту схему, предполагая, что наиболее эффективным способом решения проблемы для ИИ может быть не навязчивая оптимизация для достижения конкретной цели, а максимально широкий поиск, лишь изредка проверяющий, не нашел ли он перспективный результат.
На первый взгляд эта идея может показаться контринтуитивной. Но она обретает смысл, если задуматься о том, насколько сложны и непредсказуемы большинство проблем — по крайней мере, наиболее интересные проблемы — на самом деле.
Возьмем, к примеру, локомоцию — слово, которое исследователи используют для описания проблемы, позволяющей роботу двигаться. В реальном мире бесчисленное множество различных животных и машин находят бесчисленное множество уникальных способов перемещаться в пространстве. Лошади, велосипеды, черви, змеи и нелетающие птицы — все они применяют различные стратегии для решения проблемы локомоции, и непонятно, как глубокие размышления о том, как извивается дождевой червь, могут привести к идее галопа, крыльев или колес.
Но оказалось, что оптимальной стратегией может быть не глубокое, а широкое мышление. В исследовании, получившем провокационное название «Отказ от целей», ученые обнаружили, что поиск новизны открывает более стабильные и эффективные методы локомоции, чем стандартные подходы машинного обучения, которые вознаграждают поведение, наиболее похожее на ходьбу.
Как это связано с ИИ и творчеством?
На мой взгляд, эффективность поиска новизны демонстрирует две интересные и связанные между собой идеи:
- Творчество — это не просто эстетическая добродетель, это полезный и, возможно, даже необходимый аспект решения самых сложных проблем.
- Мы можем имитировать нечто похожее на творчество в компьютерных программах, перебирая огромное количество вариантов.
В компании Ноушен я каждый день работаю с такими языковыми моделями, как GPT, которые обладают огромной мощностью и полезностью, но часто предлагают душные, скучные ответы даже на такие простые творческие вопросы, как «Какие есть уникальные идеи для нашего следующего поста в социальных сетях?». Я думаю, что одной из причин неубедительных результатов этих моделей может быть то, что они не рассматривают широкий спектр вариантов. Сегодня, чтобы заставить наши модели ИИ делать то, что мы от них хотим, мы делаем подсказки максимально подробными и точными и обучаем модели на известных примерах точных инструкций и идеальных результатов. Неудивительно, что у них возникают проблемы с поиском новых идей.
Но что, если вместо того, чтобы загонять модели ИИ в рамки правил, мы дадим им возможность побродить?
В одном из моих самых любимых исследований в области ИИ команда из Массачусетского технологического института создала систему ИИ, которая изучала такие головоломки, как игры с рисованием и игры с укладкой кирпичей, рассматривая огромный спектр как хороших, так и плохих идей. Команда использовала подход, похожий на поиск новизны, отдавая предпочтение поиску творческих решений и новых идей, а не построению наиболее оптимальной прогнозной модели. Со временем система научилась решать головоломки — и по мере этого она комбинировала исходные строительные блоки, такие как отрезки линий и простые кривые, в более сложные формы, такие как спирали и многоугольники, которые она считала полезными для решения самых трудных головоломок.
Это возвращает нас к WebSim.
На мой взгляд, самый захватывающий аспект этого эксперимента заключается в том, что его скудные инструкции — этот простой придуманный URL — оставляют столько возможностей для изобретения и импровизации. Вместо того чтобы давать ИИ длинные и явные инструкции, пользователь просто указывает фальшивый URL, а ИИ, используя большую языковую модель, обученную имитировать фальшивый Интернет, придумывает страницу, которая, как кажется, может просто существовать в этом месте. Подсказка — это не строки и строки требований, которым ИИ должен следовать, а быстрая, простая отправная точка для исследования без правильного ответа.
Здесь можно извлечь глубокий урок. Возможно, вместо того чтобы обучать модели, способные находить новые решения с каждой попытки, нам следует сосредоточиться на создании среды, в которой мы сможем работать с ИИ, чтобы быстро и свободно экспериментировать с широким спектром идей, даже тех, которые поначалу кажутся неперспективными. Поиск новизны может открыть новые горизонты для инноваций. ИИ завтрашнего дня, в точности повторяя человеческую изобретательность, сможет предложить нам идеи, которые мы, возможно, никогда бы не открыли самостоятельно.