Кокетливый интеллект. Как научить искусственный интеллект флиртовать?

Tekst
1
Recenzje
Przeczytaj fragment
Oznacz jako przeczytane
Jak czytać książkę po zakupie
Nie masz czasu na czytanie?
Posłuchaj fragmentu
Кокетливый интеллект. Как научить искусственный интеллект флиртовать?
Кокетливый интеллект. Как научить искусственный интеллект флиртовать?
− 20%
Otrzymaj 20% rabat na e-booki i audiobooki
Kup zestaw za 48,95  39,16 
Кокетливый интеллект. Как научить искусственный интеллект флиртовать?
Audio
Кокетливый интеллект. Как научить искусственный интеллект флиртовать?
Audiobook
Czyta Ирина Ефросинина, Искусственный интеллект Ivan
25,35 
Zsynchronizowane z tekstem
Szczegóły
Czcionka:Mniejsze АаWiększe Aa

1 перец

2½ ст. л. сахара, сахара

Собрать вместе некваску и перемешивать, пока смесь не загустеет. Затем добавить яйца, сахар, мед и семена тмина, запекать при малой температуре. Добавить кукурузный сироп, орегано и розмарин и белый перец. Положить крем по теплу. Готовить добавить оставшуюся 1 чайную ложку смеси для кексов и соль. Запекать при 175° от 2 до 1 часов.

Подавать горячим.

На 6 персон.

На этот раз получился не рецепт, а катастрофа. ИИ пришлось разбираться, когда следует использовать шоколад, а когда картофель. В некоторых рецептах требовалось выпекать продукты, в других – варить на медленном огне, а продукты для салатов вообще не нуждались в термической обработке. В попытках запомнить и применить все эти правила ИИ чрезмерно распылил свои силы.

Те, кто обучает ИИ решать коммерческие задачи или научные проблемы, осознали, что надо делать уклон в специализацию. Если алгоритм вроде бы справляется с работой лучше, чем тот, что подарил миру «бутербродный куриный рис», то, вероятно, его учили выполнять узкую, тщательно сформулированную задачу – в том и состоит их главное различие. Чем у́же поле, в котором работает ИИ, тем более умным он кажется.

C-3PO VS ТОСТЕР

Именно поэтому ученые предпочитают различать слабый, или узконаправленный, искусственный интеллект[35] – существующие сейчас системы – и сильный, или общий, искусственный интеллект[36] – ИИ, который мы обычно встречаем в книгах и фильмах. Мы привыкли к рассказам о сверхразумных компьютерных системах наподобие Skynet или HAL или об очень похожих на людей роботах, таких как WALL-E, C-3PO, Дейта[37] и др. ИИ в этих произведениях иногда трудно распознать оттенки человеческих эмоций, но тем не менее он способен понимать происходящее, взаимодействовать с огромным количеством объектов и участвовать в широком спектре ситуаций. ОИИ может обыграть вас в шахматы, рассказать какую-нибудь историю, испечь пирог, описать словами овцу и назвать три предмета крупнее омара. А еще он существует лишь в научной фантастике, и большинство экспертов сходятся на том, что пройдет еще много десятилетий, прежде чем ОИИ станет реальностью, если вообще станет.

УИИ, с которым мы имеем дело в наши дни, отнюдь не такой сложный. Вообще он гораздо менее сложный. По сравнению с C-3PO так просто тостер.


Например, алгоритмы, о которых пишут в газетах и говорят в новостях, – те, что побеждают людей в играх наподобие шахмат или го, – превосходят человека в выполнении одной-единственной специфической задачи. Но машины уже давно превосходят человека в чем-то одном. Калькуляторы гораздо лучше выполняют деление, но не могут спуститься по лестнице.

Кстати, множество образчиков общего искусственного интеллекта в фантастике по какой-то причине не способны спускаться по лестнице. Дáлеки[38], C-3PO, ED-209 из «Робокопа»[39], HAL… Учимся дальше?



Какие же задачи достаточно узки для нынешних алгоритмов? К сожалению (вспомните тревожный признак обреченного ИИ № 1: проблема слишком сложна), зачастую проблемы реального мира оказываются шире, чем кажется на первый взгляд. В примере из главы 1, где шла речь об ИИ, обрабатывающем видеозаписи собеседований, задача видится не такой уж сложной – надо лишь распознавать эмоции на лицах людей. Но как быть с кандидатами, перенесшими инсульт, с теми, у кого на лице шрамы или кто не проявляет эмоции нейротипичным способом? Человек может войти в положение кандидата и подстроиться под него, но ИИ для аналогичной «подстройки» потребовалось бы распознать его слова (перевод речи в слова – задача для отдельного ИИ-решения), понять, что они означают (пока что ИИ может интерпретировать значение ограниченного количества фраз, касающихся ограниченного числа областей, и плохо справляется с вариациями и оттенками смысла), и с помощью этих знаний и навыков изменить собственное восприятие данных об эмоциях. Нынешние ИИ неспособны делать такую сложную работу и, вероятнее всего, отсеют таких людей до того, как их анкеты попадут к сотруднику-человеку.

Как мы увидим далее, создание автономных автомобилей – тоже попытка решить задачу более широкую, чем кажется на первый взгляд.

НЕДОСТАТОЧНО ДАННЫХ: НЕВОЗМОЖНО ПРОВЕСТИ РАСЧЕТ

ИИ обучается медленно. Допустим, существует некое животное под названием вуг: вы показываете человеку его изображение, а затем просите из большой пачки фотографий отобрать те, на которых есть этот зверь. Вероятно, человек неплохо справится с задачей, хоть и имеет в распоряжении лишь одну картинку. Искусственному же интеллекту потребуется проанализировать тысячи или сотни тысяч фотографий вугов, до того как он более-менее начнет этих вугов узнавать. Притом фотографии должны быть достаточно разнообразными, чтобы до алгоритма дошло, что слово «вуг» относится к животному, а не к полу в шахматную клетку, на котором он стоит, и не к человеку, который поглаживает вуга по головке.

Исследователи пытаются создать ИИ, способный осваивать навык с как можно меньшим количеством примеров (такая способность называется «обучение с первого раза»[40]), но пока что для решения задачи с применением ИИ вам потребуются поистине тонны тренировочных данных. Популярный набор ImageNet, на котором обучают системы генерации или распознавания изображений, сейчас содержит 14 197 122 фотографии, причем лишь в одной тысяче категорий. Это похоже на вождение: если человеку достаточно провести за рулем несколько сотен часов, прежде чем ему разрешат водить самостоятельно[41], одна только Waymo (компания, разрабатывающая самоуправляемые автомобили) к 2018 году накопила данные о пробеге длиной в более чем 9 650 000 километров, плюс больше 8 миллиардов километров в симуляциях[42]. И все же мы до сих пор не приблизились к широкому распространению самоуправляемых автомобилей. В основном из-за подобной «прожорливости» ИИ эпоха больших данных, когда все собирают и анализируют огромные массивы информации, идет рука об руку с эпохой искусственного интеллекта.

 

Иногда ИИ обучается так медленно, что позволять ему делать это в реальном времени становится непрактично. Так что процесс ускоряют, сжимая фактические сотни лет в считаные часы. Программа OpenAI Five для игры в DotA (онлайновая фэнтези-игра, где две команды соперничают за территорию на карте) сумела победить некоторых сильнейших игроков, предварительно сыграв серию тренировочных игр против себя же, а не живых людей. Для самого себя ИИ устраивал десятки тысяч игр одновременно и накапливал по 180 лет игрового времени ежедневно[43]. Даже если от ИИ требуется научиться делать что-то в реальном мире, имеет смысл предварительно создать для него симуляцию, чтобы сэкономить время и силы.

Еще одному ИИ поручили научиться не падать с велосипеда. Однако обучался он довольно-таки неспешно. Программисты видели все траектории, по которым двигалось переднее колесо, до того как виртуальный велосипед начинал все сильнее вилять и падал. Более сотни аварий произошло, прежде чем искусственный интеллект научился проезжать больше нескольких метров по прямой, и еще тысячи попыток отделяли его от того, чтобы путь растянулся на десятки метров.



Обучение ИИ в виртуальной имитации удобно, но не лишено рисков. Поскольку вычислительная мощность компьютеров ограничена, симуляция содержит меньше деталей, чем реальный мир, а еще в ней есть множество программных хитростей и упрощений. Если ИИ заметит такие упрощения и станет ими злоупотреблять, могут возникнуть проблемы (но об этом я расскажу позже).

ВЫЕЗЖАЕМ НА СПИНЕ ЧУЖОГО АЛГОРИТМА

Вы можете решить задачу при помощи ИИ даже с небольшим объемом обучающих данных, если кто-то другой уже решал похожую задачу. Начиная не с чистого листа, а с конфигурации, установившейся после тренировки на предыдущем наборе данных, алгоритм переиспользует многое из того, чему научился. Допустим, у меня уже есть ИИ, генерирующий названия метал-групп. Если позже передо мной встанет задача сделать ИИ, который будет придумывать названия сортов мороженого, я получу нужный результат быстрее и использую для обучения меньше данных, если я возьму за основу алгоритм, специализирующийся на метал-группах. Такой ИИ уже знает:

• насколько длинным (приблизительно) должно быть каждое название;

• с буквы какого регистра должно начинаться первое слово на новой строке;

• какие комбинации букв встречаются часто – «ое», «ол», «ль» и «ан» (а от этого уже недалеко до слов «ванильное», «кола», «карамель» и «ананасовое»!);

• какие слова часто встречаются, например «с» или э-э-э… «смерть»?

Несколько небольших раундов обучения позволят перестроить модель ИИ с производства таких сочетаний:

Краснодракон крови

Штандарт-оргия

Разлом смерти

Штормовой сад

Хищниг

Помойник

Ненеуклюжие

Нечеловеческий песок

Драконовы бобы и стальной ух

Ковер хаоса

Суеффферия подлескуса


на производство таких:

Лимонный орео

Клубничный пончик

Вишневый чай

Солодовое «Черное безумие»

Тыквенно-гранатовый шоколадный батончик

Копченый кокосовый лювс

Печеный базилик

Горный инжир с клубничным вывертом

Шоколадная шоколадная шоколадная шоколадная дорога

Шоколадный арахисовый шоколадный шоколадный шоколад


(Правда, в середине процесса алгоритм проходит такую ма-аленькую неловкую фазу, когда появляются варианты типа представленных ниже.)

Завиток ада

Человекокрем

Тоффи «Ночное колено»

Смерть Фисберрадерна

Некрозвезда с шоколадным человечком

Панихида тянучки

Крем зверя

Закончить всё

Сыр смерти

Кровавый пекан

Молчание кокоса

Огнябочка

Паук и солончаковка

Черничный ожог


Возможно, мне стоило начинать с пирогов.



Оказалось, что ИИ-модели очень многое используют повторно – это называется трансферным обучением. Если начать с ИИ, который уже прошел часть пути к цели, можно не только обойтись меньшим количеством данных, но и сэкономить много времени. Чтобы натренировать самые сложные алгоритмы на самых больших наборах, нужны дни или недели, даже если привлекать к работе мощные компьютеры. В случае с трансферным обучением тренировка займет лишь несколько минут или секунд.

Трансферное обучение – частая практика при создании систем распознавания образов, поскольку тренировка алгоритма с нуля потребует много времени и данных. Часто люди берут за основу алгоритм, способный распознавать объекты основных категорий на картинках общего содержания, и потом обучают его распознавать специфические объекты. Например, если система уже знает, как выглядят на изображениях грузовики, кошки и футбольные мячи, можно считать, что у него уже есть неплохие задатки, чтобы стать, скажем, сканером продовольственных товаров. Поиск границ, распознавание форм, классификация структур – правила для выполнения этих и многих других задач общий распознающий алгоритм уже усвоил, и сканеру пищевых продуктов они очень пригодятся.



НЕ ПРОСИТЕ ЕГО ПОМНИТЬ

Решить задачу при помощи ИИ будет легче, если она не требует много памяти. Из-за ограниченных «умственных» способностей алгоритмы ИИ особенно плохи в запоминании всякой всячины. Это проявляется, например, в том, как ИИ играет в компьютерные игры. Он начинает вести себя сумасбродно по отношению к запасам «жизни» персонажей и другим ресурсам (например, к мощным атакам, количество которых ограничено). Под управлением ИИ персонажи на старте почем зря тратят жизни и заклинания, пока их запас не становится критически малым, – в этот момент ИИ внезапно принимается осторожничать[44].

Один искусственный интеллект научился играть в игру Karate Kid, но постоянно разбазаривал все «удары журавля» в начале игры. Почему? А потому что его памяти хватало только на прогнозирование следующих шести секунд игры. Как сказал Том Мёрфи, обучавший этот алгоритм: «Если вам что-то может понадобиться через шесть секунд… что ж, забудьте об этом. Растрачивать „жизни“ и другие ресурсы – характерная ошибка»[45].

Даже сложные алгоритмы наподобие ИИ-игрока в DotA от OpenAI располагают лишь ограниченным временным «окном», в рамках которого они могут помнить и предугадывать события. OpenAI Five умеет смотреть в будущее на впечатляющие две минуты (впечатляющие для игры, где столько всего сложного случается за такое короткое время), но матчи в DotA длятся иногда по 45 минут, даже больше. И хотя OpenAI Five способен играть с ужасающим уровнем агрессивности и точности, кажется, он не знает, как применять игровые методы, которые приносят пользу на длительном промежутке времени[46]. Как и простой бот для игры в Karate Kid, слишком быстро расходующий «удары журавля», этот ИИ часто использует наиболее мощные атаки персонажа сразу же, а не приберегает их на будущее, хотя бо́льшую роль они могли бы сыграть под конец матча.

Неспособность искусственного интеллекта к планированию проявляется часто. На втором уровне аркады Super Mario Bros. есть печально известная платформа, погибель всех ИИ. На ней столько сияющих монет! Ко второму уровню искусственный интеллект обычно уже знает, что монеты – это хорошо. Еще он, как правило, понимает, что необходимо двигаться направо, чтобы успеть достичь конца уровня до того, как закончится время. Но если ИИ запрыгивает на платформу, ему нужно вернуться к ее началу, чтобы спуститься. До этого алгоритму еще не приходилось двигаться назад. ИИ застревает, не в силах понять, что следует делать, и время, отведенное на прохождение уровня, кончается. «Чтобы решить эту проблему, я потратил целых шесть выходных и тысячи часов работы процессора», – сказал Том Мёрфи, которому в итоге удалось провести свой ИИ мимо платформы, улучшив его способности к долговременному планированию[47].

Короткая память ИИ становится проблемой также при синтезе текста. Например, Heliograf – алгоритм для автоматизации работы журналистов, переводящий отдельные строчки в таблице в набор фраз формальной спортивной заметки, – функционирует нормально потому, что каждое предложение в заметке не особо зависит от других. ИИ нет нужды помнить содержание статьи.

Нейросети для машинного перевода наподобие той, что лежит в основе сервиса Google Translate, тоже не запоминают целые абзацы. Предложение или его часть обычно можно перевести на другой язык, ничего не зная о том, что было перед ним. Когда в тексте встречается смысловая взаимосвязь – например, когда значение термина зависит от информации из предыдущего предложения, – ИИ, как правило, не способен ее уловить.

В других случаях дырявая память ИИ становится еще более очевидной. В качестве примера можно привести рассказы, сочиняемые алгоритмами. Искусственный интеллект не пишет книги и не делает ТВ-постановки (хотя в этом направлении, конечно, работают) не без причины.

Один из способов понять, кем написан текст – алгоритмом машинного обучения или человеком (или, по крайней мере, под жестким контролем человека), – посмотреть, нет ли в нем ошибок, связанных с плохой памятью. На 2019 год лишь некоторые ИИ начали приобретать способность помнить значимую на большом промежутке времени информацию, заключенную в рассказе, – и даже несмотря на это они склонны то и дело забывать важное.

Множество других ИИ для синтеза текста помнят в каждый момент всего лишь несколько слов. Например, вот что рекуррентная нейросеть[48] написала после обучения на девятнадцати тысячах описаний человеческих снов с сайта dreamresearch.net:

 

Я встаю и иду по коридору к его дому и вижу птицу в очень узком ящике стола, и это группа людей в распашных дверях. В доме словно пожилой мужчина собирается купить себе ключей. Он смотрит на его голову с помощью картонного приспособления, и тут мои ноги остановились на столе.


Этот сон раздражающе невнятный, в нем на ходу меняются обстановка, настроение и даже персонажи. В таких «снах нейросетей», как видно, связность сохраняется на протяжении примерно одного предложения, а иногда запаса памяти и на него не хватает. Появляются персонажи, с которыми читателя никто не знакомит, как будто речь о них идет уже давно. «Спящий» постоянно забывает, где находится. Отдельные фразы могут казаться осмысленными и по ритму нормальными, если только вы не обращаете внимания на их суть. Внешние признаки человеческой речи присутствуют, но смысла нет – это отличительная черта текста, сгенерированного нейросетью.

На следующей странице есть еще один пример – на этот раз кулинарный рецепт, – по которому еще лучше видно, как сказывается на тексте недостаток памяти. Это результат работы той же рекуррентной нейросети (или алгоритма машинного обучения), что составила рецепты, приведенные на с. 55−57. (Как видите, он учился на разнообразных рецептах, в том числе на рецептах черного пудинга, разновидности кровяной колбасы.) Эта нейросеть создает текст букву за буквой; она смотрит на уже написанные буквы и решает, какая должна идти следующей. Но для каждой дополнительной включенной в анализ буквы надо выделить память, а памяти в распоряжении нейросети лишь столько, сколько ее есть на компьютере, где работает алгоритм. Поэтому, чтобы сократить требования к памяти до разумных пределов, нейросеть учитывает лишь последние символы текста, по несколько штук в каждый момент. На своем компьютере я выделила под этот конкретный алгоритм такой объем памяти, что он мог «запоминать» по 65 символов, – самое большее, что я могла себе позволить[49]. Вы увидите, в каком месте при составлении рецепта у нейросети кончалась память и она забывала, что делает шоколадный десерт, – примерно там, где она решала добавить черный перец и какой-то «рисовый крем».

Ситуация с ограниченностью памяти начинает меняться. Ученые стараются сделать так, чтобы рекуррентные нейросети, предсказывая следующие буквы, принимали в расчет и свежие кусочки информации, и те, что упоминались в тексте давно. Есть алгоритмы, что сначала смотрят на мелкие детали на изображениях (на границы и текстуры, например), а затем стараются охватить всю картинку целиком – вот и здесь такой же принцип. Такая стратегия называется методом свертки[50]. Сверточная нейросеть (она в сотни раз больше той, которую я обучала на своем ноутбуке) способна отслеживать достаточно информации, чтобы не забывать, о чем идет речь в тексте. Следующий рецепт составлен нейронной сетью под названием GPT-2 от OpenAI, обученной на очень большой выборке сайтов; я настроила ее на решение своей задачи, проведя дополнительную тренировку на различных видах рецептов.



Торт кусочками

торты, десерты

8 чашек муки

1800 г сливочного масла; комнатной температуры

2¼ чашки кукурузного сиропа; разделить на две части

2 яйца; в виде пюре, охладить

1 чайная ложка винного камня

½ чашки конфеток m&m’s

225 г порезанных на кусочки яичных белков

1 просеянный шоколад

Сбивать 2¼ чашки муки на средней скорости до загустения.

Слегка смазать и посыпать мукой две смазанных и покрытых воском проложенных бумагой коробочки ингредиентов; смешать муку, сироп и яйца. Добавить винный камень. Налить в прямоугольную форму объемом около 4 литров. Выпекать 35 минут при 230 °C. Одновременно с этим в большой миске смешать сироп, белки и шоколад; перемешивать которые до получения равномерной смеси. Охладить форму. Полить весь торт 2 столовыми ложками шоколадной смеси. Поставить в холодильник, пока не придет время подавать.

Количество порций: 20


Теперь, когда память нейросети улучшилась за счет свертки, она помнит о большей части упомянутых ингредиентов и даже о том, что собиралась приготовить торт. Ее инструкции все еще несколько неправдоподобны – мука без добавок не загустеет, сколько ее ни размешивай, и смесь муки, сиропа и яиц вряд ли превратится в тортик, даже если добавить в нее винный камень. Но тем менее этот рецепт намного превосходит по качеству шоколадный бутерброд «черный пудинг».

Вот еще пример работы алгоритма GPT-2 – на этот раз он попытался написать фанфик по «Гарри Поттеру». Алгоритм не забыл, какие персонажи участвуют в сцене, и даже помнит вновь всплывающие детали – в данном случае тот факт, что у Снейпа на голове была змея.

Снейп: Я понимаю.

[Появляется змея, и Снейп помещает ее себе на голову, и кажется, что она произносит слова. Она говорит: «Я прощаю тебя».]

ГАРРИ: Ты не можешь возвратиться, если не простишь.

Снейп: [вздыхает] Гермиона.

ГАРРИ: Хорошо, слушай.

Снейп: Я хочу извиниться перед тобой за то, что разозлился и расстроился из-за этого.

ГАРРИ: Ты в этом не виноват.

ГАРРИ: Это не то, что я имел в виду.

[Появляется другая змея, и говорит потом: «И я прощаю тебя».]

ГЕРМИОНА: И я прощаю тебя.

Снейп: Да.

Другая стратегия борьбы с ограничением объема памяти состоит в том, чтобы группировать базовые единицы текста – так нейронная сеть сможет поддерживать связность и притом помнить меньше разных вещей. Не 65 символов, а, скажем, 65 слов или даже элементов сценария. Если бы я подготовила для нейросети ограниченный набор ингредиентов и указала, как их сочетать, – именно так поступила команда Google, стремившаяся создать новое печенье без глютена с шоколадной крошкой, – то она бы каждый раз выдавала хороший рецепт[51]. Увы, говорят, что итоговые тексты Google, хотя и напоминают рецепты печенья больше, чем что-либо из получавшегося у моего алгоритма, по-прежнему оставляют желать лучшего[52].

А МОЖНО РЕШИТЬ ПРОБЛЕМУ ПРОЩЕ?

Это подводит нас к одному из последних вопросов, благодаря которому мы сможем определить, подходит ли какая-то задача для ИИ (но не то, будет ли человек с помощью ИИ ее решать): действительно ли машинное обучение – самый простой способ достичь цели?

До появления больших ИИ-моделей и огромных массивов данных некоторые задачи решать было трудно. Искусственный интеллект произвел революцию в распознавании образов и машинном переводе, так что автоматическая расстановка тегов на фото и использование Google Translate стали повсеместны. Записать правила для решения подобных задач вручную крайне сложно, тогда как ИИ способен проанализировать кучу информации и сформировать нужные правила сам. Скажем, изучить сотню характеристик абонентов, перешедших к конкурентам, и догадаться, как определять в будущем, какой клиент последует их примеру. Может статься, это те клиенты, что молоды, живут в зонах с покрытием хуже среднего и пользовались услугами компании меньше полугода.



Опасность заключается в том, чтобы по ошибке не применить сложное ИИ-решение там, где требуется лишь толика здравого смысла. Может, уходят те клиенты, что были на тарифе с еженедельной доставкой тараканчиков, а этот тариф ужасен.

ПУСТИТЬ ИИ ЗА РУЛЬ?

Ну а что же автономные автомобили? Есть множество причин того, почему решение задачи вождения с помощью ИИ так заманчиво. Нам бы, конечно, хотелось автоматизировать этот процесс – многие люди находят его утомительным, другие считают, что научиться вождению вообще невозможно.

У компетентного робота-водителя будет молниеносная реакция, он никогда не отклонится от центра полосы и не уйдет в занос, не станет проявлять агрессию на дороге. На самом же деле беспилотные автомобили склонны маневрировать чересчур медленно, у них проблемы с выездом на автомагистраль в час пик и с тем, чтобы перестроиться и повернуть налево на запруженной улице[53]. Тем не менее ИИ никогда не устает и способен крутить руль долгие часы, пока люди в машине дремлют или веселятся.

К тому же мы можем накапливать большое количество данных – по крайней мере, пока в силах оплачивать труд водителей, которые накатывают миллионы километров по дорогам. Или построить виртуальные симуляторы, чтобы ИИ проверял и улучшал навыки в ускоренном режиме.

Требования к памяти для вождения тоже довольно скромны. В каждый момент выбор скорости движения или воздействия на руль не зависит от того, что происходило, скажем, пять минут назад. Планированием маршрута занимается программа навигации. Препятствия на дороге, такие как пешеходы или дикие животные, возникают и пропадают за считаные секунды.

И наконец, автоматизировать управление автомобилем программными средствами столь непросто, что других хороших решений просто не существует. ИИ – единственное, что сейчас позволяет достичь наилучших успехов в этом направлении.

И все же остается открытым вопрос: является ли вождение достаточно узкой задачей, чтобы с ней полностью справлялся существующий ИИ, или же нужно что-то помощнее вроде упомянутого общего искусственного интеллекта (ОИИ) с уровнем мышления, сопоставимым с человеческим? Сейчас доказано, что автономные автомобили способны преодолевать миллионы километров самостоятельно, и некоторые производители подобных решений сообщают, что во время испытаний человек вмешивался лишь раз каждые несколько тысяч километров. Однако как раз то, что вмешательство требуется лишь в редких случаях, труднее всего полностью искоренить.

Люди спасали беспилотные автомобили в самых разных ситуациях. Как правило, компании-производители не раскрывают причин так называемых разъединений – так делают только там, где этого требует закон. Отчасти, возможно, потому перечень причин «разъединения» пугающе обыденный.

В 2015 году в научном докладе[54] исследователи привели некоторые из них. Автомобили, о которых шла речь, помимо всего прочего:

• видели препятствие в свисающих над дорогой ветвях;

• переставали понимать, в какой полосе движется другая машина;

• решали, что на перекрестке слишком много пешеходов, так что ИИ не справится;

• не замечали автомобиль, выезжающий из гаража;

• не видели, что автомобиль впереди начинает движение от обочины.

Случай в марте 2018 года, окончившийся гибелью человека, произошел из-за подобной промашки: беспилотный автомобиль не сумел вовремя распознать пешехода; вначале ИИ классифицировал женщину на дороге как неизвестный объект, потом как велосипедиста и только под конец, когда на торможение оставалось лишь 1,3 секунды, – как пешехода. (Проблема усугубилась тем, что аварийную систему торможения автомобиля отключили, заменив ее сигналом тревоги для водителя, притом сама система не была спроектирована так, чтобы такие сигналы подавать. Ко всему прочему водитель провел уже много часов за рулем, не вмешиваясь в управление, а в такой ситуации подавляющее большинство людей не могут похвастаться внимательностью[55].) Авария с фатальным исходом в 2016 году тоже произошла из-за такой ошибки – автономный автомобиль не распознал в фуре препятствия (см. врезку ниже).

В 2016 году произошла авария со смертельным исходом – водитель Tesla включил автопилот на городской улице вместо автострады, хотя он для нее не предназначался. Перед машиной дорогу пересекал грузовик, однако автопилот не стал тормозить – он не опознал грузовик как препятствие, от столкновения с которым надо уходить. Согласно анализу фирмы Mobileye (создавшей систему предотвращения столкновений), поскольку автопилот разрабатывали для применения на автострадах, его тренировали избегать лишь опасностей впереди. То есть ее научили распознавать грузовики и фуры по изображению сзади, а не сбоку. По информации Tesla, когда ИИ обнаружил фуру, то опознал ее как висящий над дорогой знак и решил, что тормозить не надо.

И это не говоря о том, что на дороге можно столкнуться с чем-то более необычным. Когда компания Volkswagen впервые испытывала в Австралии свой автомобильный ИИ, обнаружилось, что его сбивают с толку кенгуру. Искусственный интеллект явно до того не имел дела с прыгающими объектами[56].

Учитывая, сколько всего может встретиться на дороге: парады, сбежавшие страусы эму, упавшие линии электропередач, вулканическая лава, аварийные дорожные знаки с необычными инструкциями, затопление патокой[57], карстовые воронки, – неизбежно рано или поздно случится нечто, с чем ИИ никогда не сталкивался во время обучения. Крайне трудно создать такой ИИ, который будет адекватно вести себя в любой непредвиденной ситуации, то есть поймет, что сбежавшие эму станут носиться вокруг, а карстовый провал останется на месте; что хотя лава течет и собирается в лужи почти как вода, это не значит, что через нее можно проехать.

Автомобильные компании пытаются адаптировать свои стратегии с учетом того, что на дороге неизбежно будут случаться сбои и странности. Они рассматривают вариант сделать для беспилотников закрытые дороги с контролируемой обстановкой (хотя проблему сбежавших эму это не факт что решит; эму коварны) или отправлять автономный транспорт караваном вслед за ведущим автомобилем с водителем-человеком. Иными словами, поиск компромиссов приводит нас к решениям, которые очень напоминают разновидность общественного транспорта.


Уровни автономности беспилотных автомобилей


В наши дни, если ИИ чего-то не понимает, он отключается – это значит, что управление внезапно переходит к человеку за рулем. Автоматизация третьего уровня, условная автоматизация, – самое большее, на что можно рассчитывать в современных коммерческих продуктах; автомобиль Tesla в режиме автопилота способен часами ехать самостоятельно, но вмешательство водителя может потребоваться в любой момент. Проблема с этим уровнем автоматизации заключается в том, что лучше бы человек постоянно находился за рулем и внимательно следил за дорогой, а не сидел на заднем сиденье и, скажем, не покрывал глазурью пончики. Люди очень-очень плохо показывают себя в ситуации, когда после долгих скучных часов пассивного наблюдения требуется внезапно сконцентрироваться и начать активно действовать. Допустить вмешательство человека – хороший способ приблизиться к тому уровню работы ИИ, который нам нужен, однако спасать беспилотные автомобили у людей получается из рук вон плохо.

35Англ. artificial narrow intelligence (ANI).
36Англ. artificial general intelligence (AGI).
37Skynet – компьютерная сеть в фильмах франшизы «Терминатор» Джеймса Кэмерона, завоевавшая мир и уничтожавшая людей. HAL 9000 – разумный бортовой компьютер космического корабля из фильма «2001: Космическая одиссея» (1968, реж. Стэнли Кубрик), решивший, что экипаж необходимо убить; также фигурировал в одноименном романе Артура Кларка, написанном на основе сценария к фильму, в создании которого писатель участвовал. WALL-E – робот, персонаж из одноименного фантастического мультфильма студии Pixar 2008 года. C-3PO – робот-переводчик, появлявшийся во всех трех трилогиях франшизы «Звездные войны». Дейта – андроид на службе Звездного флота в сериале «Звездный путь: Следующее поколение» и некоторых полнометражных фильмах по вселенной «Звездного пути».
38Дáлеки (Daleks) – кибернетические мутанты из британского научно-фантастического сериала «Доктор Кто». – Прим. ред.
39Фильм Пола Верховена 1987 года. – Прим. ред.
40Англ. one-shot learning.
41Актуально для США. В России достаточно 56 часов. – Прим. ред.
42Andrew J. Hawkins, “Inside Waymo’s Strategy to Grow the Best Brains for Self-Driving Cars,” The Verge, May 9, 2018, https://www.theverge.com/2018/5/9/17307156/google-waymo-driverless-cars-deep-learning-neural-net-interview.
43. “OpenAI Five,” OpenAI, по состоянию на 03.08.2019, https://openai.com/five.
44Katyanna Quatch, “OpenAI Bots Smashed in Their First Clash against Human Dota 2 Pros,” The Register, August 23, 2018, https://www.theregister.co.uk/2018/08/23/openai_bots_defeated.
45Tom Murphy (@tom7), Twitter, August 23, 2018, https://twitter.com/tom7/status/1032756005107580929.
46Mike Cook (@mtrc), Twitter, August 23, 2018, https://twitter.com/mtrc/status/1032783369254432773.
47Tom Murphy, “The First Level of Super Mario Bros. Is Easy with Lexicographic Orderings and Time Travel… After That It Gets a Little Tricky” (research paper, Carnegie Melon University), April 1, 2013, http://www.cs.cmu.edu/~tom7/mario/mario.pdf.
48Англ. Recurrent neural network (RNN), нейросеть с обратными связями.
49Нейросеть обладала также некоторым количеством долговременной памяти, и в этом отрезке она могла отслеживать информацию вне 65-символьного окна, но и этот участок памяти слишком мал, чтобы хранить весь список ингредиентов. В терминах технологии машинного обучения такой алгоритм определяется как нейронная сеть долгой краткосрочной памяти (англ. long short-term memory, LSTM), а не рекуррентная нейросеть в полном смысле слова.
50Англ. convolution.
51Benjamin Solnik et al., “Bayesian Optimization for a Better Dessert” (paper presented at the 2017 NIPS Workshop on Bayesian Optimization, Long Beach, CA, December 9, 2017), https://bayesopt.github.io/papers/2017/37.pdf.
52Sarah Kimmorley, “We Tasted the ‘Perfect’ Cookie Google Took 2 Months and 59 Batches to Create – and It Was Terrible,” Business Insider Australia, May 31, 2018, https://www.businessinsider.com.au/google-smart-cookie-ai-recipe-2018-5.
53Andrew Krok, “Waymo’s Self-Driving Cars Are Far from Perfect, Report Says,” Roadshow, August 28, 2018, https://www.cnet.com/roadshow/news/waymo-alleged-tech-troubles-report.
54C. Lv et al., “Analysis of Autopilot Disengagements Occurring during Autonomous Vehicle Testing,” IEEE/CAA Journal of Automatica Sinica 5, no. 1 (January 2018): 58–68, https://doi.org/10.1109/JAS.2017.7510745.
55Andrew Krok, “Uber Self-Driving Car Saw Pedestrian 6 Seconds before Crash, NTSB Says,” Roadshow, May 24, 2018, https://www.cnet.com/roadshow/news/uber-self-driving-car-ntsb-preliminary-report.
56Naaman Zhou, “Volvo Admits Its Self-Driving Cars Are Confused by Kangaroos,” The Guardian, July 1, 2017, https://www.theguardian.com/technology/2017/jul/01/volvo-admits-its-self-driving-cars-are-confused-by-kangaroos.
57В 1919 году в Бостоне лопнул огромный резервуар с патокой, которая в итоге затопила несколько улиц. В результате инцидента погибло больше 20 человек. – Прим. науч. ред.
To koniec darmowego fragmentu. Czy chcesz czytać dalej?