Неоконченная симфония Дарвина: Как культура формировала человеческий разум

Tekst
Przeczytaj fragment
Oznacz jako przeczytane
Jak czytać książkę po zakupie
Czcionka:Mniejsze АаWiększe Aa

Если все же прибегать к научению, то лучше всего, как выяснилось, использовать подражание. Мы выявили устойчивую прямую связь между долей, отводившейся в стратегии ходам НАБЛЮДАТЬ по сравнению с НОВАТОРСТВОВАТЬ, и успехами этой стратегии в состязании. Самые успешные стратегии разыгрывали ходы с научением не очень часто, но, когда делали это, почти всегда пользовались вариантом НАБЛЮДАТЬ. Однако за нехитрой на первый взгляд корреляцией между подражанием и успехом скрывалась более сложная зависимость, обнаруживаемая только при внимательном анализе. В целом самые успешные стратегии, прошедшие в меле второго этапа, объединяла общая закономерность: чем больше при научении использовалось НАБЛЮДАТЬ по сравнению с НОВАТОРСТВОВАТЬ, тем выше были результаты. При этом у стратегий, что выступили похуже, мы отмечали противоположное – чем больше доля подражания, тем ниже результаты. Из этого мы узнали кое-что весьма интересное: подражание не всегда благо. Подражание окупается, только если использовать его эффективно.

Стратегии-неудачницы пользовались подражанием себе в ущерб, поскольку, выбирая НАБЛЮДАТЬ, они пропускали ход ПРИМЕНЯТЬ с возможностью реализовать накопленный опыт, а простым разыгрыванием НАБЛЮДАТЬ пополнение репертуара агента новыми поведенческими моделями не гарантировано. На социальном научении это действительно сказалось очень сильно – на первом этапе турнира выбор хода НАБЛЮДАТЬ в 53 % случаев не вызывал нового поведения в репертуаре агента (в основном потому, что наблюдаемое поведение оказывалось ему уже известным). После хода НОВАТОРСТВОВАТЬ, напротив, всегда следовало новое поведение. Турнир подтвердил интуитивное предположение, с которого я начал эту главу: неудачное подражание к успеху не приведет. Повторю, чтобы подражание окупилось и увеличило индивидуальную приспособленность, оно должно использоваться эффективно.

Следующей нашей задачей было вычленить те свойства выигрывающих стратегий, которые обусловливали их превосходство. Как обнаружилось, критическим фактором выступает выбор момента для научения. В успешных стратегиях периоды научения совпадали с переменами в окружающей среде. Как мы помним, именно успешные стратегии в большинстве раундов разыгрывали ПРИМЕНЯТЬ, раз за разом выбирая из своего репертуара модель поведения, обеспечивающую наибольшую отдачу. Но перемены в окружающей среде влекут за собой перемены и в окупаемости поведения, взятого однажды за образец, причем, как правило, это перемены к худшему. Поведенческие модели, которые прежде приносили дивиденды, перестают быть выгодными. Вот тогда-то и следует разыгрывать ход НАБЛЮДАТЬ, поскольку возникает вероятность перенять поведение с большей окупаемостью. Ведь агенты, имеющие в своем репертуаре поведенческие модели, подходящие для новых условий, продолжат ПРИМЕНЯТЬ, а значит и предоставлять для подражания свое выгодное в новом контексте поведение. Другие же агенты, отдача от поведения которых резко упала, напротив, переключаются на роль учеников и приступают к научению, а следовательно, их менее выгодное поведение окажется теперь недоступно для подражания. Приурочивая таким образом научение к переменам, успешные стратегии повышали шансы агентов приобрести поведенческие модели, подходящие для новых условий.

Проигрывающие стратегии, в отличие от лидеров, не только чересчур усердствовали с научением, но и выбирали для него неверные моменты. Если окружающая среда неизменна, подражание нередко вызывает воспроизведение поведенческих паттернов, которые уже существуют в репертуаре агента. Чем практиковать научение в неверный момент, лучше было бы разыгрывать ход НОВАТОРСТВОВАТЬ, он, по крайней мере, гарантирует новое поведение. В результате для менее успешных разработок характерна обратная зависимость между подражанием и приспособленностью.

Ну а победила в турнире стратегия, которой ее авторы дали название ДИСКОНТ-АВТОМАТ[9]. Она детище двух дипломников из Королевского университета в Онтарио{291} – Дэна Каундена и Тима Лилликрапа. Дэн – математик, Тим – специалист по нейроинформатике, так что команда у них получилась солидная. Над своей стратегией они работали не один месяц, положив немало сил на то, чтобы изобрести оптимальный вариант, поэтому их выигрыш стал убедительным и заслуженным. Стратегия ДИСКОНТ-АВТОМАТ опередила конкурентов и в круговом состязании, где выиграла в 89 % поединков, и в групповом бое{292}. ДИСКОНТОМ-АВТОМАТОМ Тим и Дэн назвали свою стратегию потому, что она «уценяла» усвоенное знание по мере его устаревания и придавала свежеобретенным сведениям большее значение, чем полученным какое-то время назад{293}.

Лучшие из представленных на турнире стратегий ограничивали объемы научения, чтобы гарантированно поддерживать высокую окупаемость предлагаемого поведения. ДИСКОНТ-АВТОМАТ выделялась на их фоне относительно равномерным распределением научения по всему жизненному сроку агента. Своим успехом эта стратегия отчасти обязана тому, что, в отличие от конкурентов, тратила меньше времени на ученичество и больше на практику, разыгрывая ПРИМЕНЯТЬ, что, в свою очередь, давало возможность агентам обучаться эффективнее соперников. Добивалась этого ДИСКОНТ-АВТОМАТ за счет оценки прогнозируемой отдачи либо от научения, используя ход НАБЛЮДАТЬ, либо от разыгрывания ПРИМЕНЯТЬ{294}. Иными словами, стратегия-победительница прибегала к своего рода мысленным путешествиям во времени: она оглядывалась на прошлое, всматривалась в будущее и на основании полученных данных вычисляла, какой ход будет оптимальным в каждом раунде.

Что поразительно, и ДИСКОНТ-АВТОМАТ, и занявшая второе место стратегия ИНТЕРПОКОЛЕНИЕ[10] едва ли не единственным вариантом научения выбирали поведенческую модель НАБЛЮДАТЬ. Да и во всех стратегиях, прошедших во второй этап, по крайней мере половина объема научения отводилась наблюдению. Мы задались вопросом, в какой мере успех ДИСКОНТА-АВТОМАТА на турнире обусловлен подражанием, и Люку пришел в голову оригинальный способ это выяснить. Отредактировав компьютерный код ДИСКОНТА-АВТОМАТА, он создал измененную его версию, совпадавшую с оригинальной во всем, кроме того, что вместо хода НАБЛЮДАТЬ в ней каждый раз предполагался ход НОВАТОРСТВОВАТЬ. После этого мы заново провели второй этап турнира (меле), выставив против «мутировавшей» версии ДИСКОНТА-АВТОМАТА девять других состязавшихся с ней стратегий в их неизменном виде. Если успех победительницы объясняется именно упором этой стратегии на подражание, рассуждали мы, то в повторных групповых боях она покажет себя хуже, чем первоначально. И напротив, если успех был больше связан с другими свойствами, она может вырваться вперед и в повторных схватках. К нашему изумлению, на этот раз ДИСКОНТ-АВТОМАТ с треском провалилась. Версия-мутант, умеющая только НОВАТОРСТВОВАТЬ, а не НАБЛЮДАТЬ, не просто показала результаты хуже достигнутых оригиналом, она заняла последнее место! А значит, своим успехом стратегия-лидер в немалой степени обязана именно ориентации на социальное научение.

Теперь у нас с Люком было две версии ДИСКОНТА-АВТОМАТА: одна – основанная почти полностью на социальном научении, а вторая – на несоциальном, – и мы осознали, что можно сравнить достоинства этих двух форм научения, сталкивая их в соперничестве друг с другом при широком разнообразии условий. Сходные попытки анализа предпринимались и прежде, но у исследователей не было ни такого умного алгоритма, ни такой насыщенной симулированной среды, и потому мы полагали, что наше исследование будет больше приближено к действительности, чем предшествующие. Результаты нас очень удивили – к такому мы совсем не были готовы: подражание одерживало над несоциальным научением сокрушительную победу практически при любых обстоятельствах. Так, например, манипулируя частотой перемен в окружающей среде, мы обнаружили, что «строго новаторская» версия ДИСКОНТА-АВТОМАТА сможет хотя бы немного утвердиться, только если окупаемость каждой поведенческой модели станет меняться в каждом раунде с вероятностью более 50 %. Иными словами, самостоятельное научение будет эффективнее научения у других лишь в экстремально суровой среде, которая трансформируется с головокружительной скоростью – настолько стремительно, что в природе такие условия, скорее всего, почти не встречаются.

 

Эти открытия шли вразрез со всеми нашими прежними знаниями и многими интуитивными догадками. В частности, среди психологов было распространено убеждение, что подражание окупается, поскольку позволяет индивиду одновременно рассмотреть поведение большого количества других себе подобных{295}. Быстрый обзор поведения множества индивидов позволяет ученику применять такие стратегии, как подстройка под большинство, на которой основана предположительно значительная часть научения у человека{296}. Но благодаря турниру мы обнаружили, что при разыгрывании модели НАБЛЮДАТЬ можно уменьшить число объектов подражания до одного и оно все равно окупится, то есть оригинальная версия ДИСКОНТА-АВТОМАТА одерживала верх над исправленной; да и в меле тоже, собственно, побеждали стратегии с упором на подражание.

Экономисты часто называют причиной выигрышности социального научения возможность индивидов отслеживать отдачу, получаемую другими, и перенимать высокоокупаемое поведение. Однако наши симуляторы показали, что можно взвинтить частотность ошибок, связанных с оценкой окупаемости наблюдаемого поведения, до такого уровня, при котором подражатель в принципе не будет получать достоверных сведений об отдаче, и тем не менее стратегии, полагающиеся в основном на выбор НАБЛЮДАТЬ, все равно опередят конкурентов.

Кроме того, многие исследователи социального научения, включая и меня, полагали крупным его недостатком то, что при подражании неизбежно возникают ошибки копирования – когда индивиды перенимают неверное поведение или когда им вообще не удается что-либо перенять. Однако оказалось, что даже при очень высоком проценте ошибок, если в 50, 60, 70 % случаев разыгрывания НАБЛЮДАТЬ репертуар агента не пополнялся новым, более окупаемым поведением, подражание, как это ни поразительно, все равно оказывалось выгодно.

В чем же сила подражания? Почему в самых разнообразных условиях социальное научение торжествует над несоциальным? Турнир принес нам на этот счет очень важное открытие: подражание окупается, поскольку те, кому подражают, отфильтровывают свое поведение и предоставляют в распоряжение копировщиков адаптивную информацию. Участники турнира задавали в своих стратегиях условие, по которому агенты должны были сначала накопить поведенческий репертуар, а потом использовать выученное поведение, увязываемое с наивысшей отдачей. Однако это значит, что, разыгрывая ПРИМЕНЯТЬ, агенты следовали не случайной модели поведения, а отобранной, проверенной, высокоокупаемой. Соответственно, разыгрывающие НАБЛЮДАТЬ черпали из того же кладезя высокоокупаемых вариантов, поскольку применялись именно они. При разыгрывании НАБЛЮДАТЬ шансов усвоить поведение с очень высокой отдачей оказывалось гораздо больше, чем при разыгрывании НОВАТОРСТВОВАТЬ, поскольку в последнем случае в «копилку» добавляется поведение случайное и преимущественно малоокупаемое. В наших тестовых симуляциях, в которых агенты, разыгрывающие ПРИМЕНЯТЬ, выбирали из своего репертуара поведенческих моделей наугад, а не лучшую из имеющихся вариантов, «строго новаторская» версия ДИСКОНТА-АВТОМАТА одерживала верх над оригинальной. Фактор, объясняющий, почему социальное научение оказывается таким выгодным для подражателя, – избирательный подход объектов подражания к своему поведению.

Вот почему имеет смысл подражать. Вот почему мы наблюдаем подражание не только у животных с крупным мозгом, как у человека, шимпанзе, японских макак, но и у дрозофил и сверчков. Чтобы получать выгоду от подражания, животному необязательно быть умным, поскольку за него уже поразмышлял коллективный разум – объекты подражания, отфильтровавшие для него нужный вариант реакций и действий. Мы, исследователи социального поведения, сосредоточившись на том, что требуется сделать особи-наблюдателю, чтобы усвоить адаптивную информацию, совершенно упустили из виду, насколько облегчают подражателю задачу сами объекты подражания. Во многих обстоятельствах копирование, даже подчиняющееся относительно простым правилам, гораздо вероятнее приведет к высокоокупаемому поведению, чем метод проб и ошибок. Именно поэтому подражание так распространено в природе.

Не только эти представления заставил пересмотреть наш турнир. Согласно прогнозам прежних аналитических исследований, таких как модель Роджерса, эволюция должна приводить к устойчивому равновесию, при котором в популяции сохранится и социальное, и несоциальное научение{297}. Однако когда мы свели в поединке две версии ДИСКОНТА-АВТОМАТА, в большинстве симулируемых обстоятельств оригинал шутя переигрывал версию с несоциальным научением. В прежних исследованиях социальные ученики моделировались как настороженные по отношению ко всему новому, упорно придерживавшиеся отработанного поведения даже при смене условий среды. Такая установка не могла не сказаться на предполагаемой приспособленности социального научения: ведь, подражая этим чурающимся перемен особям, ученики усваивали далекое от оптимального поведение. На турнире же агенты накапливали поведенческий репертуар, которым могли пользоваться гибко. В зависимости от изменений в окружающей среде успешные стратегии, такие как ДИСКОНТ-АВТОМАТ, не придерживались утратившего актуальность поведения, а переключались на следующий в рейтинге окупаемости паттерн из своего репертуара. Соответственно, когда агенты разыгрывали ПРИМЕНЯТЬ, другие агенты – подражатели, разыгрывающие НАБЛЮДАТЬ, – перенимали у них весьма высоко окупаемое поведение. В отличие от модели Роджерса здесь агенты не были связаны с несоциальными учениками частотно-зависимыми взаимоотношениями, не дающими им иного способа отслеживать перемены в окружающей среде. При условии небольшого количества ошибок копирования разыгрывание НАБЛЮДАТЬ вызовет достаточно разнообразное поведение, обеспечивающее социальным ученикам адаптивный отклик на перемены в окружающей среде.

Из более ранних теоретических работ следовало, что упор на социальное научение не всегда повышает среднюю приспособленность особей в популяции{298} и может даже снизить ее{299}, подтверждая тем самым парадокс Роджерса. Турнир показал путь к преодолению явного несоответствия между этими выводами и демографическим успехом нашего вида: примитивное, негибкое и низкое по качеству социальное научение биологическую приспособленность не увеличивает – ее увеличивает лишь научение толковое, высокоорганизованное и гибкое.

Между тем в противоборстве стратегий побеждали вовсе не те, которые максимизировали отдачу для агентов. Напротив, мы обнаружили сильную обратную корреляцию: если средний показатель приспособленности, которую обеспечивает стратегия своим агентам, высок, то на турнире такая стратегия, скорее всего, проиграет{300}. Это открытие показывает, что стратегии, делающие главный упор на поведение НАБЛЮДАТЬ, паразитические по своему характеру. В числе таких стратегий оказались лидеры нашего состязания: ДИСКОНТ-АВТОМАТ, ИНТЕРПОКОЛЕНИЕ, МЫ_КЛАН_ДОБЫЧИ и ДИНАМИЧЕСКИЙ_УРОВЕНЬ_ПРИТЯЗАНИЙ[11], занявшие соответственно первое, второе, четвертое и шестое места. Все они разыгрывали НАБЛЮДАТЬ как минимум в 95 % ходов, отданных научению. Стратегии, использующие сочетание социального и несоциального научения, рискуют проиграть конкурентам, использующим только социальное, и дать популяции более низкую в среднем отдачу. Эти выводы вызывают в памяти одно неписаное правило экологии: среди соперников за ресурс верх одержит тот вид, который сумеет удержаться на самом низком уровне его потребления{301}. Аналогичную закономерность можно вывести и применительно к соперничающим альтернативным стратегиям социального научения: верх в конечном итоге одержит та, которая сумеет обойтись наименьшей долей несоциального научения{302}.

Такой же неожиданностью явилось для нас обозначившееся в ходе турнира следствие стратегического упора на подражание, проявляющееся на уровне популяции. Рассмотрим популяционное разнообразие – поведенческие паттерны, наблюдаемые в пределах всей популяции (совокупность всех ее репертуаров поведения). Если выстроить стратегии по доле, отведенной при научении поведению НАБЛЮДАТЬ, по сравнению с долей НОВАТОРСТВОВАТЬ, обнаруживается прямое соответствие между относительным объемом подражания и степенью популяционного разнообразия. Это чрезвычайно контринтуитивное открытие. Ведь когда агент разыгрывает НАБЛЮДАТЬ, разнообразие поведенческих паттернов в популяции в результате не увеличивается – агент просто добавляет в собственный репертуар один из уже имевшихся в популяции паттернов. Тогда как НОВАТОРСТВОВАТЬ, наоборот, гарантирует агенту новую поведенческую модель и зачастую вносит новые варианты поведения в популяционную копилку! Почему же увеличенная доля социального научения влечет за собой рост поведенческого разнообразия на уровне популяции?

Подражание обычно не приносит новых вариантов поведения, за исключением тех редких случаев, когда они возникают из-за ошибок копирования. Зато подражание снижает частоту утрат поведенческих вариантов. Снижать ее удается за счет того, что социальное научение порождает множество копий того или иного знания либо поведения, хранящихся в поведенческом репертуаре разных особей, и потому, когда кто-то из этих особей гибнет, знание совсем не обязательно тоже исчезает. В этом случае положительные последствия подражания в виде уменьшения частоты утраты поведенческих вариантов, как правило, превышают отрицательные последствия в виде снижения частоты появления новых вариантов, приводя при перевесе НАБЛЮДАТЬ над НОВАТОРСТВОВАТЬ к приросту разнообразия в популяции. Собственно, когда частота подражания достигает определенного уровня, популяционная база знаний оказывается насыщенной до предела, и в популяции сохраняется информация обо всех возможных вариантах поведения.

 

Из этого, однако, не следует, что при увеличении доли подражания растет количество применяемых на практике поведенческих моделей. Наоборот, усиление упора на социальное научение по сравнению с несоциальным ведет к сужению набора демонстрируемых поведенческих паттернов, поскольку популяция начинает сосредоточиваться на немногих высокоокупаемых вариантах. Если ситуация дойдет до крайности и путем подражания станут учиться все агенты, поведение популяции будет тяготеть к конформистскому – каждый станет поступать так, как поступает большинство.

А теперь задумаемся о продолжительности жизни знания в популяции – сколько оно удерживается после появления. Основной упор на социальное научение автоматически обеспечивает культурному знанию исключительную устойчивость. Судя по всему, в какой-то момент популяция достигает того порогового уровня опоры на социальное научение, за которым культурное знание становится чрезвычайно прочным и хранится, по сути, вечно. Существование поведенческих паттернов на протяжении многих тысяч раундов на турнире – это виртуальный аналог существования у человечества знаний, передаваемых со времен древних греков или древних египтян{303}. В то же время с ростом социального научения применяемые поведенческие паттерны меняются быстрее, порождая модные тенденции, поветрия и стремительную смену культурных традиций{304}.

Турнир стратегий социального научения прошел, как уже говорилось, на ура{305}. Он помог нам разгадать несколько загадок, касающихся подражания. Благодаря ему мы установили, что преимущество в приспособленности действительно обеспечивается подражанием, если оно применяется эффективно, то есть стратегически и с высокой точностью{306}. Данное открытие плюс победа в турнире стратегии, добившейся максимальной эффективности научения, означает, что в ходе естественного отбора должны вырабатываться оптимальные правила стратегического подражания, и это основная мысль моей книги.

Итак, подражание – пусть даже слепое копирование – дает преимущество над научением путем проб и ошибок, поскольку подражатели ориентируются на поведение, уже отфильтрованное с точки зрения адаптивности объектами подражания. Этот факт помогает понять, почему социальное научение так широко распространено в природе, даже среди тех животных, которых мы считаем не особенно умными. Шмели, дрозофилы и сверчки выигрывают от подражания сородичам, поскольку искать скопления пыльцы, плодовитых самок и способы спасения от врагов путем проб и ошибок, когда цветочных полян, самок и хищников так много, довольно тяжело. Социальное научение в большинстве случаев дает возможность сократить и ускорить путь к высокоокупаемому поведению. А на другом полюсе когнитивной организации то же открытие позволяет объяснить, почему так склонны к подражанию дети – они готовы копировать даже избыточные действия демонстратора{307}. Подражая взрослым, дети, сами того не подозревая, припадают к источнику десятилетиями фильтруемых знаний. Доверять взрослому – крайне эффективное эмпирическое правило.

Однако наш турнир, помимо прочего, показал, что настоящие дивиденды в аспекте приспособленности получают те особи, которым удастся подражать другим «с умом», то есть если они относятся к вопросам, когда и с какой частотой подражать, избирательно. Успешные стратегии сумели приурочить подражание к моменту снижения окупаемости, оценивать имеющуюся информацию по степени ее свежести, прогнозировать ее будущую полезность и на основании всех этих параметров максимизировать эффективность подражания. Как свидетельствуют эмпирические данные, некоторые животные способны «уценивать» информацию в соответствии с ее устарелостью{308}. Победившая в турнире стратегия, кроме ее других достоинств, хороша тем, что давала возможность проецировать текущие условия в будущее – редкость для нечеловеческих видов{309}. Мало кому из животных удалось бы воспользоваться такой сложной стратегией, как ДИСКОНТ-АВТОМАТ, но человеку это, безусловно, по силам. Возможно, именно такой когнитивной способностью отчасти объясняется разрыв между человеческой культурой и ее аналогом у животных. Результаты турнира подсказывают, что адаптивное применение социального научения может быть связано с когнитивными возможностями, на которых основаны мысленные путешествия во времени, и к этому мы еще вернемся в следующих главах.

Кроме того, если эффективное подражание адаптивно и в ходе естественного отбора предпочтение все больше будет отдаваться социальному научению по сравнению с несоциальным, то, как следует из итогов турнира, автоматически сформируется ряд качеств, сильно напоминающих человеческую культуру. Рост подражания неизбежно влечет за собой рост поведенческого разнообразия, длительное сохранение культурных знаний, конформность (стремление поступать как большинство) и стремительную смену поведенческих тенденций, модных поветрий и технологических новшеств. Если новаторство или ошибки копирования ведут к появлению новых вариантов поведения, подражание может одновременно увеличивать базу знаний популяции и сокращать арсенал используемого поведения до ядра из самых высокоокупаемых вариантов. Той же логикой объясняется отмеченная способность подражания обеспечивать длительное сохранение знаний и при этом вызывать стремительную смену поведения. Даже незначительного применения неоптимального поведения достаточно, чтобы в популяциях, придерживающихся социального научения, надолго сохранялись большие объемы культурных знаний. Высокий уровень подражания увеличивает возможности сохранения культурных знаний на несколько порядков.

Из этого наблюдения следует, что социальное научение придает культурным популяциям адаптивную пластичность, благодаря ему они получают возможность быстро откликаться на перемены в окружающей среде, черпая из глубокого кладезя знаний. В биологии эволюции скорость перемен прямо связана с генетическим разнообразием{310}, и статистические анализы указывают на аналогичную связь между интенсивностью культурной эволюции и количеством культурных вариаций{311}. Соответственно, можно предположить, что в популяциях, в которых силен упор на культуру, будет стремительно расти поведенческое разнообразие благодаря использованию высокого уровня сохраняемой вариативности. Как показывает турнир стратегий социального научения, не исключено, что своими экологическими и демографическими успехами, способностью к быстрой смене поведения, культурным разнообразием, обширной базой знаний и даже самими объемами демонстрируемого культурного знания наш вид непосредственно обязан интенсивному, но разумному применению социального научения.

9Англ. Discontmachine.
291Как и в турнире Аксельрода, родиной победившей стратегии оказалась Канада.
292В групповом бое ДИСКОНТ-АВТОМАТ выиграла 35 % состязаний, что значительно больше, чем занявшая второе место стратегия ИНТЕРПОКОЛЕНИЕ, победившая в 24 % состязаний.
293На недавно приобретенную информацию, собственно, опирались многие из лидировавших стратегий.
294Здесь стратегия ДИСКОНТ-АВТОМАТ единственная среди финалистов использовала модуль экспоненциального уценивания.
10Англ. Intergeneration.
295Hoppitt and Laland 2013.
296Asch 1955, Latane 1981, Boyd and Richerson 1985, Henrich and Boyd 1998, Morgan et al. 2012, Morgan and Laland 2012.
297Rogers 1988.
298Rogers 1988, Feldman et al. 1996, Wakano et al. 2004.
299Rendell et al. 2010.
300Более того, средняя окупаемость в течение срока жизни в популяции в общем состязании всех стратегий при одинаковых условиях оказывалась ниже, чем у стратегий, занимавших более низкие места при одиночном разыгрывании.
11Aнгл. Wepreyclan и Dynamicaspirationlevel.
301Tilman 1982.
302Kendal et al. 2009.
303Средняя продолжительность жизни агентов в нашем турнире составляла 50 раундов. Средняя ожидаемая при рождении продолжительность жизни человека в мире сейчас составляет 67 лет – сравните с 26 годами во времена бронзового и железного веков (Encyclopaedia Britannica, 1961). Таким образом, можно в грубом приближении приравнять раунды турнира к годам человеческой жизни.
304Rendell, Boyd, et al. 2011; Laland and Rendell 2013.
305На мой взгляд, своим успехом турнир отчасти обязан использованию «многорукого бандита». Эти «многорукие бандиты» широко применялись для исследования научения в ряде дисциплин, таких как биология, экономика, искусственный интеллект и информатика, поскольку они моделируют общую проблему, стоящую перед особями или индивидами, которым приходится решать, как распределить свое время, чтобы максимизировать отдачу (Schlag 1998, Koulouriotis and Xanthopoulos 2008, Gross et al. 2008, Bergemann and Valimaki 1996, Niño-Mora 2007 и Auer et al. 2002). Они великолепно моделируют многие непростые проблемы реальной действительности – например, ситуацию, когда существует много вариантов вероятного действия, лишь несколько из которых принесут большую отдачу; когда можно учиться несоциальным путем или наблюдая за другими; когда возникают ошибки копирования; когда меняется среда. Конечно, симулятор – это упрощенная версия реального мира, в котором, в отличие от моделируемого, особи или индивиды могут выбирать демонстраторов с определенными характеристиками и в котором существует прямое взаимодействие между особями или индивидами (Apesteguia et al. 2007, Boyd and Richerson 1985, and Laland 2004). Пока еще неизвестно, насколько устойчивыми окажутся наши результаты, если добавить такие переменные в последующих турнирах; возможно, стратегии, занявшие пьедестал почета в нашем турнире, там покажут себя не столь хорошо. (На момент работы над этой книгой мы с сотрудниками анализируем результаты второго турнира стратегий социального научения, в котором к изначальной схеме сделаны три дополнения, предусматривающие возможность смоделировать несбалансированную, пространственно вариативную среду и кумулятивно-культурное научение.) Тем не менее наш турнир гораздо больше приближен к действительности, чем прошлые теоретико-аналитические разработки, поэтому я придаю особое значение его результатам. Базовая универсальность задачи, поставленной нами с использованием «многорукого бандита», вселяет уверенность, что выводы, сделанные на основе полученных данных, окажутся надежными и общеприменимыми.
306Стратегии на турнире не могли влиять на частоту ошибок копирования, но нетрудно предположить, что если бы допускалось возникновение мутирующих стратегий, способных снизить эту частоту, они процветали бы по той же самой причине, по которой процветает подражание: при возникновении ошибки копирования стратегия использует выбранное случайным образом поведение (или, как в некоторых наших моделях, новое поведение не возникает), тогда как точное подражание позволяет приобрести то высокоокупаемое поведение, которое выбирают для исполнения демонстраторы.
307Lyons et al. 2011.
308Van Bergen et al. 2004.
309Самый убедительный пример мы находим в запасающем поведении кустарниковых соек (Clayton and Dickinson 1998, 2010; см. также: Suddendorf and Corballis 2007).
310Fisher 1930.
311Boyd and Richerson 1985, Cavalli-Sforza and Feldman 1981.