Не лги себе. Почему Big Data знает тебя лучше, чем ты сам, и как использовать это, чтобы добиться успеха

Tekst

Książka w języku rosyjskim

Autor:Cет Cтивенс-Давидовиц

Z serii: Библиотека ИТ. Главные книги о современных технологиях

Recenzje

Przeczytaj fragment

Kup za 34,99 zł i gratis 2 książki do wyboru

Oznacz jako przeczytane

Jak czytać książkę po zakupie

Smartfon,
tablet Komputer,
laptop E-czytnik

Pobierz:
FB2
EPUB
iOS.EPUB
7 więcej

Nie masz czasu na czytanie?

Posłuchaj fragmentu

− 20%

Otrzymaj 20% rabat na e-booki i audiobooki

Kup zestaw za 38,05 zł 30,44 zł

Przejdź do audiobooka

Rozmiar: 300 str. 71 ilustracji
Kategoria: будущее и технологии, Internet
Tagi: big data, bezpieczeństwo w Internecie, technologia informacyjna (IT), wzrost kariery zawodowej, badania socjologiczne, sukces technologii Edytuj

Не лги себе. Почему Big Data знает тебя лучше, чем ты сам, и как использовать это, чтобы добиться успеха

Audio

Не лги себе. Почему Big Data знает тебя лучше, чем ты сам, и как использовать это, чтобы добиться успеха

Audiobook

Czyta Юрий Катарманов

20,76 zł

Zsynchronizowane z tekstem

Szczegóły

Czcionka:Mniejsze АаWiększe Aa

От «Все лгут» к «Не лги себе»

Дальше последует краткая пауза, на протяжении которой я попытаюсь оправдать свою вторую книгу в глазах читателей первой, «Все лгут»^[17]. Некоторые из вас, возможно, обратили внимание на эту книгу, поскольку вам понравилась та. Если же вас к этой книге привели другие причины, может, следующие абзацы убедят вас купить и первую. Я постараюсь.

Книга «Все лгут» была посвящена моему исследованию того, как при помощи поисковых запросов Google определить действительные мысли и поступки людей. Я назвал Google «цифровой сывороткой правды», потому что люди честны с поисковой машиной.

Кроме того, я назвал поисковые запросы Google самым важным набором данных о внутреннем мире человека.

Я показал, что:

• Расистские запросы Google предсказывали, где именно Барак Обама покажет слабые результаты на выборах 2008 и 2012 годов.

• Люди часто печатают в поисковой строке Google полные предложения – например, «Я ненавижу своего начальника», «Я пьян» или «Мне нравятся сиськи моей подружки».

• Самый популярный запрос Google, начинающийся со слов «мой муж хочет…», в Индии выглядит как «мой муж хочет, чтобы я кормила его грудью». Вообще в Индии запросов, посвященных кормлению мужа грудью, почти столько же, сколько посвященных грудному вскармливанию младенцев.

• Запросы Google о том, как сделать аборт самостоятельно, почти идеально концентрируются в тех частях Соединенных Штатов, где легально сделать аборт сложно.

• Мужчины чаще ищут, как увеличить собственный член, чем как настроить гитару, сменить колесо или приготовить омлет. Один из самых популярных запросов к Google на тему члена звучит: «Насколько большой у меня член?»

В конце предыдущей книги я предположил, что следующая будет называться «Все лгут (по-прежнему)» и что в ней я буду продолжать разбираться, что мы можем узнать из запросов Google. Кажется, я солгал насчет этого, прошу прощения. Чего еще ожидать от автора книги под названием «Все лгут»?

На первый взгляд моя вторая книга сильно отличается от первой. И если вы надеялись на продолжение анализа того, какие запросы делают мужчины относительно своих детородных органов, вы будете горько разочарованы. Впрочем, ладно. Один пример я приведу. Вы не знали, что мужчины часто набирают в поисковой строке полные предложения, сообщающие длину их пениса?^[18] Они печатают, например: «Длина моего члена – 5 дюймов»^[19]. И если сопоставить данные по всем подобным запросам, мы получим близкое к нормальному распределение длины пениса, сообщаемой Google его владельцем, с пиком около 5 дюймов.

Но давайте оставим мои исследования и вернемся в сумасшедший мир поисковых запросов Google, о котором можно прочесть больше в моей книге «Все лгут».

Большинство научных работ, о которых говорится в этой книге, в отличие от «Все лгут», написаны не мной, а другими людьми. Книга носит более практический характер, больше сосредоточена на самосовершенствовании, чем на погружении в различные аспекты современной жизни. Кроме того, в ней заметно меньше внимания уделяется сексу. Говоря о нем, мы не будем сосредотачиваться на человеческих тайных желаниях и страхах – им уделено достаточно места в предыдущей книге. Обсуждение секса в этой книге сводится к вопросу, делает ли он людей счастливее (спойлер: да).

И тем не менее я уверен, что эта книга служит естественным продолжением предыдущей – по двум причинам.

Во-первых, одним из главных побудительных мотивов к ее написанию для меня стали данные о том, чего на самом деле хотят читатели, а не о том, что они говорят, будто хотят. Закончив работу над «Все лгут», я, как любой приличный маркетолог, задал читателям вопрос, что заинтересовало их больше всего. Большинство ответили мне, что их сильнее всего заинтересовали главы, посвященные важнейшим проблемам нашего мира и путям их решения – например, те, которые касаются преступлений в отношении детей и проблем неравенства.

Но как автор «Все лгут» я отнесся к словам людей скептически и захотел посмотреть на какие-нибудь другие данные – может быть, на «цифровую сыворотку правды». И я стал выяснять, какие места чаще всего подчеркивают в цифровой версии книги для Kindle. Я заметил, что люди часто подчеркивают отрывки, где говорится, как они могли бы улучшить собственную жизнь, и редко – о том, как улучшить мир. Людей интересует самопомощь – независимо от того, готовы ли они в этом признаться.

Более тщательно исследовав данные Kindle, я пришел к этому же выводу. Обработав большой массив книг, исследователи определили, что вероятность обнаружить слово «вы» в подчеркнутых предложениях в двадцать раз выше, чем в неподчеркнутых. Людям, таким образом, действительно нравятся предложения со словом «вы»^[20].

Именно поэтому первый абзац книги «Не лги себе» построен так, а не иначе:

«Вам вполне по силам улучшить качество решений, касающихся вашей жизни. Большие данные могут вам в этом помочь».

Данные, а не интуиция, определили содержание этого абзаца. Он открывает для вас книгу, которая призвана помочь вам получить от жизни больше тех вещей, которые именно вы хотите. Он вам понравился?

Популярность литературы, способной предложить читателю помощь, подтверждается анализом книг, которые пользовались наибольшим спросом на протяжении человеческой истории^[21]. Я выяснил, какие книги лучше всего продавались. Наиболее многочисленная категория бестселлеров вне категории художественной литературы – это книги по самопомощи (примерно 42 % от общего количества). Вслед за ними идут мемуары знаменитостей (28 %). На третьем месте – исследования в области секса (8 %).

Я пытаюсь сказать, что, ориентируясь на данные, напишу сначала тот самый учебник самопомощи, который вы держите в руках. Затем перейду к книге «Секс: с точки зрения данных». Надеюсь, что к этому моменту стану достаточно известным, чтобы написать «Сет: мемуары автора, прославившегося благодаря данным о том, какие книги лучше продаются».

Второе качество, общее для обеих книг, – в обеих при помощи данных раскрываются секреты современной жизни. Одна из причин такой полезности данных для принятия более качественных решений – основополагающие факты об окружающем нас мире скрыты от нас. Существуют секреты получения от жизни желаемого, которые открываются при помощи больших данных.

Возьмите, например, такой секрет: кто богат? Очевидно, что его знание поможет любому, кто хочет заработать больше денег. Знание осложняется тем обстоятельством, что многие богатые не хотели бы, чтобы об их богатстве знали другие.

Недавнее исследование, в котором использовались оцифрованные в последнее время налоговые декларации, было наиболее подробным из тех, что касались богатых людей^[22]. Ученые определили, что типичный богатый американец – отнюдь не кудесник от высоких технологий, корпоративный магнат или нечто подобное, чего обычно ждет публика. Типичный богатый американец, по словам авторов, – это владелец «регионального бизнеса» типа автосалона или компании по оптовой торговле напитками. Кто бы мог подумать? В главе 4 мы поговорим, почему это так – и как это влияет на выбор карьеры.

Медиа тоже лгут нам – или, по крайней мере, создают у нас ложное впечатление об устройстве мира, выбирая для нас только истории определенного свойства. Прибегнуть к данным, чтобы развеять эту ложь, полезно для принятия решений.

Вот пример – связь возраста и предпринимательского успеха. Медиа дают нам искаженную картину возраста бизнесменов. Недавнее исследование показало, что медианный возраст предпринимателей, о которых пишут в бизнес-журналах, – 27 лет^[23]. Пресса обожает рассказывать нам завлекательные истории о вундеркиндах, создавших крупные компании.

Но сколько же лет капиталисту в действительности? Недавнее исследование данных обо всех предпринимателях Америки показало, что успешному их представителю в среднем 42 года^[24]. И шансы создать успешный бизнес увеличиваются с возрастом, достигая максимума в 60 лет^[25]. Более того, возраст является преимуществом даже для предпринимательства в сфере высоких технологий^[26] – то есть там, где, по мнению большинства, должна работать исключительно молодежь, поскольку только она способна к освоению нового.

Разумеется, тот факт, что возраст является преимуществом для предпринимательства в любой области, полезен для всех, кто достиг среднего возраста и уверен, что их шанс создать бизнес миновал. В главе 5 мы развеем несколько мифов о предпринимательском успехе и поговорим о выведенной из данных надежной формуле, которая обеспечивает максимум шансов создать успешное предприятие.

Когда вы знаете, как на самом деле устроен мир, – и избегаете лжи как людей, так и медиа, – вы готовы улучшить качество решений, касающихся вашей жизни.

От Бога к чувствам, от чувств – к данным

В последней главе своей книги «Homo Deus» Юваль Ной Харари пишет, что мы проходим через «религиозную революцию гигантского масштаба, подобной которой человечество не видело с XVIII столетия». Новая религия, говорит Харари, это вера в данные, «датаизм»^[27].

Как же мы пришли к этому?

На протяжении почти всей человеческой истории наиболее образованные люди наделяли высшей властью Бога. Как пишет Харари, «когда люди не знали, на ком жениться, чем заняться и начинать ли войну, они читали Библию и следовали ее советам».

Гуманистическая революция, которую Харари относит к XVIII веку, поставила под вопрос мировоззрение, в центре которого находится Бог. Философы наподобие Вольтера, Джона Локка и моего любимого Дэвида Юма утверждали, что Бог – плод человеческого воображения, а библейские догмы ложны. Устранив внешний авторитет, способный управлять нами, философы стали утверждать, будто люди управляют своей жизнью сами. Харари называет методы принятия важных решений в эпоху гуманизма: «прислушиваться к себе», «любоваться закатом», «вести личный дневник», «беседовать по душам с близким другом».

Революция датаизма, которая только началась и, по словам Харари, может завершиться только через десятки лет, поставила под вопрос мировоззрение гуманистов, в центре которого находятся наши чувства. Тот квазирелигиозный статус, которым они были наделены, был поставлен под сомнение биологами. Они открыли, что организмы – это алгоритмы, а наши чувства – просто «процессы биохимических вычислений»^[28].

Более того, такие легендарные специалисты в области человеческого поведения, как Амос Тверски и Даниэль Канеман, открыли, что чувства часто вводят нас в заблуждение. Наш ум, говорят они, глубоко поражен разного рода когнитивными искажениями^[29].

Вы считаете собственную интуицию надежным проводником? Это совсем не так. Зачастую мы излишне оптимистичны, переоцениваем значимость легко запоминающихся историй, отбираем только информацию, согласующуюся с тем, во что нам хотелось бы верить, ложно заключаем, что могли бы объяснить события, считавшиеся непредсказуемыми на момент, когда они произошли, и так далее.

Фраза «прислушиваться к себе» могла звучать освобождающе и романтично для гуманистов. Но, честно говоря, «прислушиваться к себе» звучит просто страшно после прочтения последнего выпуска Psychological Review или великолепной статьи «Список когнитивных искажений» в Википедии.

Наконец, революция больших данных предлагает нам альтернативу тому, чтобы прислушиваться к себе. Наша интуиция или советы таких же людей, как мы, могли казаться гуманистам единственными источниками мудрости, оставшимися нам в лишенной Бога вселенной. Но сейчас ученые, работающие в области анализа данных, формируют и анализируют огромные массивы информации, способные освободить нас от когнитивных искажений.

Еще процитирую Харари: «В XXI веке чувства утратили положение лучших алгоритмов в мире. Мы создаем новые, превосходящие их алгоритмы, опирающиеся на беспрецедентную вычислительную мощность и гигантские базы данных». Согласно датаизму, теперь ответы на вопросы «на ком жениться, чем заняться и начинать ли войну» заключаются в «алгоритмах, которые знают нас лучше, чем мы сами знаем себя».

Я не настолько дерзок, чтобы утверждать, будто книга «Не лги себе» – библия датаизма, и не пытаюсь написать новых десять заповедей. (Хотя мне бы очень хотелось, чтобы вы воспринимали тех исследователей, о работе которых я буду говорить, как пророков датаизма: их работа носит новаторский характер именно до такой степени.)

Но я надеюсь, что эта книга покажет, каково новое мировоззрение датаизма, и предложит вам несколько алгоритмов, которые помогут принять значительное решение. «Не лги себе» состоит из глав; каждая из которых посвящена тому, что данные могут сказать нам о какой-то одной важной области жизни. И первая касается, вероятно, самого важного решения в жизни^[30].

Итак, приверженцы датаизма и потенциальные новообращенные, давайте посмотрим, помогут ли вам алгоритмы с ответом на вопрос: «На ком жениться?»

Глава 1
Брак с участием искусственного интеллекта

С кем вам следует вступить в брак?

Может быть, именно этот вопрос – самый важный в жизни с точки зрения последствий ответа на него. Инвестор и миллиардер Уоррен Баффет, во всяком случае, считает именно так. Он называет выбор супруга «самым важным решением из всех, что вам предстоит принять».

И тем не менее люди редко искали помощи у науки в этом отношении. Честно признаться, здесь наука не могла помочь практически ничем.

Ученые, занимающиеся человеческими отношениями, пытались найти ответы. Но найти большие выборки пар оказалось трудной и дорогостоящей задачей. Исследования в этой области, как правило, опирались на очень маленькие выборки и зачастую приходили к противоречащим друг другу выводам. В 2007 году выдающийся ученый Гарри Рейс из Университета Рочестера сравнил науку о человеческих отношениях с подростком, назвав ее «растущей, временами непокорной – а может, и более таинственной, чем хотелось бы»^[31].

Но несколько лет назад молодая, энергичная, сверхлюбопытная и блестяще талантливая ученая из Канады Саманта Джоэл задалась целью изменить такое положение вещей. Джоэл, как и многих ее коллег, интересовало, что же предсказывает удачные отношения. Но ее подход был необычным. Она не стала строить очередную скудную выборку пар – вместо этого она решила свести вместе данные прежних исследований. Джоэл рассуждала так: если ей удастся объединить небольшие массивы данных из научных работ прошлого, может получиться один большой массив. И его будет достаточно, чтобы надежно определить, что предсказывает успех отношений, а что нет.

План Джоэл сработал^[32]. Она собрала в свою группу всех профессоров, располагавших данными об отношениях. В конечном счете ее группа состояла из 85 ученых и смогла аккумулировать массив данных об 11 196 парах^[33].

Размер массива был впечатляющим, как и содержащаяся в нем информация.

Для каждой пары у Джоэл и ее группы были результаты опросов, где каждый из партнеров давал численную оценку степени удовлетворенности отношениями. При этом данные у них были практически по всем вообразимым аспектам совместной жизни пары^[34], в частности:

• демографические сведения (например, возраст, образование, доход, раса);

• внешний вид (например, насколько высоко они оценивали привлекательность своего партнера);

• предпочтения в сексе (например, насколько часто каждый из партнеров хочет секса? Насколько традиционным должен быть этот секс?);

• интересы и хобби;

• умственное и физическое здоровье;

• ценности (например, взгляды на политику, отношения и воспитание детей);

• и многое-многое другое.

Кроме того, у Джоэл и ее группы не просто было больше данных, чем у других полевых исследователей. Они использовали более прогрессивные статистические методы. Джоэл и некоторые ее коллеги превосходно овладели машинным обучением – подмножеством искусственного интеллекта, позволяющим современным исследователям обнаруживать неочевидные закономерности в больших массивах данных. Проект Джоэл можно было бы назвать браком с участием искусственного интеллекта: он был одним из первых, где на службу задаче прогнозирования успешных отношений были поставлены столь современные методики.

Если вам нравятся викторины и другие игры на отгадывание, можете попытаться предсказать ее результаты. Как вам кажется, какой фактор лучше всего предсказывает успешные отношения? Действительно ли общие интересы важнее общих ценностей? Насколько важна сексуальная совместимость в долгосрочном плане? Будете ли вы счастливее в союзе с человеком одного с вами происхождения?

Джоэл подобрала людей в исследовательскую группу, собрала данные и проанализировала их – и наконец была готова предъявить миру один из самых важных результатов в науке об отношениях.

На октябрь 2019 года Джоэл назначила свое выступление в Университете Ватерлоо в Канаде^[35]. Оно было озаглавлено незамысловато: «Можно ли помочь людям подобрать более подходящего партнера для романтических отношений?»

Итак, могла бы Саманта Джоэл, объединив усилия с восьмьюдесятью пятью самыми известными учеными мира, собрав воедино данные из сорока трех научных исследований, получив значения сотен переменных путем опроса свыше десяти тысяч пар, применив находящиеся на острие прогресса модели машинного обучения, – могла бы она, проделав все это, помочь людям выбрать более подходящего романтического партнера?

Нет.

Первый – и самый удивительный – урок, извлеченный ею из данных, как сама Саманта сказала мне во время интервью в Zoom^[36], «заключается в том, насколько непредсказуемыми представляются отношения».

Джоэл и ее соавторы обнаружили, что демографические показатели, предпочтения и ценности двух людей практически ни в какой мере не позволяют предсказать, насколько те будут счастливы в романтических отношениях.

Вот так обстоят дела, друзья мои. Сегодня искусственный интеллект может:

• обыгрывать даже самых одаренных людей в шахматы и го;

• надежно предсказывать общественные беспорядки за пять дней до их начала, опираясь только на переписку в Интернете^[37];

• сообщать людям о том, какие проблемы со здоровьем их ожидают, исходя из естественного запаха их тела^[38].

Попросите при этом искусственный интеллект определить, смогут ли два человека счастливо жить вместе – и он окажется беспомощным, как и все мы.

Постойте… но ведь это выглядит настоящим провалом. К тому же это кошмарно плохое начало для главы моей книги, дерзко утверждающей, что наука о данных способна произвести революцию в принятии нами решений относительно своей жизни. Неужели ей в самом деле нечего предложить нам в части выбора романтического партнера – самого важного решения в жизни?

Не совсем. На самом деле из проекта машинного обучения Джоэл и ее соавторов можно извлечь полезные уроки, пусть даже способность компьютеров предсказывать успех в любви оказалась хуже предположений.

Джоэл и ее коллектив обнаружили крайне малое влияние собранных ими переменных на перспективы успеха пары – но при этом наличие у партнера определенных параметров все же чуть увеличивает шансы, что вам с ним будет хорошо. А что еще важнее, из удивительной трудности предсказания успеха в любовных делах вытекают странные следствия, касающиеся выбора партнера.

Давайте задумаемся. Многие считают, что параметры, которые рассматривали Джоэл и ее коллектив, важны при выборе романтического партнера. Они яростно конкурируют за потенциального партнера, обладающего определенными свойствами, думая, что таким образом борются за собственное счастье. Если же свойства, за которые на рынке разворачивается ожесточенная конкуренция, не коррелируют с романтическим успехом – значит, многие выстраивают свою линию поведения в этой области неверно.

Это приводит нас к другому бесконечно древнему вопросу, к решению которого недавно тоже пытались применить принципиально новые данные: как именно люди выбирают романтического партнера?

В последние несколько лет другие исследовательские коллективы предприняли анализ данных с сайтов знакомств. Они рассматривали новые большие массивы данных о чертах характера и привычках десятков тысяч претендентов, чтобы выяснить, что создает привлекательность для романтических отношений. И этот анализ, в отличие от исследования счастья в отношениях, дал вполне осязаемый результат. Если работающие с данными ученые выяснили, что указать качества партнера, предвещающие счастье в отношениях, удивительно сложно, то определить качества, делающие нас такими же привлекательными для противоположного пола, как кошачья мята для кошек, оказалось поразительно просто.

Одно недавнее исследование показало, что не только возможно с большой точностью предсказать, свайпнет ли конкретный человек фотографию на сайте знакомств направо или налево. Можно даже предсказать (и весьма точно), сколько времени пройдет перед тем, как фото смахнут: люди имеют тенденцию думать дольше над фото тех, кто находится близко к их порогу приемлемости в качестве романтического партнера.

То же самое можно переформулировать так: предсказать хорошего романтического партнера при помощи данных сложно.

Предсказать привлекательного партнера – просто. Следовательно, многие из нас выстраивают тактику поиска партнера полностью неверно^[39].

17. «Все лгут. Поисковики, Big Data и Интернет знают о вас все». Москва: Бомбора, 2022.

18. Данные о длине члена, которую мужчины сами сообщают Google, можно найти здесь: https://clck.ru/34BU6P.

19. 12,7 см. – Прим. ред.

20. Ariana Orwell, Ethan Kross, and Susan A. Gelman, “‘You’ speaks to me: Effects of generic-you in creating resonance between people and ideas”, PNAS 117(49) (2020): 31038–45.

21. https://en.wikipedia.org/wiki/List_of_best-selling_books.

22. Matthew Smith, Danny Yagan, Owen Zidar, and Eric Zwick, “Capitalists in the Twenty-First Century”, Quarterly Journal of Economics 134(4) (2019): 1675–1745.

23. Pierre Azoulay, Benjamin F. Jones, J. Daniel Kim, and Javier Miranda, “Age and High-Growth Entrepreneurship”, American Economic Review 2(1) (2020): 65–82.

24. Там же.

25. Там же.

26. Pierre Azoulay, Benjamin F. Jones, J. Daniel Kim, and Javier Miranda, “Age and High-Growth Entrepreneurship”, American Economic Review 2(1) (2020): 65–82.

27. Yuval Noah Harari, Homo Deus: A Brief History of Tomorrow (New York: Random House, 2016).

28. Yuval Noah Harari. “Organisms Are Algorithms. Body Is Calculator. Answer = Sensation~Feeling~Vedan?”, YouTube, uploaded by Rashid Kapadia, June 13, 2020, https://www.youtube.com/watch?v=GrQ7nY-vevY.

29. Daniel Kahneman, Thinking, Fast and Slow (New York: Farrar, Straus & Giroux, 2011).

30. https://www.wesmoss.com/news/why-who-you-marry-is-the-most-important-decision-you-make/.

31. Harry T. Reis, “Steps toward the ripening of relationship science”, Personal Relationships 14 (2007): 1–23.

32. Samantha Joel et al., “Machine learning uncovers the most robust self-report predictors of relationship quality across 43 longitudinal couples studies”, PNAS 117(32): 19061–71.

33. Исследование рассматривало только гетеросексуальные пары.

34. Переменные, по которым проводилось исследование, можно найти здесь: https://osf.io/8fzku/. Соответствующий файл – Master Codebook With Theoretical Categorization, Final.xlsx, который находится в разделе “Master Codebook with Theoretical Categorization”. Выражаю благодарность Джоэл, указавшей мне на него.

35. https://www.psychology.uwo.ca/pdfs/cvs/Joel.pdf.

36. Интервью с Самантой Джоэл я провел 24 сентября 2020 года.

37. Ed Newton-Rex, “59 impressive things artificial intelligence can do today”, Business Insider, May 7, 2017, https://www.businessinsider.com/artificial-intelligence-ai-most-impressive-achievements-2017-3#security-5.

38. Bernard Marr, “13 mind-blowing things artificial intelligence can already do today”, Forbes, November 11, 2019, https://www.forbes.com/sites/bernardmarr/2019/11/11/13-mind-blowing-things-artificial-intelligence-can-already-do-today/#4736a3c76502.

39. Если угодно, можно выразить то же самое каламбуром: очень просто предсказать, на кого вы «западете», и сложно – с кем совпадете.