Модельное мышление. Как анализировать сложные явления с помощью математических моделей (Скотт Пейдж) - читать бесплатно онлайн полную версию книги (ч.notes)

Сноски

1

О распределениях с длинными хвостами см. главу 6. Прим. ред.

2

Процесс обработки данных, который преобразует непрерывные данные в дискретные путем замены значений диапазонами. Прим. ред.

3

См., например, книгу Кэти О’Нил (O’Neil, 2016), в которой рассказывается о том, как простые модели, основанные на данных, могут не учитывать некоторые слои населения и адаптивную обратную связь, которую мы обсудим в главе 4.

4

См. статью Паарша и Ширера (Paarsch and Shearer 1999), в которой анализируется лесная промышленность. Исходные данные о посадке деревьев указывают на наличие отрицательной корреляции между сдельной оплатой труда и количеством высаженных деревьев – другими словами, чем больше человеку платят за посадку дерева, тем меньше деревьев он высаживает. Этот вывод противоречит стандартной экономической логике. Если вы платите работникам больше за каждое посаженное дерево, они должны работать усерднее. Согласно модели Паарша и Ширера, лесозаготовительные компании платят работникам сдельную ставку за каждое дерево так, что почасовая рыночная ставка заработной платы составляет 20 долларов в час. На основании этого допущения можно вывести следующую формулу расчета оплаты за одно дерево:

20 долларов = количество деревьев, высаженных за час × оплата за дерево.

Если человек посадит десять деревьев за час, то оплата за одно дерево составит 2 доллара, а если двадцать деревьев за час, то 1 доллар. Таким образом, модель указывает на наличие отрицательной корреляции между сдельной оплатой труда и количеством высаженных деревьев. Кроме того, она также говорит о том, что произведение сдельной ставки на количество деревьев равно постоянной величине.

5

Доказательства того, что модели важнее людей, можно найти здесь: Dawes, 1979; Tetlock, 2005; Silver, 2012; Cohen, 2013. О предвзятости суждений читайте здесь: Kahneman, 2011.

6

См. Slaughter, 2017 и Ramo, 2016.

7

Согласно исследованиям, наиболее эффективные эксперименты и патенты в значительной степени черпают идеи из разных областей знаний. Анализ 35 миллионов научных работ показывает, что в долгосрочной перспективе междисциплинарные научные работы оказывают большее влияние (Van Noorden, 2015). Совокупность идей не обязательно является совокупностью моделей, но во многих случаях это действительно так – см. Jones, Uzzi, and Wuchty, 2008, а также Wuchty, Jones, and Uzzi, 2007. Фримен и Хуан (Freeman and Huang, 2015) в своей статье отмечают наличие корреляции между этническим многообразием и частотой цитирования. Если считать патенты наглядным подтверждением инноваций, то два отдельных направления исследований связывают многообразие типов мышления с успехом. В статье Ши, Адамич, Тсенга и Кларксона (Shi, Adamic, Tseng, and Clarkson, 2009) показано, что патенты, охватывающие разные категории, упоминаются чаще. Юн, Страмски, Беттанкур и Лобо (Youn, Strumsky, Bettencourt, and Lobo, 2015) указывают в своей статье на то, что действие большинства патентов распространяется на множество подкатегорий. Междисциплинарные исследования уверенно вышли на такой уровень, что социологи в целом цитируют работы из других научных дисциплин чаще, чем из своей области.

8

См. Box and Draper, 1987.

9

См. Page, 2010a.

10

Я не приравниваю знания к моделям, а говорю о том, что модели могут отражать знания и обеспечивать надежный способ распространения соответствующих представлений. Термин «знание» имеет множество значений и включает в себя, помимо прочего, такие навыки, как игра в теннис, французкий язык и составление контрактов. Я использую более узкое определение. С более широкой концепцией можно ознакомиться здесь: Adler, 1970.

11

Это приближенное значение можно получить на основании предельной скорости летящих парашютистов, достигающей почти 320 километров в час. Предельная скорость зависит от массы. Предположим, масса парашютиста в 400 раз больше массы игрушечного гепарда. Квадратный корень из 400 равен 20. Следовательно, предельная скорость игрушечного гепарда равна 320 километрам в час, деленным на 20, или примерно 16 километрам.

12

Он был прав. Для справки: Фресно на 30 процентов больше Исландии. В книге Эрика Болла и Джозефа ЛиПумы (Ball and LiPuma, 2012) рассказывается о том, как можно использовать научные выводы в мире бизнеса.

13

См. Lo, 2012. Общие аргументы можно найти здесь: Myerson, 1992.

14

Издана на русском языке: Зеликов Ф., Аллисон Г. Квинтэссенция решения. На примере Карибского кризиса 1962 года. М.: ЛКИ, 2012. Прим. ред.

15

См. также по теме: Диксит А., Скит С., Рейли Д. Стратегические игры. М.: Манн, Иванов и Фербер, 2017. Прим. ред.

16

Синапсы – это оконечные образования нейронов, с помощью которых нервные импульсы передаются от одного нейрона к другому. Некорректно говорить, что синапсы образуют нейроны – это разные структуры. Прим. ред.

17

Большинство англоязычных исследователей для обозначения действующих лиц экономических, социальных и политических событий используют термин актор. В русскоязычном сегменте научного мира предпочитают агент. Хотя между этими словами есть определенные различия, мы будем их использовать в данной книге как синонимы. Прим. ред.

18

Red cape (англ.) – красная накидка. Атрибут Супермена. Прим. ред.

19

См. Epstein 2008, где представлена более детальная классификация причин для моделирования. В книге Чарльза Лейва и Джеймса Марча (Lave and March, 1975) описаны три направления применения моделей: объяснение происходящих событий, прогнозирование новых явлений, создание и разработка систем. Косвенным образом авторы также выступают за использование моделей для исследований.

20

См. Harte, 1988. Эта классификация заимствована из статьи Джеймса Джонсона (Johnson, 2014) о сферах применения моделей в общественных науках. Эти два подхода также известны как галилеева и минималистская идеализации. См. Weisberg, 2007. Более подробную информацию об аналогиях можно найти здесь: Pollack, 2014; Hofstadter and Sander, 2013. В книге Дугласа Хофштадтера и Эммануэля Сандера сказано, что аналогия выступает в роли «топлива и огня» мышления. Подробное описание классов моделей можно найти в книге: Schelling, 1978, 87. В блоге Дэниела Литтла Understanding Society («Понимание общества») представлены основные положения социальной онтологии.

21

См. Arrow, 1963. Общий упорядоченный список альтернатив возможен при ограничении индивидуальных списков предпочтений. Например, если бы у каждого человека был один и тот же список предпочтений, то существовал бы и общий список. В целом у нас нет способа преобразовать индивидуальный список предпочтений в согласованный общий список.

22

Лучшие умы моего поколения, несомненно, заметили, что я позаимствовал фразу «это действительно было» из поэмы Howl («Вопль»). См. Bickel, Hammel, and O’Connell, 1975.

На представленном ниже рисунке показан один из множества примеров того, как включение дополнительной вершины приводит к сокращению общей длины ребер графа. На графе слева четыре вершины соответствуют углам квадрата, а на графе справа добавлена пятая вершина в центре. Если длина стороны квадрата равна 1, общая длина ребер левого графа равна 3, а общая длина ребер правого графа равна 4 × 0,71, что меньше 3.

Парадокс Симпсона возникает, когда заявления на факультеты с более высоким процентом зачисления подает больше абитуриентов женского пола, чем мужского. Например, рассмотрим университет, в котором есть медицинская и ветеринарная школы. Предположим, в медицинскую школу подают заявления 900 абитуриентов мужского пола, и 480 (или 53 процента) из них зачисляются, и 300 абитуриентов женского пола, и 180 (или 60 процентов) из них зачисляются, а в ветеринарную школу подают заявления 100 абитуриентов мужского пола, и 20 (или 20 процентов) из них зачисляются, и 300 абитуриентов женского пола, и 90 (или 30 процентов) зачисляются. В каждой школе на обучение принято больше женщин, но в целом зачислено 50 процентов мужчин (500 из 1000) и только 45 процентов женщин (270 из 600).

В качестве примера парадокса Паррондо рассмотрим следующую ситуацию. Предположим, первая ставка всегда проигрывает 1 доллар, а вторая ставка проигрывает 2 доллара в любом периоде, номер которого не делится на три, и выигрывает 3 доллара в периоды 3, 6, 9, 12 и так далее. Каждая ставка обеспечивает ожидаемый проигрыш, но если вы будете делать вторую ставку только в те периоды, когда она выигрывает, а первую ставку – в остальные периоды, то будете выигрывать по 1 доллару каждые три периода.

23

См. Kooti, Hodas, and Lerman, 2014.

24

Предположим, каждый человек получает одинаковый доход I и выплачивает налоги по неизменной ставке налога t. Пусть c обозначает процент сокращения налоговой ставки, а r – повышение уровня дохода. Текущий объем налоговых поступлений в государственный бюджет равен I · t. После снижения налогов объем налоговых поступлений составит I(1 + r) · t(1 − c). Объем налоговых поступлений в государственный бюджет увеличится тогда, и только тогда, когда I · t < I(1 + r) · t(1 − c). Перегруппировка членов неравенства дает r > c(1 + r).

25

См. Ledyard, Porter, and Wessen, 2000, где представлена информация о рыночном механизме, обеспечивающем более эффективное решение многомерных задач полезной нагрузки.

26

Я позаимствовал слово «непостижимо» у физика Юджина Вигнера (Eugene Wigner, 1960), который описывал математические модели, используемые в естественных науках, как непостижимо эффективные.

27

См. Ziliak and McCloskey, 2008. В этой книге идет речь о способности моделей, используемых в общественных науках, объяснять вариацию.

28

Информацию об истории аукциона частот можно найти здесь: Porter and Smith, 2007.

29

См. Squicciarini and Voigtlander, 2015. В книге Джоэля Мокира (Mokyr, 2002) представлена исчерпывающая историческая информация о важности передачи знаний.

30

См. www.treasury.gov/initiatives/financial-stability/Pages/default.aspx.

31

Например, в середине 1990-х годов обанкротились около 60 процентов ресторанов, открывшихся в Колумбусе. Ни один из них не получил финансовой помощи от государства, да и не должен был получить. Здоровая рыночная экономика подразумевает вероятность банкротств. См. Parsa et al., 2005.

32

Данные взяты из доклада МВФ о глобальной финансовой устойчивости за 2009 год. Сила связи основана на корреляции по стоимости портфеля ценных бумаг. Корреляция рассчитана исходя из предельных случаев – данных за те дни, когда эти учреждения демонстрировали особенно высокие или особенно низкие результаты. Этот показатель должен был отражать вероятность того, что банкротство одной компании повлечет за собой банкротство другой компании. В действительности корреляция по результатам работы могла быть следствием сходства инвестиционных портфелей или того, что один банк владел активами другого банка.

33

См. Geithner, 2014.

34

См. Weisberg, 2012. В этой книге описана модель залива Сан-Франциско и ее практическая ценность с точки зрения выбора курса действий.

35

Исчерпывающую информацию об этом крушении можно найти здесь: Stone et al., 2014.

36

Я благодарен Джошу Эпштейну за первый пример.

37

См. Dunne, 1999 и Raby, 2001.

38

С математической точки зрения эту теорему можно трактовать как получение распределения вероятностей ответов с медианой, центрированной около истинного значения оцениваемой величины. Прим. ред.

39

См. Levins, 1966.

40

Более подробное описание теоремы и вывод из нее можно найти здесь: Page 2007, 2017.

41

Несложно показать, что квадратичная ошибка коллективного предсказания выражается через среднее квадратическое расстояние отдельных прогнозов от коллективного прогноза. Прим. ред.

42

Мудрость толпы – тема одноименной книги Джеймса Шуровьески (Suroweicki, 2006); о том, как лисы могут перехитрить ежей, можно прочитать в книге Филипа Тетлока (Tetlock, 2005); в статье Статиса Каливаса (Kalyvas, 1999) идет речь о неспособности политической науки предвидеть падение Советского Союза; информацию об использовании ансамблевых методов в области компьютерных наук можно найти здесь: Patel et al., 2011.

43

См. Аристотель. Сочинения в 4 томах. Том 2. М.: Мысль, 1978. Прим. ред.

44

Лу Хонг и Скотт Пейдж показывают в своей статье (Hong and Page, 2009), что независимые модели требуют уникального набора категорий. Другими словами, существует только один способ создания множества независимых прогнозов на основе модели бинарной категоризации.

45

См. три мои книги, опубликованные ранее: «Различие» (The Difference – Page, 2008), «Разнообразие и сложность» (Diversity and Complexity – Page, 2010) и «Преимущества разнообразия» (The Diversity Bonus – Page, 2017) – в них подробно анализируется теорема о прогнозе разнообразия. Данные об экономических прогнозах можно найти здесь: Mannes, Soil, and Larrick, 2014.

46

Борхес Х. Л. Сочинения в трех томах. Том 3. Полярис, 1997. Прим. ред.

47

Статистики обозначают долю вариации, которую объясняет модель, как R² этой модели. (Этот коэффициент в статистике обычно называют коэффициентом детерминации, вычисляется как отношение межгрупповой вариации всей модели к внутригрупповой вариации (вариации одной модели). Прим. ред.

Читать продолжение на ЛитРес