Алгоритм как термин просто описывает некое уравнение: любую формулу или набор правил, которые выдают желаемый результат. Самые ранние примеры восходят еще к древнему Вавилону, располагавшемуся на территории современного Ирака. На клинописных табличках, датируемых 1800–1600 годами до н. э., записаны алгоритмы для таких целей, как вычисление длины и ширины резервуара, если известны его глубина и объем вынутого грунта. По словам математика Дональда Кнута, вавилоняне “представляли каждую формулу в виде пошагового списка правил, то есть в виде алгоритма вычислений по этой формуле”. У них была специальная система записи вычислений, использующая, как пишет Кнут, “не символический язык, а представление формул на «машинном языке»”. Письменное объяснение каждого вавилонского алгоритма заканчивалось одной и той же фразой: “Таков способ”. Эта фраза подчеркивает неотъемлемое свойство алгоритмов: их можно повторять, они одинаково применимы и эффективны каждый раз, когда возникает определенная ситуация. Современный последователь Кремниевой долины назвал бы их адаптируемыми.
Алгоритмы занимают важное место в истории математики. Около 300 года до н. э. греческий философ Евклид описал в своем труде “Начала” так называемый алгоритм Евклида[9] – способ нахождения наибольшего общего делителя двух чисел. И его, и “решето Эратосфена” – алгоритм III века до н. э., который находит все простые числа, не превосходящие определенного числа, – используют до сих пор, особенно в области криптографии. Однако само слово “алгоритм” происходит от имени определенного человека – или, по крайней мере, от места его рождения.
Персидский ученый Мухаммад ибн Муса аль-Хорезми родился около 780 года в Хорезме – государстве, располагавшемся на территории современных Туркменистана и Узбекистана. О его жизни мало что известно. Он добрался до Багдада, который стал интеллектуальным центром региона после того, как мусульманский халифат Аббасидов завоевал Персию в VII веке. Там ученый занимался астрологией, географией и математикой в Доме мудрости, известном также как Большая библиотека Багдада. Подобно своей предшественнице – египетской Александрийской библиотеке – Дом мудрости являлся междисциплинарным научным центром, где ценили исследования и переводили на арабский язык тексты, написанные на латыни, санскрите, греческом и персидском языках. Около 820 года аль-Хорезми завершил работу “Книга об индийском счете”, которая в конечном итоге привела к распространению в Европе современной системы записи чисел. Он также сочинил трактат о методах решения уравнений “Китаб аль-джебр ва-ль-мукабала” (“Краткая книга о восполнении и противопоставлении”). От слова “аль-джебр” из названия (которое означает “восстановление, восполнение”, то есть сокращение одинаковых членов в обеих частях уравнения) произошло слово “алгебра”. В труде аль-Хорезми описывались методы решения квадратных уравнений и вычисления площади и объема, указывались приближенные значения числа π.
В середине XII века в Испании пересекались мусульманская, иудейская и христианская культуры – иногда мирно, иногда не очень, и между цивилизациями шел обмен идеями. Живший тогда в испанском городе Сеговия английский востоковед Роберт Честерский в 1145 году перевел “Книгу о восполнении и противопоставлении” на латынь. “Аль-джебр” превратилось в algeber, а “аль-Хорезми” – в Algoritmi. В то время слово algorismus относилось ко всем математическим операциям с использованием индийско-арабских цифр, а тех, кто занимался подобным искусством, называли алгористами. (Этим термином именуют себя визуальные художники, с 1960-х годов использующие алгоритмические процессы, однако он кажется подходящим для всех, кто работает над современной версией алгоритмов.) Такой длинный путь этимологии алгоритма показывает, что вычисления являются не только продуктом воспроизводимых научных законов, но и результатом человеческого искусства и труда.
Работа компьютеров основана на многократно выполняемых операциях. Затем с результатами, закодированными нулями и единицами, производятся новые операции, результат которых выдается пользователю. В 1822 году британский изобретатель Чарльз Бэббидж изложил свою концепцию “применения машин для вычисления астрономических и математических таблиц” – метод автоматизации вычисления с помощью системы пронумерованных шестерней и валиков, названной разностной машиной. Это устройство так и не было построено целиком, однако его более поздние реализации выглядят как внутренности фортепиано, только вместо молоточков тянутся длинные ряды колес. Спроектированная Бэббиджем машина должна была иметь высоту восемь футов и весить четыре тонны. Затем изобретателю в голову пришла идея аналитической машины, которая могла (если бы ее удалось построить) получать команды, заданные с помощью перфокарт, и выполнять простые операции программирования (циклы и условные операторы). Она стала основой для гораздо более сложных современных вычислительных машин. Сын Бэббиджа Генри в 1888 году писал: “Это всего лишь вопрос карт и времени”.
Дочь лорда Байрона Ада Лавлейс сегодня считается первым программистом: она написала алгоритмы для машины в том виде, в каком ее спроектировал Бэббидж, включая процесс вычисления чисел Бернулли. Лавлейс также поняла, что повторяющиеся механические процессы, на которые способна машина, можно применять не только в математике. В 1843 году Лавлейс писала, что аналитическая машина “могла бы работать с другими вещами, кроме чисел, если найти объекты, взаимоотношения которых можно выразить с помощью абстрактной науки об операциях и которые также можно приспособить к рабочей нотации и механизму машины”. Иными словами, формально можно манипулировать всем, что удастся превратить в нечто похожее на данные – какой-то ряд чисел. Это может быть текст, музыка, искусство или даже игра – например, шахматы. Лавлейс представила себе одну из форм такой автоматизации: “Если предположить, например, что фундаментальные отношения звуков в науке гармонии и музыкальной композиции поддаются такому выражению и адаптации, то машина могла бы сочинять замысловатые научные музыкальные произведения любой степени сложности и объема”. Она предвосхитила нечто, подобное “генеративной музыке”; композитор Брайан Ино предложил этот термин в 1995 году для описания постоянно меняющихся синтезаторных композиций: программное обеспечение создает разные мелодии при каждом запуске программы. Лавлейс представляла, как новая технология может формировать и увековечивать культуру – как это происходит сегодня при алгоритмическом наполнении лент.
Лавлейс одной из первых обнаружила, что манипулирование такими механическими командами может оказаться формой самовыражения. В 1990-х и 2000-х годах компьютерное программирование заняло место рядом с математикой и естественными науками, превратившись в навык, необходимый для полноценного образования ребенка. Я познакомился с ним примерно в 2002 году в компьютерном классе своей школы: мы играли в обучающие видеоигры, напоминающие языки программирования. Но по-настоящему я учился с помощью громоздких графических калькуляторов TI-83, которые нам приходилось приобретать для уроков математики. Эти калькуляторы можно было программировать на языке под названием TI-BASIC, включавшем простые операторы ветвления и функции. Сначала я составлял скромные программы для формул, которые использовались в моих тестах, но когда лучше разобрался в языке, стал создавать свои собственные версии игр “Крестики-нолики” и “Четыре в ряд”. Машина стала партнером в моем творчестве; это казалось настоящим волшебством.
Спустя столетие после Лавлейс британский математик и информатик Алан Тьюринг во время Второй мировой войны работал на правительство – он помогал взломать код немецкой шифровальной машины “Энигма”. В 1946 году, когда война закончилась, Тьюринг написал для Национальной физической библиотеки доклад, в котором предложил идею проекта “автоматической вычислительной машины”. Это было первое описание искусственного интеллекта как реальной возможности, а не теоретической концепции. Тьюринг писал, что вычислительные и сортировочные машины, предназначенные для выполнения конкретных задач, уже существуют, однако его предложение выходит и за эти рамки: “Вместо того чтобы постоянно использовать человеческий труд для вывода материала из машины и ввода его обратно в нужный момент, обо всем будет заботиться сама машина”.
По мнению Тьюринга, подобное устройство могло бы выполнять любые вычисления в любом масштабе, не нуждаясь в перенастройке. У него имелся бы свой внутренний логический язык, который можно было бы приспосабливать для разных целей, чтобы решать произвольные задачи. “Как можно ожидать, чтобы машина выполняла все эти многочисленные вещи? – писал Тьюринг. – Ответ заключается в следующем: мы должны считать, что машина делает нечто довольно простое, а именно – выполняет команды, отданные ей в стандартной форме, которую она способна понять”. Она будет следовать алгоритмам. Он предвосхитил то, как современные алгоритмы машинного обучения развиваются с течением времени, внося коррективы без участия человека.
Такая система будет выполнять вычисления гораздо быстрее и на более высоком уровне сложности, превосходя возможности человека. Тьюринг писал: “Скорость машины больше не ограничивается скоростью человека-оператора”. Однако он не считал, что такие машины обеспечат утопическое счастье. То, что они будут работать автоматически, не означает, что они всегда будут правы. “Фактор человеческой ошибки устраняется, однако в какой-то степени его, возможно, заменят механические ошибки”, – продолжал Тьюринг. В своей работе он спрогнозировал многие известные сегодня компоненты персональных компьютеров: память с возможностью стирания, механизмы ввода, преобразование двоичного языка и даже контроль температуры во избежание перегревов. Однако для Тьюринга слово “компьютер” относилось не к машине, а к человеку, выполняющему вычисления, что еще раз подчеркивает этот органический элемент.
Еще в 1936 году Тьюринг придумал то, что сейчас называется “машиной Тьюринга”. Он подробно описал это устройство в эссе 1948 года под названием “Интеллектуальная машина”. Машина Тьюринга – это “бесконечная лента, разделенная на ячейки, в каждой из которых можно записать какой-то символ”. Лента проходит через управляющее устройство, которое проверяет одну ячейку за раз и выполняет операцию, которая определяется состоянием машины и наблюдаемым символом: записать в ячейку новый символ, перейти в новое состояние и переместиться к соседней ячейке вправо или влево. Машина Тьюринга может реализовать любой алгоритм в историческом смысле слова – алгоритм произвольной математической процедуры. Любая вычислительная система, которая способна делать все, что может машина Тьюринга, называется “полной по Тьюрингу” или “тьюринг-полной”. Например, все языки программирования являются полными по Тьюрингу, потому что могут смоделировать любой вид уравнений. (Даже программа для работы с электронными таблицами Excel в 2021 году стала полной по Тьюрингу.) Тьюринг пришел к верному выводу о том, что любая вычислительная машина сумеет выполнить работу любой другой, и даже аналитическая машина Чарльза Бэббиджа XIX века теоретически могла бы выполнять сложные задачи, обрабатываемые нашими ноутбуками, – если бы ей предоставили бесконечные ресурсы и время.
В жизни Тьюринга тоже происходило своеобразное столкновение между механическими правилами и человеческими действиями. В 1952 году математика обвинили в совершении грубой непристойности – в “выражении гомосексуальности” (юридический оборот, означающий секс с другим мужчиной) – в ходе путаного судебного разбирательства, которое он сам инициировал после ограбления собственного дома. Гомосексуальный секс между взрослыми по обоюдному согласию оставался незаконным в Англии вплоть до 1967 года – этот закон является своего рода алгоритмом, выносящим приговор на основе безжалостного набора правил. В итоге Тьюринга признали виновным. Ему предоставили выбор между тюремным заключением и химической кастрацией, и он предпочел второй вариант. В июне 1954 года домработница нашла 41-летнего Тьюринга мертвым. Причиной смерти стало отравление цианидом, а предполагаемым методом самоубийства являлось надкушенное яблоко на прикроватной тумбочке[10].
Когда мы говорим об “алгоритме”, часто возникает ощущение, что эта сила появилась совсем недавно, в эпоху социальных сетей. Однако на самом деле речь идет о технологии, имеющей богатую историю и наследие, которые медленно формировались на протяжении целых веков до появления интернета. Восстановление этой более общей картины может помочь нам лучше понять силу, которой обладают современные алгоритмы. И все же, каким бы сложным ни был алгоритм, по своей сути он остается неким уравнением: методом, позволяющим получить желаемый результат – будь то шумерская схема, позволяющая разделить некоторое количество зерна поровну между несколькими мужчинами, или лента Фейсбука, определяющая, какое сообщение показывается первым, когда вы заходите на сайт. Все алгоритмы – это двигатели автоматизации, и, как прогнозировала Ада Лавлейс, автоматизация теперь вошла во многие сферы нашей жизни, не ограничиваясь чистой математикой.
В 1971 году в одном из офисных зданий в центре города Сантьяго (Чили) появилась шестиугольная комната, спроектированная как своеобразное диспетчерское помещение для всей страны. На обшитых деревянными панелями стенах висели мониторы и экраны, на которые выводились различные показатели – например, поставки сырья и уровень занятости населения. В центре комнаты по кругу стояли семь белых стеклопластиковых кресел, напоминавших место капитана космического крейсера из научной фантастики. С правой стороны от каждого располагалась панель управления экранами; имелись также пепельница и держатель для стакана – возможно, для виски. Этот диспетчерский центр – часть масштабного проекта “Киберсин”[11] – был спроектирован при социалистическом президенте Чили Сальвадоре Альенде под руководством Стаффорда Бира – британского специалиста по исследованию операций, который у себя в стране применял методы “кибернетики” для управления бизнесом. Бир описывал кибернетику как “науку управления”. Она включает в себя анализ сложных систем, будь то корпорации или биология, и изучение их работы для моделирования или создания подобных интеллектуальных самокорректирующихся систем. (В США аналогичную практику анализа систем впервые применила корпорация RAND в 1950-х годах.) Предполагалось, что проект “Киберсин” станет идеальной моделью, помогающей чилийскому правительству принимать решения в режиме реального времени, пока они сидят в помещении, курят сигареты и пьют виски – очередная встреча холодного технологического и хаотичного человеческого. Из этого центра люди наблюдали за алгоритмами, которые управляли государством.
Физический дизайн проекта “Киберсин”, разработанный под руководством немецкого консультанта Ги Бонсипе, создавал образ утопии в духе модерна середины века. Провода, соединявшие мониторы на стенах и сиденья, были скрыты от глаз. Сами гладкие одинаковые кресла отличались искривленной плавностью и отсутствием видимых швов. Комната символически сводила управление страной к манипулированию данными – словно к победе в какой-то видеоигре. Проект “Киберсин” обещал заменить человеческое руководство технологическим надзором, а скромный ряд экранов предоставлял любую требуемую информацию. Можно было просто усесться в одно из кресел и наблюдать за всем, что происходит в стране.
Однако технология проекта “Киберсин” являлась лишь фасадом, своеобразным фантастическим дизайн-концептом – интерактивной иллюзией возможного. Компьютерные сети того времени не позволяли реализовать его потенциал. Вывод данных осуществлялся вручную, а не автоматически. Центр использовал единственный компьютер, получавший информацию от чилийских заводов с помощью телексных аппаратов через телефонные линии. И, наконец, хотя центр и закончили, его так и не запустили[12]. Одиннадцатого сентября 1973 года правительство Альенде было свергнуто при поддержке ЦРУ, и к власти пришел Аугусто Пиночет.
Фотографии проекта “Киберсин” по-прежнему обладают неоспоримой притягательностью. Они снова и снова мелькают на дизайнерских досках настроения, демонстрируя эстетику, которая даже спустя много десятилетий все еще выглядит футуристично. Возможно, эти изображения впечатляют по той причине, что мы сохраняем мечту обработки реальных исходных данных и переработки их в цифровые схемы, после оценивания которых определяется правильный путь действий. Проект “Киберсин” излучал ощущение непогрешимости, хотя изобретатели уровня Тьюринга понимали, что компьютеры не могут работать настолько идеально. Как утверждал пионер кибернетики Стаффорд Бир, мы стремимся использовать машины для автоматизации уже существующих структур и процессов, которые изначально являлись творениями человека. Указывая на этот парадокс, Бир писал в своей книге 1968 года “Наука управления”: “Мы закрепляем в стали, стекле и полупроводниках те самые ограничения руки, глаза и мозга, для преодоления которых и был изобретен компьютер”. Как и в случае с механическим турком, внутри машины остается человек.
Сегодня мы уже располагаем вариантами алгоритмического правительства и алгоритмической жизни: банки прибегают к машинам, чтобы определить, кто получит кредит; Spotify использует данные о ваших прошлых действиях, чтобы рекомендовать те песни, которые лучше всего подходят вашей душевной организации. Однако технология, которая все это обеспечивает, не похожа на проект “Киберсин”. У нее нет шестиугольных комнат и кресел с подлокотниками. Алгоритмы стали одновременно невидимыми и вездесущими, они содержатся в приложениях, которые мы носим с собой на телефонах, хотя их данные физически хранятся где-то далеко, на огромных серверных фермах с градирнями, расположенных в малозаметных местах на природе. Если в проекте “Киберсин” предполагалось, что мир, управляемый данными, может быть последовательным и понятным и его можно заключить в рамки помещения диспетчерского центра, то теперь мы знаем, что он абстрактный и диффузный, он везде и нигде одновременно. Нас побуждают забыть о наличии алгоритмов.
Новые технологии неизбежно порождают новые формы поведения, но это поведение редко совпадает с тем, которого ожидают изобретатели. Технология обладает собственным смыслом, который в конечном итоге выходит на первый план. Маршалл Маклюэн написал знаменитый афоризм “Средство коммуникации есть сообщение”[13] в своей книге 1964 года “Понимание медиа: внешние расширения человека”. Он имел в виду, что структура нового средства передачи информации – электрического света, телефона, телевидения – важнее содержания, которое через него передается. Сама способность телефона соединять людей превосходит любой конкретный разговор. Маклюэн писал: “Ибо «сообщением» любого средства коммуникации, или технологии, является то изменение масштаба, скорости или формы, которое привносится им в человеческие дела”. В нашем случае средством передачи является алгоритмическая лента; она масштабирует и ускоряет взаимосвязь людей по всему миру до невообразимой степени. Смысл ее функции заключается в том, что на каком-то уровне наши коллективные потребительские привычки, переведенные в данные, приводят к одинаковости.
Алгоритмы – это цифровые машины, которые, подобно конвейеру на фабрике, превращают серию входных данных в определенный результат на выходе. Отличие одного алгоритма от другого заключается не столько в структуре, сколько в компонентах, из которых они строятся. Все рекомендательные алгоритмы работают, собирая набор исходных данных. Общий термин для этого набора данных – “сигнал”, собранные входные данные, которые поступают в машину. Этот сигнал может включать в себя сведения о прошлых покупках пользователя на Amazon или о том, сколько других пользователей отдали предпочтение определенной песне на Spotify. Подобные сведения имеют не качественную, а количественную форму, поскольку их должна обрабатывать машина. Поэтому даже если эти данные относятся к такой субъективной теме, как музыкальные предпочтения, они выражаются цифрами: х пользователей поставили группе y среднюю оценку z, или х пользователей прослушали треки группы y z раз. Основным сигналом для многих рекомендаций в социальных сетях является проявление интереса, или вовлеченность, которая описывает, каким образом пользователи взаимодействуют с контентом. Это может выражаться в лайках, ретвитах или просмотрах – всевозможные кнопки, расположенные рядом с постом. Высокая вовлеченность означает, что количество лайков, просмотров или перепостов у данного сообщения выше, чем у других.
Этот сигнал проходит через преобразователь данных, который превращает его в пакеты, предназначенные для обработки различными алгоритмами. Данные о вовлеченности можно отделить от данных о рейтингах или от данных о тематике самого контента. Чтобы добавить информацию об отношениях пользователей друг к другу в рамках одной платформы, можно использовать социальный калькулятор – например, я часто просматриваю в Инстаграме посты моего друга Эндрю, и это заставляет систему рекомендаций с большей вероятностью ставить его посты на первое место в моей персональной ленте.
Далее идет конкретное уравнение индивидуального алгоритма. В современных платформах очень редко работает лишь один алгоритм – обычно их много. Мы имеем дело с целым набором различных уравнений, которые учитывают переменные и обрабатывают их несколькими способами. Одно уравнение рассчитывает результат, основываясь только на вовлеченности (например, находит контент с самой высокой средней вовлеченностью), в то время как другое отдает приоритет социальному контексту контента для конкретного пользователя. Эти алгоритмы также получают тот или иной показатель приоритета относительно друг друга. Комбинированная фильтрация – технология, в рамках которой используется несколько методов. Наконец, на выходе получается сама рекомендация – следующая песня в автоматическом плейлисте или упорядоченный список постов. Алгоритм определяет, например, что сообщение из жизни друга появится в вашей ленте Фейсбука выше политических новостей.
Один из руководителей сервиса Pandora, который каталогизирует и рекомендует музыку, однажды описал мне систему этой компании как целый “оркестр” алгоритмов с “дирижирующим” алгоритмом. Каждый алгоритм применяет собственные стратегии для выработки рекомендаций, а затем алгоритм-дирижер определяет, какие варианты выдать в тот или иной момент. (При этом единственный результат работы сервиса – следующая песня в плейлисте.) В разные моменты требуются разные алгоритмические методы рекомендаций.
Единого монолитного “алгоритма” не существует, поскольку каждая платформа работает по-своему, используя индивидуальные переменные и наборы уравнений. Важно помнить, что работа ленты Фейсбука – это коммерческое решение, аналогичное тому, как производитель продуктов питания решает, какие ингредиенты использовать. Алгоритмы также меняются со временем, совершенствуясь с помощью машинного обучения. Данные, которые они получают, используются для постепенного самосовершенствования, чем стимулируется еще большее вовлечение; машина адаптируется к пользователям, а пользователи – к машине. Различия между платформами стали более заметными и актуальными в середине 2010-х годов, когда социальные сети и стриминговые сервисы усилили алгоритмическую подачу информации и та стала основой пользовательского опыта.
Мы, пользователи, в принципе не понимаем, как обычно работают алгоритмические рекомендации. Их уравнения, переменные и весовые коэффициенты не являются общедоступной информацией, потому что технологические компании не заинтересованы в их обнародовании. Они являются коммерческой тайной и важны для бизнеса почти так же, как коды запуска ядерных ракет – для государства. Их редко раскрывают; редко встречаются даже намеки на них. Одна из причин заключается в том, что в условиях общедоступности алгоритма пользователи получат возможность обманывать систему, чтобы продвигать свой собственный контент. Еще одна причина – страх перед конкуренцией: другие цифровые платформы могут украсть “секретный ингредиент” и состряпать более качественный продукт. И все же эти инструменты, как и многие другие цифровые технологии, зародились в некоммерческой среде.
Алгоритмы рекомендаций как способ автоматической обработки и сортировки информации начали применяться в 1990-х годах. Одним из первых примеров стала система сортировки электронной почты – муторное занятие и по сей день. Уже в 1992 году инженеры научно-исследовательского центра компании Xerox в Пало-Альто (более известного как PARC) начали утопать в почте. Они пытались решить проблему “растущего использования электронной почты, в результате которого пользователей захлестывает колоссальный поток входящих документов”, как написали Дэвид Голдберг, Дэвид Николс, Брайан Оки и Дуглас Терри в статье 1992 года. (Они даже не подозревали, с каким объемом цифровой коммуникации мы столкнемся в XXI веке.) Их система фильтрации электронной почты под названием Tapestry использовала два вида алгоритмов, работавших совместно: “фильтрация на основе содержания” и “совместная фильтрация”. Первый, который уже применялся в нескольких системах электронной почты, оценивал текст писем – например, если вы хотели установить приоритет по слову “алгоритм”. Второй, более инновационный метод, основывался на действиях других пользователей. При определении приоритета конкретного письма учитывалось, кто его открыл и как на него отреагировал. В статье говорилось:
Люди помогают друг другу осуществлять фильтрацию, записывая свои реакции на прочитанные документы. Например, такая реакция может уведомлять, что документ показался особенно интересным (или особенно неинтересным). Подобные реакции, называемые в общем случае аннотациями, могут быть доступными фильтрам других людей.
В Tapestry использовались “фильтратор”, запускавший повторяющиеся запросы по набору документов, “ящичек”, собиравший материалы, которые могли заинтересовать пользователя, и “оценщик”, который устанавливал приоритеты и категоризировал документы. Концептуально это очень похоже на современные алгоритмические ленты: цель Tapestry заключалась в том, чтобы выводить на первый план контент, который с наибольшей вероятностью окажется важен для пользователя. Однако подобная система требовала гораздо больше предварительных действий со стороны пользователей: им приходилось писать запросы, по которым система определяла, что они желают увидеть, основываясь либо на контенте, либо на действиях других пользователей. Остальным пользователям в системе также приходилось выполнять весьма целенаправленные действия, помечая материал как важный или нерелевантный. Для подобной схемы требуется небольшая группа людей, которые уже знают друг друга и понимают, как их сообщество взаимодействует с электронной почтой – например, вы уже осведомлены, что Джефф отвечает только на особо важные письма, и поэтому вы хотите, чтобы ваш фильтр выводил наверх все письма, на которые отвечает Джефф. Tapestry лучше всего функционировала в весьма небольшой системе.
В 1995 году Упендра Шардананд и Пэтти Маес из MIT Media Lab (медиалаборатории Массачусетского технологического института) описали в своей статье “социальную фильтрацию информации” – “технику создания персонализированных рекомендаций из любой базы данных для пользователя на основе сходства профилей интересов”. Эта работа опиралась на идеи Tapestry и стала ответом на перегруженность онлайн-информацией: “Объем значительно больше, нежели человек может отфильтровать, чтобы найти то, что ему понравится”. Авторы пришли к выводу о необходимости автоматизированных фильтров: “Нам нужна технология, которая поможет продраться через всю информацию, чтобы найти то, что нам действительно нужно, и избавит нас от того, с чем мы не хотим заморачиваться”. (Естественно, эта проблема актуальна до сих пор.) Шардананд и Маес утверждали, что у фильтрации на основе содержания есть существенные недостатки. Она требует перевода материала в данные, понятные машине, например в текст; ей не хватает интуитивной прозорливости, поскольку она может фильтровать только по терминам, которые вводит пользователь; и она не измеряет внутреннее качество. Она не способна “отличить хорошо написанную статью от плохо написанной, если в этих двух работах используются одинаковые термины”. Невозможность оценить качество наводит на мысли об искусственном интеллекте: новые инструменты вроде ChatGPT, казалось бы, способны понимать и генерировать осмысленный язык, однако на самом деле они лишь повторяют схемы, присущие уже существующим данным, на которых они обучались. Качество субъективно; сами по себе данные – без человеческой оценки – не могут его определить.
Социальная фильтрация информации позволяет обойти эти проблемы, поскольку основана на действиях людей-пользователей, которые самостоятельно оценивают содержание, используя как количественные, так и качественные суждения. Это больше похоже на сарафанное радио, когда мы получаем советы, что послушать или посмотреть, от друзей, чьи предпочтения схожи с нашими собственными: “Объекты рекомендуются пользователю на основе величин, присвоенных другими людьми со сходным вкусом”, – говорилось в статье. Сходство вкусов одного пользователя с другим определялось с помощью статистической корреляции. Чтобы давать музыкальные рекомендации, исследователи разработали систему под названием Ringo, использующую электронную почту. Пользователю предлагали первоначальную группу из 125 исполнителей, он выставлял оценки по шкале от 1 до 7, после чего строилась диаграмма его предпочтений. Затем программа сравнивала эту диаграмму с диаграммами других пользователей и подбирала музыку, которая человеку предположительно понравится (или совсем не понравится – такой вариант тоже был). Рекомендации Ringo также сопровождались указателем уровня уверенности, который выдавал вероятность того, что предложение окажется удачным, и позволял пользователю дополнительно подумать над предложенным алгоритмическим выбором. К сентябрю 1994 года у Ringo были двадцать одна сотня пользователей и пятьсот электронных писем в день с оценками музыки.
Ringo тестировала различные алгоритмы для принятия решений на основе музыкальных рейтингов. Первый алгоритм измерял несходство между вкусами пользователей и основывал рекомендации на максимальном сходстве. Второй измерял сходство, а затем использовал для принятия решений положительные и отрицательные корреляции с другими пользователями. Третий определял корреляцию между различными исполнителями и рекомендовал музыкантов, которые сильно коррелировали с теми, что уже нравились данному человеку. Четвертый алгоритм (по мнению исследователей, самый эффективный) подбирал пользователей на основе того, положительно или отрицательно они оценивали одни и те же вещи – иными словами, на основе совпадения вкусов. Сходство оказалось наилучшей переменной. Чем больше пользователей включалось в систему и чем больше сведений они предоставляли, тем лучше работала Ringo – некоторые пользователи даже назвали систему “пугающе точной”. Инновация Ringo заключалась в том, что она подтверждала: наилучшим источником точных рекомендаций или лучших индикаторов релевантности, скорее всего, являются другие люди, а не анализ самого содержания. Концепция отражала повышение важности человеческого вкуса.
Первые алгоритмы интернета разработали для того, чтобы просеивать огромное количество материала в поисках вещей, важных для пользователя, и затем представлять их в связном виде. Целью были рекомендации: рекомендовать ту или иную информацию, песню, картинку или новость в социальных сетях. Алгоритмическую подачу информации иногда более формально и буквально называют “рекомендательными системами” за простой акт выбора того или иного контента.
Первым полностью общедоступным интернет-алгоритмом, с которым сталкивался практически каждый пользователь интернета, стал алгоритм поиска Google. В 1996 году, учась в Стэнфордском университете, соучредители Google Сергей Брин и Ларри Пейдж начали работу над тем, что впоследствии превратилось в PageRank – систему ранжирования страниц интернета (который на тот момент насчитывал около ста миллионов документов); она просматривала веб-страницы и определяла, какие из них окажутся полезнее или информативнее. Алгоритм PageRank подсчитывал, сколько раз на данный сайт ссылались другие, подобно тому, как авторы научных работ ссылаются на результаты предыдущих серьезных исследований. Чем больше ссылок, тем более важной считалась страница. Показатель цитирования “согласуется с субъективным представлением людей о важности”, – писали Брин и Пейдж в 1998 году в работе “Анатомия системы крупномасштабного гипертекстового интернет-поиска”. Алгоритм PageRank объединил форму совместной фильтрации с фильтрацией на основе содержания. Связывая различные страницы, люди-пользователи формировали субъективную карту рекомендаций, которую учитывал алгоритм. Он также измерял такие факторы, как количество ссылок на странице, относительное качество этих ссылок и даже размер текста – чем он длиннее, тем более релевантным может оказаться текст для конкретного поискового запроса. Страницы с высоким значением PageRank с большей вероятностью появлялись в верхней части списка результатов, которые выдавала поисковая система Google.
Прогноз Пейджа и Брина относительно того, что их система останется функциональной и масштабируемой по мере развития интернета, оказался верным. Спустя десятилетия PageRank стал почти тиранической системой, которая управляет тем, как и когда видны сайты. Для любого бизнеса или ресурса жизненно важно приспособиться к алгоритму ранжирования и попасть на первую страницу результатов поиска Google. В начале 2000-х годов мне приходилось просматривать множество выдаваемых страниц, чтобы найти то, что мне требовалось. В последнее время я почти никогда не добираюсь даже до второй страницы – в частности, благодаря тому, что поисковая система Google теперь еще и сама показывает текст, который сочла релевантным: она берет его с сайта и демонстрирует пользователю в верхней части страницы – выше фактических результатов поиска. Таким образом, пользователь, спросивший: “Можно ли кормить собаку морковью?” (я без устали искал ответ на этот вопрос, когда у меня впервые появился щенок), сразу получает ответ, и у него отпадает необходимость заходить на другой сайт, что еще сильнее укрепляет авторитет Google. “Знание – сила”, – писал Фрэнсис Бэкон в XVI веке, однако в эпоху интернета, возможно, еще больше преимуществ дает сортировка знаний. Информацию сегодня найти легко; гораздо сложнее разобраться в ней и понять, какие сведения полезны.
Пейдж и Брин хотели, чтобы их система была относительно нейтральной и оценивала каждый сайт исключительно с точки зрения его релевантности. Задача алгоритма заключалась в предоставлении пользователю наилучшей информации. Ориентирование поиска на определенный сайт или бизнес испортило бы результаты. “Мы полагаем, что поисковые системы, финансируемые за счет рекламы, будут по своей сути отдавать предпочтение рекламодателям и не учитывать нужды потребителей”, – писали предприниматели в 1998 году. И тем не менее в 2000 году они запустили Google AdWords – пилотный продукт компании для рекламодателей (сейчас он называется Google Ads). Забавно читать их критику сегодня, когда именно реклама обеспечивает подавляющую часть доходов компании – более 80 % в 2020 году. Поскольку алгоритм PageRank привел в поисковую систему Google миллиарды людей, компания также получила возможность отслеживать, что ищут пользователи, и таким образом продавать рекламодателям позиции в выдаче при определенных поисковых запросах. Как и результаты поиска, рекламные объявления, показываемые пользователю, тоже определяются алгоритмом. И эта реклама, построенная на поисковом алгоритме, сделала Google настоящим левиафаном.
К началу 2000-х годов наш цифровой опыт уже определялся алгоритмической фильтрацией. Сайт Amazon еще в 1998 году начал использовать совместную фильтрацию при рекомендациях товаров клиентам. Однако система компании не пыталась обнаруживать сходные профили пользователей, чтобы приблизительно оценивать вкусы, как это делала Ringo; она определяла товары, которые часто покупают вместе, – например, погремушка и детская бутылочка. Статья 2017 года, созданная одним из сотрудников Amazon, описывает подобные предложения на сайте:
На главной странице выделялись рекомендации, основанные на ваших прошлых покупках и просмотренных товарах… Корзина рекомендовала добавить другие товары – возможно, спонтанные покупки, которые делаются в последнюю минуту, а возможно, дополнения к тому, что вы уже рассматривали. По окончании заказа появлялись дополнительные рекомендации, предлагающие заказать товары позже.
Такие алгоритмические рекомендации напоминают полки, расположенные непосредственно перед кассой в супермаркетах, – последний стимул купить товары, которые могут вам пригодиться. Но в данном случае рекомендации подбирались индивидуально для каждого пользователя сайта, и в результате, как утверждала статья, получался “магазин для каждого покупателя”. Amazon обнаружила, что персонализированные рекомендации товаров гораздо эффективнее с точки зрения количества кликов и продаж, чем неперсонализированные методы маркетинга – например, реклама на баннерах и списки наиболее популярных товаров, которые нельзя нацелить столь же точно. Алгоритм рекомендаций продвигал бизнес и оказался удобен для покупателя, который получил возможность находить вещи, о необходимости которых даже не подозревал. (Прямо сейчас главная страница Amazon рекомендует мне мойку с аккумуляторным питанием и японскую сковороду для омлета.)
Первые подобные алгоритмы сортировали отдельные электронные письма, музыкантов (в отличие от конкретных песен), веб-страницы и коммерческие товары. По мере развития цифровых платформ рекомендательные системы переместились в более сложные области культуры и стали оперировать гораздо большими скоростями и объемами, обрабатывая миллионы твитов, фильмов, загруженных пользователями видеороликов и даже потенциальных партнеров на свиданиях. Фильтрация стала стандартным способом работы в интернете.
Эта история напоминает также о том, что рекомендательные системы – это не всезнающие сущности, а инструменты, созданные группами технических специалистов. Они могут ошибаться. Ник Сивер – социолог и профессор Университета Тафтса, изучающий рекомендательные системы. Его исследования посвящены человеческой стороне алгоритмов – тому, что думают об алгоритмических рекомендациях создающие их инженеры. В наших беседах Сивер всегда старался прояснить двусмысленную суть алгоритма, отделяя индивидуальное уравнение от корпоративных мотивов, лежащих в основе его разработки, и конечного воздействия на пользователя. “Алгоритм – это метонимическое обозначение для компаний в целом, – говорил он мне. – Алгоритма Фейсбука не существует; существует Фейсбук. Алгоритм – это способ рассказать о решениях Фейсбука”.
Речь здесь не о технологии – нельзя обвинять сам алгоритм в плохих рекомендациях, как нельзя обвинять мост в его инженерных недостатках. Чтобы огромные хранилища контента на цифровых платформах стали доступными, необходима определенная степень упорядочивания. Негативные аспекты Мира-фильтра, возможно, возникли потому, что технология применяется слишком широко, учитывая скорее интересы рекламодателей, нежели опыт пользователей. Рекомендации в том виде, в котором они сейчас существуют, больше не работают для нас; они вызывают у нас все большее отчуждение.
Мои первые значимые воспоминания о социальных сетях связаны с Фейсбуком, в котором я зарегистрировался после того, как поступил в колледж при Университете Тафтса. Дело было летом 2006 года, и в то время потенциальным пользователям требовался официальный адрес электронной почты в домене. edu, чтобы получить доступ к части платформы, которая относилась к колледжам. Тот первый вариант Фейсбука почти неузнаваем по сравнению с сегодняшней структурой. Аудитория строго ограничивалась; я использовал сеть в основном как средство связи с другими студентами университета. Если сегодня Фейсбук можно сравнить с лихорадочной трассой с выездами и заездами через каждые несколько секунд, то в нулевые годы он больше напоминал школьную комнату отдыха, где одновременно могли общаться лишь несколько человек. Вы создавали профиль, обновляли свой статус в нем, вступали в группы по общим интересам – но не более того.
Фейсбук стал едва ли не первым способом социального общения в интернете. Его предшественниками были Friendster и MySpace. Сервисы обмена сообщениями – Instant Messenger компании AOL и gChat компании Google – обеспечивали увлекательные способы общения с друзьями в режиме реального времени. К 2006 году я уже провел сотни часов на более старых форумах, где обсуждались видеоигры и музыка. Однако именно Фейсбук Цукерберга первым грамотно и последовательно связал онлайн-идентичность с офлайновым миром. Платформа поощряла пользователей использовать свои настоящие имена, а не таинственные псевдонимы, и влияла на реальные планы в маленьком мире колледжа: организацию вечеринок, планирование учебной деятельности и завязывание отношений. Тем самым она проложила путь к распространению социальной жизни в интернете для миллионов, а затем и миллиардов пользователей.
В сентябре 2006 года, вскоре после моего появления в Фейсбуке, там появилось одно из крупнейших нововведений – функция, которая определила его будущее в качестве онлайн-гипермаркета, торгующего всем подряд. Главным атрибутом платформы стала лента новостей, бегущий список обновлений, постов и оповещений. Ею нельзя было пренебречь – как только что построенным шоссе, прорезавшим тихую деревню. “Теперь всякий раз, когда вы входите в систему, вы получаете последние новости, связанные с активностью ваших друзей и социальных групп”, – сообщалось в официальном обновлении Фейсбука.
Патент на ленту новостей, поданный в том же году, но полученный только в 2012-м, описывал ее назначение: “Система и метод предоставляют динамически выбранный медиаконтент человеку, использующему электронное устройство в среде социальной сети”. Иными словами, лента новостей представляла собой поток информации, продиктованный алгоритмом, который определял, что именно показывать пользователю. В другом патенте была заявлена возможность “генерировать динамический контент, основанный на взаимоотношениях и персонализированный для участников социальной сети на веб-основе”. Сначала эта лента новостей представляла собой просто поток уведомлений об изменении статуса отношений и новых фотографий в профиле. Это не вызывало особых подозрений.
Более полное описание патентной заявки на ленту новостей говорит о системе совместной фильтрации, действующей в гораздо больших масштабах, нежели системы электронной почты 1990-х годов. Его стоит процитировать полностью, потому что оно предсказывает, во что превратится в следующем десятилетии большая часть онлайн-жизни (от социальных сетей до потоковой передачи данных и электронной торговли): множество автоматизированных лент, диктуемых в большей степени корпорациями, а не пользователями, которые постепенно формируют более пассивные отношения между пользователями и подачей контента.
Элементы медиаконтента выбираются для пользователя на основе его отношений с одним или несколькими другими пользователями. Эти отношения пользователя с другими пользователями отражаются в выбранном медиаконтенте и его формате. Элементам медиаконтента присваивается некоторый порядок (например, на основе их предполагаемой важности для пользователя), и именно в этом порядке их представляют пользователю. Пользователь может изменить порядок элементов медиаконтента. Взаимодействие пользователя с медиаконтентом, доступным в среде социальной сети, отслеживается, и это взаимодействие используется для выбора дополнительных элементов медиаконтента для пользователя.
Этот фрагмент содержит все элементы алгоритмической ленты – системы, которая прогнозирует относительную важность информации для конкретного пользователя, определяемую на основе наблюдения за контентом, который он просматривал в прошлом; затем система продвигает в начало списка тот контент, который, на ее взгляд, с максимальной вероятностью будет столь же интересен. Цель – отфильтровать контент, чтобы выбрать наиболее вовлекающий. Это побуждает пользователя потреблять больше информации и подписываться на большее количество аккаунтов в целом. Социальные сети обрели жизнеспособность, поскольку пользователи могли чаще пользоваться ими и дольше оставаться на сайтах. Если наши друзья не активны в Фейсбуке (у меня, например, как раз такой случай), то и мы, скорее всего, снизим свою активность.
Сначала ленту новостей упорядочивали исключительно в хронологическом порядке, и на первом месте находились самые свежие обновления; однако постепенно она стала подчиняться более алгоритмической логике. По мере развития Фейсбука и увеличения активности пользователей, которые добавляли все больше связей, переходя от личных отношений к публикациям и брендам, объем отдельных обновлений увеличивался. Со временем обычные заметки от друзей дополнились сообщениями от групп, ссылками на новости и объявлениями о распродажах. Обычные пользователи уже не могли рассчитывать, что им удастся следить за хронологической лентой при таком объеме и разнообразии сообщений, но даже если бы попытались, то их либо завалило бы информацией, либо они пропустили бы важное сообщение – что могло вызвать недовольство платформой. В конце концов масштаб и скорость потребления в Фейсбуке привели к тому, что агрессивная алгоритмическая фильтрация стала необходимой.
В 2009 году в Фейсбуке появилась кнопка Like в виде поднятого большого пальца; она стала показывать, насколько пользователю интересен тот или иной контент. Порядок в ленте определяла вовлеченность пользователей, измеряемая лайками, комментариями и предыдущими взаимодействиями аккаунтов между собой. Эта алгоритмическая система получила название EdgeRank, и Фейсбук определил ее основные параметры: совместимость, вес действий и время. Под действием понималось любая деятельность людей в Фейсбуке, которая затем отправляется в ленту новостей в виде фиксируемого обновления. Совместимость отражала степень связи пользователя с автором поста и силу этой связи (например, постоянное комментирование постов друзей). Комментарий оценивался выше, чем лайк, а недавние взаимодействия – выше, чем старые. Показатель веса оценивал различные категории взаимодействий: обновление у друга, разместившего новую фотографию, могло иметь больший вес для алгоритма, нежели размещение ссылки на новость или вступление в новую группу. Время отражало возраст действий: при прочих равных условиях недавние действия с большей вероятностью оказывались в верхней части ленты новостей, нежели старые. Показатель EdgeRank не оставался вечным, как результат баскетбольного матча в турнире; он постоянно менялся. И эти три категории – не просто отдельные, нейтральные единицы данных; это совокупность данных, упакованных и интерпретированных Фейсбуком особым образом.
Отследить эволюцию алгоритмической ленты Фейсбука сложно, поскольку она постоянно обновляется, а компания раскрывает подробности лишь время от времени. Все, что мы знаем о ней помимо официальных заявлений, сводится к журналистским расследованиям и опыту пользователей, которые ощущают эффекты обновленных алгоритмов задолго до того, как те становятся достоянием общественности. Когда меняется механизм подачи информации, знакомые веб-сайты могут начать восприниматься иначе. Например, вы обнаруживаете, что реже видите в Фейсбуке сообщения своих друзей и чаще – посты групп или компаний или что Инстаграм никогда не показывает в вашей ленте посты определенного друга, и вам приходится искать их с помощью поиска.