Часть I. Преобразующие инновации: сила IDEAS

Глава 1. Интеллект

Больше человеческого, меньше искусственного

«Могут ли машины мыслить?»

Именно так Алан Тьюринг начал свою знаменитую статью «Вычислительные машины и разум», опубликованную в 1950 году[6]. С тех пор было много споров о «тесте Тьюринга»: может ли компьютер заставить нас поверить, что он человек? Сам Тьюринг никогда не утверждал, что компьютеры действительно способны думать. Однако это не помешало писателям-фантастам и простым обывателям представлять – обычно с ужасом – машины, наделенные человеческим сознанием.

Это не про нас.

Тотальное очеловечивание, которое мы сейчас наблюдаем в развитии искусственного интеллекта, заключается не в воспроизведении человеческого сознания. Речь идет о решении проблем путем использования самых мощных когнитивных характеристик человека, усиленных вычислительными мощностями современных компьютеров. Это ведет нас не к господству машин, а к появлению более полных, эффективных, доступных и инновационных средств для решения социальных проблем и задач, стоящих перед коммерческими компаниями.

«И малое дитя будет водить их»

[7]

Любой машине, управляемой искусственным интеллектом, очень далеко до той легкости и эффективности, с которой даже малые дети учатся, понимают и воспринимают контекст. Если вы случайно уроните карандаш и годовалый ребенок увидит, как вы тянетесь за ним, он подберет его и подаст. Бросьте его специально – и ребенок проигнорирует это[8]. Другими словами, даже груднички понимают, что у других людей есть намерения – выдающаяся когнитивная способность, которая, кажется, по умолчанию предустановлена в человеческий мозг.

Но это еще не все. С самого раннего возраста у детей развивается интуитивное «чувство физики»: они начинают предугадывать, что предметы будут двигаться по плавным траекториям, не исчезнут сами по себе, что без опоры они упадут и что с ними нельзя взаимодействовать на расстоянии. Еще не научившись говорить, малыши отличают одушевленных существ от неодушевленных предметов. По мере освоения языка они проявляют замечательную способность к обобщению на основе очень небольшого ряда: им достаточно одного-двух примеров, чтобы понять значение нового слова[9]. А еще дети самостоятельно, путем проб и ошибок, учатся ходить.

Искусственный интеллект может делать многое из того, что от природы наделенные разумом люди считают невозможным или трудновыполнимым. Например: обнаруживать закономерности в огромных массивах данных; побеждать величайших шахматистов и чемпионов игры в го; запускать сложные производственные процессы; эффективно обслуживать клиентов в чатах и кол-центрах; анализировать изменения погоды, состояние почвы и спутниковые снимки, чтобы помочь фермерам повысить урожайность; сканировать миллионы интернет-изображений для борьбы с эксплуатацией детей; выявлять финансовые мошенничества; прогнозировать запросы потребителей; персонализировать рекламу и многое другое.

Автоматизация таких задач выходит за рамки не только возможностей человека, но и традиционной логики процедурного программирования. Самое главное, что искусственный интеллект позволил людям и машинам дополнять друг друга, превращая механистические процессы в высокоадаптивные, органичные и ориентированные на человека виды деятельности. Вопреки опасениям противников автоматизации, такое сотрудничество создает множество новых высокооплачиваемых рабочих мест[10].

Неудивительно, что внедрение искусственного интеллекта стремительно набирает обороты во всех отраслях по всему земному шару. Согласно проведенному в 2019 году опросу, компании планировали в 2020 году удвоить число связанных с искусственным интеллектом проектов, а к 2022-му реализовать по 35 проектов в этой области или области машинного обучения[11]. Для сравнения: в 2019 году таких проектов было в среднем 14 на компанию.

Что ускоряет внедрение? В производстве используются новые модели искусственного интеллекта. Специализированное аппаратное обеспечение расширяет их возможности и помогает быстрее получать результаты обработки больших массивов данных. Упрощенные и меньшие по размеру инструменты позволяют ИИ работать практически на любом устройстве. Облачные сервисы обеспечивают доступ к ИИ-ресурсам из любой точки планеты и дают возможность масштабировать модели в соответствии с нуждами бизнеса.

Необходимость интегрировать данные из многих источников, решать сложные задачи бизнеса и компьютерной логики, а также конкуренция, заставляющая придавать данным более удобную для пользователей форму, ускоряют внедрение искусственного интеллекта. И конечно, оказалось очень велико влияние пандемии.

Наше недавнее исследование показало: более чем три четверти крупных компаний реализуют инициативы по глубокому обучению[12]. Глубокое обучение – это мощная подгруппа методов машинного обучения. В его основе лежат нейросети, состоящие из простых нейроноподобных блоков обработки данных, вместе выполняющих сложные вычисления. Работающий по этому принципу искусственный интеллект должен обучаться методом «снизу вверх» на огромном массиве данных и нередко для более тонкой настройки использовать дополнительные данные. Но этот «жадный до данных» подход имеет существенные ограничения – по мощности, доступности и устойчивости, как мы увидим в следующей главе.

Между тем на переднем крае исследований природа машинного интеллекта становится абсолютно человеческой – менее искусственной и более разумной, походящей не на беспилотный автомобиль, который нужно кропотливо тренировать, а на человеческого младенца, обладающего удивительно эффективной способностью к обучению.

Все это должно заставить топ-менеджеров задуматься о расходах на технологии в ближайшие три-пять лет. С одной стороны, стоящие перед глубоким обучением проблемы огромны и для многих компаний непреодолимы. С другой – глубокое обучение дало так много открытий и ценных результатов, что в ближайшее время оно не уйдет из практики. Согласно планам участвовавших в нашем опросе компаний, эти технологии из разряда необязательных перешли в необходимые.

Однако поиски искусственного интеллекта, наиболее близкого к человеческому, откладывались несколько десятилетий. Теперь же они обрели новую жизнь в попытках преодолеть ограничения нынешних подходов к интеллекту. Для высших руководителей это преодоление начинается с понимания имеющихся ограничений.

Проблема с интеллектом

Авторы MIT Technology Review проанализировали исследования в области искусственного интеллекта за последние 25 лет (а это 6625 научных работ) и пришли к выводу: глубокое обучение, доминировавшее в этой области последние десять лет, может пойти на спад[13]. Однако оно не исчезнет – останется мощным инструментом для решения некоторых узкоспециальных задач.

Оно будет важным элементом в широком спектре сложных методов, которые в машинном интеллекте склонят чашу весов в пользу человеческого, а не искусственного. Но идея, что глубокое обучение – если ему только дать достаточно времени и скормить достаточно данных – приведет нас к созданию всеобъемлющего искусственного интеллекта, выглядит все менее вероятной.


Многие системы искусственного интеллекта не так уж и умны

Начнем с того, что системы глубокого обучения по необъяснимым причинам часто заходят в тупик. Рассмотрим, как искусственный интеллект распознает объекты на изображениях, – в последнее время это один из самых успешных примеров его применения, хотя с 2017 года прогресс здесь незначительный.

Проект ImageNet, поддерживаемый Стэнфордским университетом, представляет собой общедоступную базу вручную аннотированных изображений из более чем 14 миллионов экземпляров более чем 20 тысяч категорий. Этот массив данных использовался для обучения многих знакомых нам инструментов для идентификации изображений – таких, как Bing от Microsoft, например.

Однако около 7500 реальных фотографий, собранных исследователями, сбивают с толку современные системы компьютерного зрения (так, бегущий юноша на фото был принят за одноколесный велосипед), и при использовании подобных изображений точность падает с 95 до 2 %[14]. То есть отдельные из самых мощных в мире систем компьютерного зрения правильно идентифицируют эти изображения только в двух случаях из ста. А когда на кону не просто корректная классификация, а подлинное распознавание объекта, как в случае с управляемыми искусственным интеллектом автомобилями или дронами, неудачи могут иметь фатальные последствия.


Проблема черного ящика и работа сложных систем

Системы искусственного интеллекта часто используют при принятии важных решений. Кому одобрят кредит? Кого возьмут на работу? Кто получит условно-досрочное освобождение? На какой срок человек попадет в тюрьму? Почему беспилотный автомобиль совершает опасный маневр? Каким именно образом реклама компании распространяется в социальных сетях? И так далее. Однако многие из этих систем (особенно те, которые используют глубокое обучение) непрозрачны.

Невозможно объяснить, как алгоритмы, работающие с огромным количеством параметров и множеством хитросплетенных уровней абстрагирования, делают те или иные выводы. А ведь они иногда могут обернуться катастрофой – приводить к расовой дискриминации в сфере кредитования и судебных решений по уголовным делам, к чудовищным ДТП или к тому, что онлайн-реклама уважаемых брендов появится рядом с неонацистским или конспирологическим контентом.

Стремление сделать искусственный интеллект объяснимым, законодательно закрепленное в Общем регламенте Европейского союза о защите данных, вызывает вопрос: объяснимым для кого? Трактовки ищут разные заинтересованные стороны. А трудности возникают даже при использовании относительно простой системы оценки кредитного риска[15].

Разработчики программного обеспечения и системные администраторы хотят получить разъяснение с точки зрения архитектуры и параметров обработки данных. Опытному кредитному специалисту, принимающему окончательное решение, возможно, понадобится информация о том, как система учитывала разные факторы, выдавая рекомендацию. Заявитель хочет понять, почему ему отказали: из-за возраста, расы, места проживания, плохой кредитной истории?

Регулятору важно быть уверенным, что система не нарушает конфиденциальности данных и антидискриминационных законов и что она неуязвима для финансовых мошенников. Неспециалист, размышляющий о проблеме черного ящика в целом, может захотеть узнать, зачем кому-то создавать машину, действий которой он не понимает.


Системы глубокого обучения не умеют читать

Мы можем собрать все книги мира в огромную базу данных с возможностью поиска (как в Google Books) и разработать программы машинного чтения, чтобы обнаружить все присутствующие виды взаимосвязей. Но ни одна из существующих систем искусственного интеллекта не может читать и понимать прочитанное даже на уровне маленького ребенка.

Исследователи Гэри Маркус и Эрнест Дэвис задали сервису Google Talk to Books простой вопрос: «Где Гарри Поттер встретил Гермиону Грейнджер?» Ни один из двадцати предложенных ответов не относился к книге «Гарри Поттер и философский камень» и ни в одном не содержалось информации, где же произошла встреча[16].

Смартфоны могут относительно хорошо исправлять опечатки или предлагать следующее слово в предложении. Программы-переводчики выдают вполне сносные переводы со многих языков. Но ни одно из этих приложений – как и никакие другие – не дает базовых знаний, чувства контекста и бесчисленных предположений о реальности, необходимых для понимания прочитанного.


Им не хватает базовых знаний

А именно: понимания пространства, времени и причинно-следственных связей – того, чему люди, подобно младенцу, достающему карандаш, научаются без видимых усилий[17].

Возьмем причинно-следственные связи – важнейший компонент рационального мышления. Во многом успех глубокого обучения был обусловлен мощной способностью находить корреляции, например между совокупностью симптомов и конкретным заболеванием. Но корреляция – это не причинно-следственная связь. Если бы машины понимали, что одно является следствием другого, их не нужно было бы переучивать под каждую новую задачу[18]. Вместо этого они могли бы применять свои знания из одной области к другим областям.

Будущее радикально человеческого интеллекта

Несмотря на достижения когнитивной психологии и нейронаук, мы так и не знаем, каким образом человеческий мозг с его очень ограниченными вычислительными ресурсами творит удивительные вещи. Нам в целом известно, что представляют собой некоторые из основных структурных блоков человеческого разума, и первопроходцы начинают создавать их машинные аналоги.

Авторы работы «Создание машин, которые учатся и думают как люди», основополагающей в этом новом направлении в развитии машинного интеллекта, считают: «До тех пор, пока естественный интеллект остается непревзойденным, реверсивный инжиниринг[19] человеческих решений для сложных вычислительных проблем будет продолжать информировать и развивать искусственный интеллект»[20].

Вопрос уровня топ-менеджеров: какие из описанных ниже когнитивных способностей, более похожих на человеческие, актуальны для создания ценности и предоставления ее клиентам в их бизнесе?

Обобщение в условиях реального мира

Пока теоретики яростно спорят о глубоком обучении и некой идеальной версии искусственного интеллекта, способной сделать его похожим на человеческий, практики действуют. Они используют все дисциплины ИИ как средство поиска новых перспектив, расширяющих возможности и увеличивающих производительность машин.

Рассмотрим в качестве примера грядущее поколение логистических и складских роботов, созданных по технологии, которая может оказать огромное влияние на деятельность и прибыль компаний во многих отраслях. В автоматизированных центрах обработки и выполнения заказов с многокилометровыми складскими стеллажами роботы выполняют большую часть тяжелой работы и начальные этапы комплектации.

Но автоматизированные системы сталкиваются с сотнями тысяч артикулов, которые часто меняются. А значит, либо эти системы должны быть разработаны для подбора определенной категории товаров, либо их придется обучать подбору каждого товара. Но тогда при добавлении новых товаров их необходимо будет вносить в систему вручную, что крайне нерационально.

Именно поэтому складские работники во многих отношениях превосходят нынешнее поколение роботов-сборщиков. Людей не нужно переучивать под каждый новый товар. Они могут обобщать свой опыт, легко отличать один объект от другого и быстро определять, как лучше обращаться с предметом, чтобы его не повредить. Но центры обработки заказов, нацеленные на доставку в тот же день или даже в течение часа, страдают от текучки кадров и ограничений в объеме и скорости работы, связанных с человеческими возможностями.

Немецкая компания Obeta, занимающаяся оптовыми продажами электроники, совместно с австрийской логистической компанией KNAPP AG запустила на своих складах новое поколение роботов-сборщиков, способных менять правила игры. От предыдущих поколений их отличает искусственный интеллект от Covariant – стартапа, основанного робототехниками из Калифорнийского университета в Беркли и исследовательской лаборатории Open AI.

Благодаря ИИ от Covariant роботы обучаются 3D-восприятию, пониманию физических возможностей объектов, планированию движения в реальном времени, а также методу «на раз-два-три»: освоению задачи в результате выполнения нескольких тренировочных примеров. Наличие общих способностей позволяет роботам быстро научиться манипулировать объектами без команд извне[21]. Задача роботов заключается в том, чтобы выбрать товары на оптовом складе и добавить их в индивидуальные заказы для отправки.

Один из посетителей штаб-квартиры Covariant описал технологию в действии: «Я наблюдал, как три разных робота мастерски собирают заказ из всевозможных товаров. За считаные секунды алгоритм анализирует положение предметов, рассчитывает угол атаки и последовательность движений, а затем вытягивает руку, чтобы захватить товар с помощью присоски. Он движется уверенно и точно, меняя скорость в зависимости от хрупкости покупки»[22].

В роботах используются готовый промышленный манипулятор, захват с присоской и система технического зрения. Система технического зрения соединена с захватом с помощью Covariant Brain – программной платформы, не зависящей от аппаратного обеспечения. Она призвана стать универсальным искусственным интеллектом для роботов в любой клиентской среде – единой нейросетью, способной адаптироваться к разнообразным условиям.

«Наша система делает выводы об объектах, которые никогда раньше не встречала. Видеть полную картину и понимать, как взаимодействовать с отдельными предметами, включая совершенно незнакомые, – это человеческая способность и это, по сути, общий интеллект, – говорит Питер Эббил, один из основателей компании. – Такое обобщенное понимание того, что находится в корзине, является ключом к успеху. В этом разница между традиционной системой, где вы заранее каталогизируете все товары и пытаетесь их распознать, и складами, где у вас много артикулов и постоянно появляются новые»[23].

Назвать эту систему гибридной вряд ли справедливо по отношению ко всем техникам, которые использовались для наделения ее способностью к обобщению. Covariant использует широкий спектр методов, включая имитационное обучение и обучение с подкреплением.

Например, чтобы обучить робота взаимодействовать с новым набором предметов, их раскладывают перед ним и смотрят, сумеет ли он правильно сориентироваться. В случае неудачи робот может обновить свое представление о том, что он видит, и попробовать другие подходы. Добиваясь успеха, он получает вознаграждающий сигнал, который подкрепляет обучение.

Когда набор артикулов совсем ни на что не похож, Covariant вынужден вернуться к обучению с учителем – сбору и маркировке большого количества новых обучающих данных, как в системах глубокого обучения.

Чтобы добиться успеха в коммерческой среде, роботы должны работать на очень высоком уровне. Ранее роботы-сборщики KNAPP надежно обрабатывали около 15 % объектов; теперь же, оснащенные технологией Covariant, они справляются с 95 % объектов[24]. За час робот собирает около 600 объектов, а человек – 450. И тем не менее в компании Obeta не сократили ни одного сотрудника.

По словам Питера Пухвайна, вице-президента по инновациям компании KNAPP, персонал прошел переподготовку, чтобы лучше разбираться в робототехнике и компьютерах[25]. Тем временем компания Covariant собирается развивать платформу Brain, чтобы использовать роботов в производстве, сельском хозяйстве, гостиничном бизнесе, на промышленных кухнях и в конечном счете в домах людей.

Выживает сильнейший алгоритм

Нерелевантные результаты поиска – вечная головная боль для интернет-магазинов вроде Zappos. Запросы могут иметь несколько разных значений для поисковой системы сайта, поэтому получить точные результаты порой непросто. Потенциальные клиенты, подбирающие туфли к платью определенного стиля и получающие платья вместо туфель, вскоре от этого устанут и перейдут к конкурентам. Чтобы решить эту проблему, Zappos сталкивает алгоритмы друг с другом в цифровой игре «Выживший».

Эти так называемые генетические алгоритмы, по сути, являются алгоритмами рандомизированного поиска, имитирующими механику естественного отбора. В этом процессе человек, наткнувшись на полезные результаты, использует их, – например, оптимизирует маршруты доставки или проектирует легкие, но прочные конструкции.

Генетические алгоритмы были впервые представлены в 1960 году Джоном Холландом, крупным ученым в области психологии, электротехники и информатики, но применять их стали лишь недавно: раньше не хватало вычислительных мощностей. Компания Zappos начала экспериментировать с генетическими алгоритмами в 2017 году.

В то время на сайте компании ежемесячно появлялось около миллиона уникальных поисковых запросов. Поисковая система должна была сопоставить эти запросы с более чем 100 000 позиций в каталоге[26]. Генетические алгоритмы моделируют процесс естественного отбора – по Дарвину. Система Zappos, например, создает алгоритмы, которые определяют смысл поисковой фразы.

Один алгоритм рассматривает в определенной фразе как сильный сигнал слово «платье». Конкурирующий алгоритм в этом же запросе уделяет больше внимания другим словам. «Тест на релевантность», имитирующий поведение пользователей, вознаграждает победителя и передает его черты следующему поколению. Алгоритм, который лучше всех справился с поставленной задачей, и начинает работать на сайте, пока его не заменят более эффективным. Таким образом, поисковая система постоянно совершенствуется.

Менее чем через год использования технологии генетических алгоритмов компания обнаружила, что клиенты быстрее совершают покупки и применяют меньше фильтров: покупателям не приходится постоянно переформулировать запросы для уточнения поиска. По словам Амина Казеруни, ведущего специалиста по обработке данных в Zappos, «в конце концов, это не постоянные расходы: подключил – и работает»[27].

Прогнозы все точнее

Люди регулярно и часто без особых усилий перебирают вероятности и, даже имея относительно небольшой опыт, действуют в соответствии с наиболее возможными из них. Сейчас специалисты обучают машины подражать рассуждениям с помощью вероятностных моделей, основанных на гауссовских процессах; такие модели позволяют действовать в условиях значительной неопределенности, работают с разреженными данными и обучаются на опыте.

Около десяти лет назад компания Alphabet, материнская компания Google, запустила в регионах мира, слабо охваченных интернетом, проект Loon. Это было сделано с помощью системы гигантских аэростатов, размещенных в стратосфере[28]. Их навигационные системы использовали гауссовские процессы для определения траектории оптимального движения среди разных слоев порывистых и изменчивых воздушных потоков. Каждый шар перемещался в воздушный поток нужного направления, таким образом из аэростатов формировалась большая коммуникационная сеть.

Воздушные шары могли не только делать достаточно точные прогнозы на основе прошлых полетов, но и анализировать новые данные прямо в воздухе, корректируя с их учетом свежие прогнозы.

Компания Alphabet завершила эксперимент в начале 2021 года, однако использование гауссовских процессов имеет большие перспективы. Стартап Secondmind разработал продукт Decision Engine, основанный на вероятностном моделировании с помощью гауссовских процессов. С помощью этой платформы японский автоконцерн Mazda смог улучшить настройку двигателя, используя в тысячу раз меньше данных, чем требуется обычным современным системам[29].

Некоторые эксперты считают, что использование гауссовских процессов для работы с небольшими объемами данных может ускорить создание автономного искусственного интеллекта. «Чтобы создать действительно независимое средство, нужно научить его очень быстро адаптироваться к меняющимся внешним условиям, – говорит Вишал Чатрат, генеральный директор стартапа Secondmind, занимающегося искусственным интеллектом. – То есть обучаться, эффективно используя данные»[30].

Гауссовские процессы не требуют огромного количества данных для распознавания закономерностей. Вычисления, необходимые для выводов и обучения, относительно просты, а если что-то пойдет не так, причину этого можно будет отследить, чего не скажешь о черных ящиках нейросетей.

Уже ближе к причинно-следственной связи

Искусственный интеллект хорошо умеет выявлять взаимосвязи и делать на их основе ценные прогнозы. Например, компания GNS Healthcare из Кембриджа, занимающаяся точной (персонализированной) медициной, использует алгоритмы причинно-следственных связей, чтобы помочь крупнейшим фармацевтическим компаниям мира понять не только кто именно из пациентов реагирует на те или иные препараты, но и почему.

Используя байесовские методы, их программная платформа переводит данные в каузальные (причинные) модели. Это позволяет определить, какие переменные в наборе данных оказывают максимальное влияние на другие переменные, улучшить качество проверки лекарственных препаратов, ускорить их апробацию и лучше спрогнозировать риски для пациентов.

В одном из исследований компания GNS совместно с Альянсом клинических испытаний в онкологии поставила задачу определить предикторы (прогностические параметры) для группы пациентов с метастатическим колоректальным раком (мКРР)[31]. Это один из самых распространенных видов рака в США: ежегодно диагностируется около 140 000 новых случаев.

В исследовании использовалась платформа на основе ИИ, учитывающего причинно-следственные связи; с ее помощью был проведен анализ клинических данных более чем 2000 пациентов с мКРР. Исследователи хотели выявить биомаркеры пациентов на разные лекарственные препараты и предикторы общей выживаемости среди определенных подгрупп пациентов.

«Мы никогда не были в лучшем положении, чтобы разгадать движущие силы заболевания и реакции пациентов на конкретные препараты, – говорит Колин Хилл, председатель совета директоров, генеральный директор и соучредитель GNS. – Мы создали компьютерную модель пациента с колоректальным раком и смогли обнаружить биомаркеры, показывающие, какие пациенты будут реагировать на то или иное лечение и, самое главное, почему. Именно это приведет нас к созданию персонализированной медицины и позволит искоренить болезнь»[32].

Завоевание пространства-времени

Ежедневно на YouTube загружается около 720 000 часов[33] видео, которое необходимо обработать для рекламных рейтингов и выдачи в рекомендациях пользователям. В медицинских учреждениях терабайты видеозаписей должны использоваться только на локальных устройствах, чтобы не нарушать конфиденциальность пациентов. В «умных» городах огромный объем записи камер видеонаблюдения иногда надо проанализировать очень быстро, чтобы предотвратить угрозу потенциально опасных или преступных действий.

Все эти задачи требуют точного и эффективного понимания происходящего на каждой конкретной видеозаписи. Но распознавание видео (в отличие от распознавания статичных изображений) требует временного моделирования – способности понимать и предугадывать последовательность действий. Как и другие разновидности искусственного интеллекта, основанные на глубоком обучении, видеоприложения обычно нуждаются в огромных и дорогих вычислительных мощностях, без которых просто не работают.

Однако недавно в лаборатории MIT-IBM Watson AI Lab разработали новую методику обучения систем распознавания видео, обеспечивающую высокую точность при сокращении вычислительных затрат[34]. Исследователям удалось обучить систему выдавать результат втрое быстрее, чем если бы они использовали другие современные методики.

Загрузка...