Некоторые слова освещают историю. Другие – дорогу в будущее. Давайте начнем с краткого обзора истории интернета и искусственного интеллекта.
Многие уже знакомы с историей возникновения интернета в общих чертах. Он появился в 60-х годах XX века в американской военной лаборатории. И начал использоваться для передачи и обмена информацией между некоторыми университетами и научно-исследовательскими институтами. В конце 1980-х группа ученых разработала концепцию создания Всемирной Паутины и протокол TCP\IP (Internet Transmission Control Protocol). Основным преимуществом протокола было то, что он позволял унифицировать стандарты компьютерных сетевых коммуникаций. Значит, появлялась возможность сделать интернет доступным во всем мире. Перед человечеством открывалась новая информационная магистраль.
Около 20 лет назад 23-летний юноша Марк Андерсон изобрел браузер Netscape. Это стало настоящей бомбой – перед бизнесом широко распахнулись двери в интернет-мир. Это заставило компанию Microsoft поволноваться. Они всерьез задумались о том, что их бизнес понесет серьезные убытки от интернет-нашествия. Открывались широкие возможности для нововведений и уничтожения монополий. Поэтому молодые люди из компании Sun уволились с работы и посвятили себя разработке нового языка общения, который бы смог взаимодействовать с разными операционными системами. Плодом их стараний стал Java – новый язык программирования. Он значительно ускорил создание интернет-продуктов.
В 1997 году я вернулся в Гонконг. Тогда ни в Пекине, ни в Шанхае нельзя было найти ни одного интернет-кафе. Тогда же Ин Хэй Вэй открыл Национальную службу доступа к сети, Чжан Сяо Лун написал программное обеспечение для электронной почты Foxmail, было создано Национальное информационное общество. Мир всеобщей паутины начал приобретать свои первые очертания. Но в мире технологий продолжали появляться все новые идеи, а тайные коммерческие войны входили в эпоху своего расцвета.
В то время я работал в American Search Engine Pioneer Infoseek, которая находилась на первой линии фронта. Я чувствовал атмосферу интернет-бизнеса и страсть американцев к новым технологиям и понимал, что мы столкнулись с очередной технологической революцией. Но готов ли к ней Китай? В книге «Кремниевая долина» 1998 года подробно описаны инновации, создаваемые гениями Кремниевой долины, и их борьба между собой. После того, как я закончил книгу в 1999 году, я вернулся в Пекин в отель, построенный компанией Baidu.
Напомню, что в ту увлекательную эпоху существовало три «сверхдержавы» в Интернете – Netscape, Sun, Microsoft. Все гадали – кто же выйдет победителем из этой битвы. Microsoft казался непобедимым. Он мог усвоить любые технологические новинки. Путь Netscape сопровождали взлеты и падения. В конечном итоге она была выкуплена американским беспроводным гигантом – провайдером Verizon. Позже в руки Verizon попала и компания Yahoo. Sun в 2001 году имела 50 000 сотрудников по всему миру. А ее рыночная стоимость превышала 200 млрд долл. США. Однако, когда лопнул мыльный интернет-пузырь, компания солнца мгновенно спикировала на самое дно. Через год, в 2009 году, ее выкупила корпорация Oracle.
На этом фоне ожидался быстрый подъем новых компаний – Apple и Google с мобильной операционной системой, как ответный удар по Microsoft.
Марк Андерсон – создатель браузера Netscape, которого я описал в начале «Кремниевой долины», был практически позабыт после пика популярности в 90-х. Но он не ушел со сцены. А стал отцом ветряной промышленности Кремниевой Долины.
Интернет-технологии продолжали набирать обороты. Раньше люди боролись за интернет. А сегодня с волнением начали замечать, что он все больше выходит за рамки ПК на мобильные устройства. Это совпало с незаметным подъемом «призрака». «Призрак» – это искусственный интеллект. А интернет – всего лишь одно из его тел.
История развития искусственного интеллекта предшествует интернету и сопровождается историей компьютеров. В 1956 году на конференции в Дартмуте на повестку дня был официально вынесен вопрос об искусственном интеллекте. В то время компьютер был размером с большой дом и обладал низкой вычислительной мощностью. Как вообще ученые осмелились вынести вопрос об ИИ на всеобщее обозрение?
Именно тогда Шеннон сформулировал три основных теоремы коммуникации. И тем самым заложил основу для компьютерных информационных технологий. Минский создал первый нейросетевой компьютер (он и его коллега моделировали сеть из 40 нейронов с 3000 вакуумными трубками и автоматическим индикатором на бомбардировщике B-24). А после этого написал статью на тему «Нейронные сети и модель мозга». Тогда она не произвела особого эффекта. Но позднее легла в основу концепции ИИ. Тьюринг в 1950 году представил уже известные читателю теории тестирования, а также различные концепции машинного и интенсивного обучения, генетического алгоритма.
Спустя два года после смерти Тьюринга на конференции в Дартмуте Маккарти официально представил концепцию искусственного интеллекта. Десять молодых ученых, принимавших участие в конференции, стали мировыми лидерами в области искусственного интеллекта. Но расцвет ИИ был недолгим. Все достижения ученых были похоронены результатами технологического развития.
Цель уже маячила впереди, но инфраструктура находилась в зачаточном состоянии. Искусственный интеллект сталкивался с двумя непреодолимыми барьерами. Первый – это логика алгоритмов или недостаточное развитие математических методов. Второй – недостаток аппаратных вычислительных мощностей. Например, типичная проблема – машинный перевод. Ученые день и ночь суммируют все известные правила грамматики, разрабатывают модели компьютерного языка, но машина все равно не может повысить точность перевода и выйти на удовлетворительный уровень.
Новые технологии и производственные цепочки не стали достоянием общественности. Не были изобретены захватывающие программные продукты. А государственные и бизнес-инвестиции были значительно сокращены. С середины 1970-х и до 1990-х гг. наблюдалось две волны всплеска интереса по отношению к разработкам и исследованиям, связанным с искусственным интеллектом. Но широкая аудитория оставалась в неведении. Внимание было сконцентрировано на развитии компьютера – фантастического интеллектуального инструмента.
Обыватели знакомились с искусственным интеллектом сквозь призму аркадных игр. В 1980-х в Китае на улицах появились первые игровые автоматы. Аркадные NPC (персонажи, которые не контролируются игроком) воспринимались как продукт ИИ, но легко проходились опытными игроками. Так сформировалось ошибочное представление: искусственный интеллект – то, что установлено на компьютере. Эта точка зрения никак не менялась до появления интернета и облачных вычислений.
В 2012 году я заметил, что в академических и прикладных областях науки произошли заметные прорывы в глубоком обучении. Например, использование метода глубокого обучения сделало возможным усовершенствование методов распознавания изображений. Я сразу понял, что мы стоим на пороге новой эры глобального поиска. Если до этого мы использовали только лишь текстовый поиск, то теперь возможными стали голосовой запрос и запрос по изображению. Например, если необходимо узнать, что за растение я вижу перед собой, то я фотографирую его и загружаю в поисковик. В течение нескольких секунд получаю его название – Flu Tong. С помощью текста сделать это было практически невозможно. Но усовершенствовался не только процесс поиска. Теперь стали возможны многие вещи, казавшиеся раньше нереальными. Распознавание речи, изображений, способность воссоздавать портрет пользователя – одни из базовых способностей человека. Как только компьютеры научатся делать то же самое, начнется новая технологическая революция. Стенографистов и переводчиков заменят машины и будут выполнять их работу лучше. В прошлое уйдут шоферы – автомобиль сможет ездить сам в разы безопаснее. В бизнесе появится умный помощник по работе с клиентами, который сможет удовлетворить все потребности и ответить на все вопросы. Искусственный интеллект даст людям новые возможности. Промышленная революция освободила людей от физической нагрузки. Теперь машины перемещают тяжести вместо нас и делают это в больших масштабах, чем было под силу человеку. Интеллектуальная революция будет решать другие вопросы. Следующие 20-50 лет мы будем свидетелями изменений и неожиданных сюрпризов. И это естественно.
Но интеллектуальная революция была бы невозможна без преданных своему делу первопроходцев. Стоит отдать им дань уважения.
После длительного периода застоя немногие ученые сохранили веру в идею искусственного интеллекта. Сейчас у Baidu есть большая и сильная исследовательская команда. Многие из ученых с 1990-х занимаются исследованиями в области машинного обучения или работают в крупных технологических компаниях. Сегодняшние достижения в области исследований ИИ – результат альтернативных подходов к работе над этой темой.
В 1990-х гг. немногие ученые, такие как Джеффри Хинтон и Майкл Джордан, настаивали на изучении машинного обучения. Ву Энда, бывший главный ученый Baidu, учился у Джордана в 90-е, а после преподавал теорию машинного обучения и даже организовал собственные онлайн-курсы. В настоящее время деканом научно-исследовательского института Baidu является Линь Юаньцин. Сю Вэй, один из выдающихся ученых корпорации, стал первым, кто предложил использовать нейронные сети для языковых моделей. Специалист по искусственному интеллекту, член американской инженерной академии, Владимир Вапник изобрел систему SVM (Support Vector Machine). Ян Лекун – лидер в области глубоких исследований, руководитель лаборатории искусственного интеллекта Facebook, изобрел специальную архитектуру сверточных нейронных сетей. А бывший директор лаборатории глубинного обучения Леон Батту является разработчиком ядра алгоритма глубинного градиента.
Исследования искусственного интеллекта прошли через несколько фаз. Первоначальные исследования ИИ основывались на правилах. Люди суммировали правила, введенные в компьютер, а сам компьютер этого сделать не мог. Следующий, более продвинутый подход основан на технологии машинного обучения. Он позволяет найти наиболее подходящие модели из больших объемов данных.
За два года развития искусственный интеллект смог поразить мир технологий. Он стал сублимированной версией технологии машинного обучения, основанной на многослойном нейросетевом компьютерном чипе. Благодаря многослойным микросхемам, которые имитируют соединение нейронов в человеческом мозге, в сочетании с усовершенствованным алгоритмом поощрения и наказания и возможностью переработки большого объема данных компьютер научился находить закономерности и вычленять модели из огромного количества информации. Это открыло новую эру в развитии интеллекта машин.
Немногие продолжали настаивать на разработке теории искусственного интеллекта, чтобы спасти уже проделанную работу. В Китае Baidu была одной из первых компаний по разработке ИИ. И, кажется, мы сделали то, о чем другие не могли даже мечтать. Шесть или семь лет назад я и Лу Цзи обсуждали прогресс, достигнутый в глубоком обучении. Мы сошлись во мнении, что готовы войти в эту сферу. В конце концов, в 2013 году я официально объявил о создании IDL (институт глубокого обучения). Он должен был стать первым институтом глубокого обучения в бизнес-сообществе. Я стал деканом не потому, что знаю больше, чем кто-либо другой. Для меня это своеобразный способ подчеркнуть степень своего внимания к предмету. А еще возможность отблагодарить тех ученых, которые не отступили в тяжелые годы.
Baidu никогда раньше не создавал научно-исследовательские институты. Наши инженеры были исследователями, а их работа всегда была тесно переплетена с практическим применением. Но я считаю, что глубокое обучение в будущем окажет огромное влияние на многие отрасли науки и жизни и шагнет далеко за пределы компетенции нашей компании. Поэтому необходимо создать специальное пространство для привлечения талантов, где бы они смогли свободно экспериментировать с инновациями, проводить исследования в неизвестных раньше областях и прокладывать путь искусственному интеллекту в жизнь человека.
Если назвать этап просветления искусственного интеллекта версией 1.0, то машинный перевод будет следующим – 2.0. Раньше методы машинного перевода основывались на наборе слов и правил. Люди постоянно суммировали грамматические правила, но это не помогло усовершенствовать перевод. С человеческим языком машины не справляются. Особенно, когда речь идет о переводе в контексте. Например, фраза «how old are you».
Позднее появился SMT (статистический машинный перевод). Его основная идея заключается в том, чтобы посредством статистического анализа выявить общие правила использования слова или словосочетания и попытаться избежать появления нелогичных фраз. SMT имеет основные функции машинного обучения – обучение и декодирование. Этап обучения позволяет компьютеру построить модель перевода с помощью статистических данных, а затем использовать ее для перевода. Этап декодирования использует расчетные параметры, чтобы получить наиболее подходящий результат от перевода.
Исследование SMT продолжается уже более 20 лет. Для фраз и коротких предложений уже достигнут значительный прогресс. Но перевод длинных предложений, особенно со сложных языков, вроде китайского или английского, все еще оставляет желать лучшего. До недавнего времени никто не задумывался о подходе NMT (переводе, основанном на нейронных сетях). В его основе – нейронная сеть с бесчисленным количеством узлов. Исходное предложение векторизуется и передается через средний слой сети компьютеру в виде выражения, понятного для него. Затем проходит сквозь многослойную операцию и переводится на другой язык.
При таком переводе объем данных должен быть огромным, иначе система окажется бесполезной. Поисковые системы, вроде Baidu или Google, могут собирать перевод из огромного количества человеческих высказываний в интернете. Только такие объемы данных способны прокормить NMT. Система сможет самостоятельно отладить механизм перевода. И результат будет лучше, чем при SMT. Особенно, если будет достаточно информации на языке перевода.
SMT использует локальную информацию. Фраза расчленяется на сегменты. Сегменты обрабатываются и переводятся. И только потом сшиваются вместе. NMT использует общую информацию. Система кодирует фразу полностью (как люди во время перевода сначала читают предложение целиком). А потом на основе закодированной информации генерирует перевод. За счет этого достигается более высокий уровень читаемости текста.
Например, один из важных аспектов в переводе – порядок слов. Китайцы размещают определения перед определяемым словом. А в английском определение находится после. Машины часто путают этот порядок. Преимущество NMT в его способности к обучению порядку слов в языке. Это обеспечивает плавность перевода в длинных предложениях.
Традиционные методы перевода не бесполезны. Каждый из них выполняет свою функцию. Например, при переводе идиом нельзя использовать дословный перевод. Они всегда имеют устойчивое значение. Потребности пользователей интернета разнообразны: перевод разговорного языка, резюме, новостей и прочего. Поэтому одним методом сложно удовлетворить все запросы. Baidu сочетает в себе сразу несколько традиционных методов перевода: перевод, основанный на грамматических правилах, на примерах, на статистике и на нейронных сетях.
В такой модели машинного перевода человек не ищет грамматические правила, а устанавливает математические модели и параметры, чтобы помочь компьютерной сети выявить правила самостоятельно. Когда человек вводит предложение и получает на выходе его перевод, он не думает, что происходит в середине цепочки. Это называется сквозным переводом. Этот удивительный подход называется байесовским, или скрытой марковской моделью. Для решения проблемы здесь используется теория вероятностей.
С помощью байесовского метода распределения информации можно построить модель личности по вероятностным характеристикам. Например, модель мужчины предполагает, что при чтении новостей он остановится на чтении статей, посвященных войне с вероятностью в 40 %. Женская модель – только 4 %. После того как читатель выберет военные новости, в соответствии с формулой Байеса (рис. 1-2), можно более точно рассчитать его пол и другие характеристики, используя другие поведенческие данные и комплексные расчеты. Это «волшебство» математики. Но, конечно, компьютерные нейронные сети используют не только математические методы.
Рис. 1-1. Байес и байесовская формула[2]
Метод использования искусственного интеллекта, подобный машинному переводу, предполагает использования огромных объемов информации. Интернет сейчас способен такие объемы предоставить. Раньше ученые только мечтали о них.
Интернет был создан для того, чтобы облегчить обмен информацией. В результате произошел информационный взрыв, который способствовал ускорению развития искусственного интеллекта.
В качестве доказательства приведу игру в шахматы. В 1952 году сир Сэмюэл написал программу для игры в шашки, чтобы повысить уровень собственного мастерства. Правила игры были относительно просты. И в этом отношении у компьютера было внушительное преимущество перед человеком. Но правила шахмат гораздо сложнее. Когда президент Baidu Чжан Яцин был директором института Microsoft, он пригласил на работу талантливого компьютерщика Сюй Фэн Сюна родом из Тайваня. Этот специалист во времена IBM (International Business Machines Corporation) разработал известного робота под названием «Шахматы втемную». В 1990-х гг. искусственный интеллект не представлял собой разновидность «Шахмат втемную». Его «мудрость» была заключена в суперкомпьютере (с использованием нескольких процессоров и параллельных вычислительных технологий), благодаря которому ИИ побеждал людей-шахматистов, а в 1997 году выиграл партию у Каспарова, чемпиона мира по шахматам. Вскоре после известной игры IBM отправила технологию «Шахматы втемную» в отставку. Чжан Яцин сказал Сюй Фэн Сюну: «Изобрети технологию для игры в Го, а потом найди меня и выиграй». Пока Чжан Яцин не покинул Microsoft, Сюй Фэн Сюн его так и не искал.
Технология «Шахматы втемную» сталкивается с некоторыми трудностями, которые на сегодняшний день не могут быть преодолены. Достичь прорыва в этом направлении так же сложно, как покорить Вселенную. Модель, которая опирается на алгоритм дерева решений, исчерпывает свои возможности и выходит за пределы пропускной способности компьютера. Алгоритм постоянно совершенствуется, но проблему в вычислениях решить пока не удается. У искусственного интеллекта есть все предпосылки для того, чтобы быть устойчивым перед лицом восточной мудрости. И новая эра уже не за горами.
Технология «Шахматы втемную» представляла собой модель искусственного интеллекта, но, кажется, не имела ничего общего с интернетом. Но развитие облачных вычислений и возможности управления большими объемами информации наконец-то объединили ИИ и интернет в одну устойчивую технологию, которая существенно отличается от «Шахмат втемную». Распределенные вычисления в сочетании с большими объемами информации и новым алгоритмом принятия решений демонстрируют успешное сочетание человеческого и машинного интеллекта.
В 2016-2017 годах AlphaGo (программа для игры в го) всколыхнула человечество. Процесс ведения игры AlphaGo отличается и от человеческого мышления, и от «Шахмат втемную». Проще говоря, механизм питается десятками миллионов человеческих шахматных партий. Выражаясь более профессионально, успеху AlphaGo способствовали алгоритм поиска Монте-Карло и механизм распознавания образов, основанные на глубоком обучении. Однако ни его предшественники, ни «Шахматы втемную» к технологии глубоко обучения отношения не имели.
Согласно исследованиям, AlphaGo не изобретает собственный механизм игры, а изучает десятки миллионов игроков (массивы данных). Он запоминает каждый ход, каждую игру из миллионов ситуаций и использует данные для обучения с помощью нейронной сети. Все это делается для того, чтобы иметь возможность предсказать, как мастер-человек сумеет выйти из той или иной ситуации. На практике компьютер анализирует текущую ситуацию и находит ее аналоги в прошлом. Затем ищет возможные варианты развития и выбирает несколько наиболее оптимальных. Таким образом, вместо того, чтобы пробовать все возможные варианты, он останавливается на наиболее выгодных. Тем самым сокращает объем вычислений. Система не истощается и получает защиту от поражения. Этот подход похож на человеческий. Мы не пробуем все подряд, а выбираем несколько вариантов, опираясь на опыт и чувства. Но после того, как сделаем свой выбор, мы все еще должны производить подсчеты и сравнения в поисках оптимального хода. Машина же передаст эти расчеты алгоритму поиска Монте-Карло.
Ниже я использую метафору. Она не точная, но достаточно понятная.
Поиск решения по методу Монте-Карло – это оптимизация предыдущего алгоритма дерева решений. Предыдущий алгоритм, даже если он предоставлял качественный вариант решения задачи, должен был быть единственным в каждой точке для того, чтобы выбрать следующую ветвь с бесконечным множеством менее рациональных вариантов решения.
Метод Монте-Карло основывается на тонкостях теории вероятности. Представим шахматную ситуацию, где сеть глубокого обучения дает три возможных варианта на ход – А, В, С. Три точки в качестве корневого узла можно представить, как три дерева, каждое из которых имеет бесконечное число ветвей. Метод Монте-Карло не проверяет каждую из ветвей, но отправляет три миллиона муравьев по одному на каждую ветвь, чтобы те быстро поднялись на верхушку дерева (то есть, чтобы они шли до тех пор, пока не доберутся до варианта, который обеспечит победу). Некоторые из них доберутся до победной точки. Предполагается, что все муравьи ищут наиболее эффективное решение, а не вариант, в котором партия завершится поражением.
Предположим, что из 1 миллиона муравьев, которые отправились по ветке А, только 300 тысяч дошли до победного конца. По ветке В – 500 тысяч. По ветке С – 400 тысяч. Система понимает, что вероятность победы на ветке В гораздо выше, и выбирает именно этот вариант хода. Таким образом, вероятностный метод значительно сокращает количество вычислений по сравнению с методом исчерпывания.
Почему мы отправляем именно 1 миллион муравьев для исследований, а не 100 тысяч или не 10 миллионов? Это зависит от вычислительной мощности компьютера и приблизительной оценки конкурентов. Если в данной ситуации, чтобы получить более высокий коэффициент выигрыша нам требуется только 100 тысяч муравьев, мы отправим 100 тысяч. Но чем больше муравьев отправляются на дерево в одно и то же время, тем выше требования к вычислительной мощности компьютера.
Чип процессора и графический процессор (GPU), нейронные сети и метод Монте-Карло создают возможности, которые не могут сравниться с человеческими. В результате глубокого обучения искусственный интеллект моделирует способности человека, которые аналогичны сумме способностей 10 миллионов шахматистов.
Умные читатели, даже не понимая математическую теорию, способны уловить механизм работы AlphaGo. Хотя алгоритмы и стратегии гораздо сложнее, чем описано выше. AlphaGo на своем примере демонстрирует уровень развития глубокого обучения и искусственного интеллекта. Но на самом деле, на сегодняшний день существует множество научно-исследовательских институтов и талантливых ученых, которые делают сверхъестественные вещи в данном направлении.
После того, как поведение человека начало фиксироваться в виде данных посредством интернета, у искусственного интеллекта появилось полноценная пища, чтобы идти в ногу с человечеством и помогать ему во всех сферах жизни. Машинный перевод, распознавание речи, изображений опираются на клики пользователей Интернета. Почему точность поисковой системы Baidu трудно сравнить с другими поисковыми системами? Потому что Baidu обладает самым большим объемом данных, самым продвинутым алгоритмом принятия решений и самой сильной командой. Каждый клик пользователя тренирует мозг Baidu и рассказывает о том, что человек хочет больше всего.
Когда искусственный интеллект переживал этап застоя, люди думали, что машина никогда не сможет думать так же, как человек. Но после 1990-х мы поняли, что машина и не должна думать так же, пока мы в состоянии сами решить свои проблемы. У лингвиста Хомского спросили: «Может ли машина думать?» Это был позаимствованный датским компьютерным ученым Дикстра риторический вопрос: «Будет ли подводная лодка плавать?» Ответ был такой: «Подводная лодка не плавает, как рыба или человек, но ее способности очень высоки».
Если мы оглянемся назад (не только на историю развития интернета), то поймем, что вся история развития промышленности – это шаги по направлению к развитию искусственного интеллекта. Кевин Келли отмечал, что самоприводящийся поршень парового двигателя уже представляет собой конструкцию, которая содержит элементы «эволюции». Стремление к автоматизации – эволюционная сила ИИ.
Когда началась промышленная революция, паровой двигатель появился в угольных шахтах и ямах. Эффективность двигателя пара была низкая, энергия, особенно при добыче угля, требовалась значительная, и спрос на дешевую рабочую силу сохранялся существенный. Дело в том, что при добыче угля использовалось много воды. А вода, в свою очередь, была топливом для парового двигателя. После того, как в шахтах впервые была применена новая технология, она постоянно продолжала совершенствоваться для содействия промышленной революции. С искусственным интеллектом то же самое: данные – это топливо для двигателя искусственного интеллекта, а когда ИИ получает достаточное количество данных, он может работать дальше.
Без накопления данных о деятельности человека компьютер не может стать объектом обучения. Это стало возможным благодаря развитию интернета и развитию методов сбора информации. А также благодаря исследователям ИИ, не все из которых являются учеными в сфере компьютерных технологий. Некоторые из них проводят биологические исследования, некоторые – инженерные. Некоторые изучают математику, архитектуру компьютерных чипов или автоматизированную итеративную оптимизацию компьютерных программ. Но однажды результаты изысканий сходятся в одной точке. И на этом месте рождается искусственный интеллект.
В 2016 году AlphaGo вызвала настоящую сенсацию в средствах массовой информации. Но, это была несколько запоздалая реакция. Гигант искусственного интеллекта Джефри Хинтон еще в 2007 году отмечал, что «вот-вот разразится буря».
В тот год один из студентов Хинтона с помощью Google Big Data применил исследования своего учителя к технологии распознавания речи и добился значительного успеха. Корифей ИИ только воскликнул: «Оказывается, моя неудача была вызвана исключительно отсутствием объема данных и необходимой вычислительной мощности!»
Искусственный интеллект уже готов войти во второе десятилетие XXI века. С 2015 года началась эра бизнес-конкуренции в сфере ИИ. По данным анализа сферы искусственного интеллекта, опубликованного инвестиционным агентством США CB Insights, объем инвестиций в ИИ превысил $1 млрд уже в первом квартале 2016 года, а за два квартала осуществлено 121 финансирование. За аналогичный период в 2011 произошло всего 21 вливание. Со второго квартала 2011 по второй квартал 2016 объем инвестиций превысил $7,5 млрд, 6 из которых поступили после 2014 года.
«Wuzhen Index: глобальный отчет о развитии искусственного интеллекта» демонстрирует, что в течение первых двух кварталов 2016 года в Китае число интеллектуальных предпринимательских компаний увеличилось более чем на 60. А объем инвестиций достиг $600 млн. В прошлом году Китай вложил 202 инвестиции в искусственный интеллект, что в общей сложности составляет $1 млрд (или около 6,8 млрд юаней). Рынок огромен.
Рис. 1-2. Количество и частота инвестиций в ИИ
Источник: www.cbinsights.com
В 2016 году вице-президент Китайской академии наук и вице-президент китайского общества искусственного интеллекта, академик Тан Тин Бин, отметил, что в 2015 году стоимость мирового рынка искусственного интеллекта составляла $127 млрд. В 2016, по прогнозам специалистов, она достигнет $165 млрд. А к 2018 перешагнет за отметку в $200 млрд.
Китай, Соединенные Штаты и Великобритания – три передовые страны в развитии ИИ. США – источник интернета и искусственного интеллекта. Они обладают уникальными талантами, сильной технической базой и огромным финансированием научных исследований, что делает их лидером в данной области. Помимо Google, Facebook, Microsoft, Amazon, IBM, Apple и других гигантов информационных технологий, в Америке сотни крупных и малых компаний, которые также специализируются на бизнесе ИИ. Например, компания X.AI провела три этапа финансирования, которые в совокупности достигают $3,400 млн. Великобритания продолжает традиции старой школы даже в условиях сокращения производства. Сейчас все таланты собрались в области искусственного интеллекта. Одним из примеров является компания Deep Mind, которая продолжает работу над AlphaGo.
Amazon запустила голосовой помощник Alexa и умную колонку Echo, конкурируя с Apple, Google и Microsoft в сфере голосового поиска. В июне 2016 президент Amazon в своем интервью с американским IT-блогером Уолтом Мосбергом подчеркнул, что инвестиции компании в течение 4 лет вливались только в ключевые проекты в сфере ИИ. «В команду Amazon, занятую в работе над ИИ проектами, входило свыше 1000 человек. И это всего лишь верхушка айсберга».
В сентябре 2016 года Microsoft объявила о создании новой бизнес-группы по разработке искусственного интеллекта под руководством вице-президента Гарри Шума. Он возглавляет тысячи компьютерных ученых и инженеров, которые интегрируют искусственный интеллект в продукты компании. Среди продуктов: Bing Search Engine (Bing), Xiao Na Digital Assistant и Robotics Project. В конце года Microsoft выпустила сервис, который способен развивать чат-ботов и объявила, что она будет предоставлять услуги процессора для открытой лаборатории искусственного интеллекта AI, соучредителя Сэма Альтмана, президента Elon Musk и инкубатора стартапа YCombinator.
Facebook также имеет свою собственную лабораторию искусственного интеллекта и команду, похожую на Google Brain, т. е. использующую технологии машинного обучения. Миссия организации состоит в том, чтобы продвигать технологии искусственного интеллекта в различных продуктах Facebook. По словам Майка Шропфера, главного технического директора компании, «в настоящее время около 1/5 инженеров используют технологию машинного обучения».
Владелец AlphaGo, Google, конечно, не будет довольствоваться игрой в шахматы. Его искусственный интеллект продолжает развиваться на протяжении многих лет. В 2012 году у Google было два проекта, основанных на технологии глубокого обучения. К концу 2016 года этот показатель превысил 1000. В настоящее время многие продукты Google, такие как поисковая система, операционная система Android, бесплатный сервис электронной почты Gmail, онлайн-переводчик, онлайн-карты, видеохостинг YouTube, имеют некоторые свойства глубокого обучения.
Китай имеет огромные возможности для развития IT-бизнеса, значительное количество пользователей, внушительный массив данных и большую группу талантливых специалистов. Это позволяет ускорить темп развития ИИ. BAT (Baidu, Alibaba, Tencent), Huawei и некоторые другие гиганты заняли далеко не все сферы искусственного интеллекта, где можно реализоваться компаниям. Поэтому малый, средний и крупный бизнес продолжают выходить на арену ИИ. В 2016 году на форумах, будь то электронная коммерция, социальные медиа или поисковые системы, руководители интернет-компаний переводят тему разговора на искусственный интеллект. Сообщают о больших и малых достижениях.
В 2016 году точность распознавания речи Baidu достигла 97 %. А точность распознавания лиц – 99,7 %. Облако Baidu Brain, платформы Tianji, Tianxiang, Tiangong и Tianzhi последовательно открыли технологии и возможности Baidu Brain для всего общества.
Более десяти лет назад немногие настаивали на развитии машинного обучения. Поэтому технология превратилась в настоящее сокровище. Но после всплеска интереса к сфере искусственного интеллекта самым дефицитным ресурсом стали талантливые специалисты.
Знания, на которые опирается развитие ИИ, имеют большое значение и для фундаментальных дисциплин науки, таких как математика и биология. Поэтому ученые, которые были бы одновременно сведущи в сфере искусственного интеллекта и в фундаментальных отраслях науки – большая редкость. В год выпускается чуть меньше 200 докторов и аспирантов, которые способны принять участие в национальных исследованиях или стартапах. Этого количества катастрофически не хватает. В 2015 году волнение в отрасли вызвала компания Uber, которая переманила 40 из 140 исследователей из Национального института робототехники Университета Карнеги-Меллона.
И это далеко не вся борьба за таланты. Практикующие специалисты более чувствительны к потоку академических кадров. За последние несколько лет из «башни слоновой кости» вышли многие академические звезды и прыгнули в прикладные исследования с парашютом. Они рисковали для того, чтобы простые люди могли заметить действительные изменения в сфере развития искусственного интеллекта. Но куда идти, чтобы в полной мере реализовать свои способности и не увязнуть в потоке, все еще остается проблемой.
Baidu является представителем китайской индустрии искусственного интеллекта. И большое количество талантов занимало или занимает достойное место в нашей команде. Ван Хайфэн работал в Baidu до перехода в Microsoft. Ву Энда появился в Baidu из Соединенных Штатов. Чжан Яцинь поменял Microsoft на Baidu. Линь Юаньцин, гигант в сфере искусственного интеллекта, занял должность директора лаборатории глубокого обучения Baidu по возвращении из Америки. Сегодня в компании есть необходимые талантливые специалисты, чтобы создавать собственные приложения с функциями ИИ. Baidu – это воплощение динамизма Китая в отношении привлечения и обучения ученых для работы в сфере искусственного интеллекта.
Множество сверхмощных человеческих мозгов сходятся в одном месте, чтобы создать один эпохальный китайский мозг для машины. Мы уже пережили эру ПК, эру мобильного интернета. Теперь на всех парах движемся к суперразумной эре взаимосвязи всех вещей. Слияние данных об окружающих нас предметах может в конце концов привести к развитию «Знания»[3]. Baidu двигается в этом направлении. Цель заключается в том, чтобы сделать искусственный разум таким же необходимым для людей, как вода или электричество. Это неизбежно спровоцирует повышенный интерес к развитию технологий. Например, Baidu имеет свои глаза, уши, рот и когнитивные навыки принятия решений. В целом, это искусственный эквивалент ребенка. Но некоторые способности, такие как перевод, распознавание речи, распознавание изображений, значительно превосходят способности ребенка. Мы открываем Baidu для людей, чтобы исследовать его возможности в различных приложениях с функциями ИИ. Baidu Brain уже сегодня стал инструментом для многих разработчиков операционных систем и способствует стандартизации формы искусственного разума. В новой эпохе нас ожидает полный спектр услуг для предприятий, предпринимателей и большинства индивидуальных пользователей.
Мы с энтузиазмом называем китайский мозг средством глубокого обучения серверов, алгоритмов, инфраструктуры приложений на уровне страны. Именно формирование китайского мозга станет олицетворением всестороннего повышения конкурентоспособности Китая и мощного ускорителя китайского возрождения.
Прежде чем начать разговор о данных, которые питают искусственный интеллект, я бы хотел остановиться на пользователях, бесчисленных потребителях, поддерживающих развитие Baidu и всего высокотехнологичного интернета.
Сегодня тенденция развития интернета и технологий сбора огромного количества информации подталкивает не только гигантов отрасли, таких как Google, Microsoft и BAT, но и малый и средний бизнес к наращиванию потенциала для того, чтобы решать проблемы в сложившейся ситуации.
Секрет успеха на самом деле прост: выясните, чего люди больше всего хотят, а затем дайте им это. Его успеху также способствовали сильные маркетинговые кампании и корпоративный имидж. Кейн сыграл здесь ключевую роль. Он ничего не знает о компьютерных технологиях. Но он от мозга костей – деловой человек, а его ноги глубоко укоренились в обществе. Центр мира – это потребитель. «Мы будем устами интернет-мира».
Цитата из книги «Кремниевая долина»
В книге «Кремниевая долина» я подчеркиваю важность каждого пользователя. В глазах инженеров потребитель – это один из элементов в технической документации, существование которого можно свести к одной формуле: потребности потребителя – развитие – обратная связь. Но интернет не только упрощает получение товаров и услуг, но и обеспечивает поле для обмена мыслями и эмоциями. Можно сказать, что интернет создает своего рода единое мнение пользователей.
Многие из наших инженеров и программистов наслаждаются свободой Baidu и полагаются на его простоту. Техник ясно мыслит, увлечен разработкой новых продуктов и общителен. Но люди с живыми эмоциями и мыслями не совсем соответствуют тому, как их видят инженеры. Вероятно, маленькие кусочки жизни каждого отдельного человека или сложные сделки в торговых центрах не будут ощущаться в наших лабораториях. Для того, чтобы лучше понять психологию пользователя, существует PR-отдел. Однако и они не всегда справляются с задачей и сталкиваются с проблемами, которые делают код уязвимым. Чтобы разобраться, как сломать барьер между техниками, бизнесменами и обычными пользователями, нам нужно сконцентрироваться на высоком уровне мышления продукта и скромном изучении трансграничного опыта.
Мысли о потребностях человека в повседневной жизни – непрерывная работа, которая требует настойчивости. Но если вернуться к теме книги, то мы, в конце концов, инженеры, и не забываем думать о том, как удовлетворять потребности пользователей с помощью технологий и цифр. Мы используем технологию разграничения данных для того, чтобы обслуживать разных пользователей.
Оцифровка – это тенденция, которая обсуждается в «Цифровом выживании», «Бесконтрольном» и «Чего хотят технологии» Кевина Келли. А также это то, что думают атланты современных технологий. Теперь помимо коммерческих, финансовых, сельскохозяйственных, военных и технологических данных, в нашем арсенале появились данные о жизни. Иногда дело доходит даже до того, что данные вызывают тревогу. Например, а что если личные данные будут проданы? Вкратце должны сказать, что данные в глазах искусственного интеллекта не носят личностной окраски. У него нет потребности запоминать ваши пароли и другие сведения в отличие от торговцев данными с низким уровнем образования. Искусственный интеллект сосредоточен на обнаружении общей «модели» из хаотичных действий, оптимизации производства и его обслуживания. Перевод, распознавание речи и распознавание изображений являются лучшими примерами прогресса. Эти данные, через алгоритм распознавания ИИ, будут иметь огромное значение для человечества. Например, от повседневного распознавания речи в борьбе с мошенничеством в сфере финансов до борьбы с терроризмом на национальном уровне.
Технология должна адаптироваться под пользователя, потому как продукт должен отвечать потребностям потребителя. Кажется, что хороший искусственный интеллект должен работать безмолвно и не может допускать скачки напряжения и мутность сведений. Но для того, чтобы улучшить технологии ИИ, нужно оптимизировать детали. Некоторые из них, например технология распознавания речи, работают неплохо, но метод ввода очень далек от того, чтобы называться удобным. Что не может не влиять на восприятие пользователя. Baidu в багаже опыта уже имеет примеры неудачно реализованных продуктов, которые должны быть изменены в соответствии с предпочтениями потребителей.
Данные и технологии не стоят на месте. Они постепенно очеловечиваются и начинают видоизменяться.
Многие интернет-пользователи были впечатлены изображением 1-2. Это Baidu карта с использованием технологии визуализации данных, которая наглядно демонстрирует линии миграции в Китае в начале 2014 года, когда в Дунгуане вышел запрет на порнографию и желтую прессу.
Старший редактор новостей сказал нам, что, рассматривая эту карту, он ощутил себя за пределами обычных новостей. И на мгновение приблизился к пониманию мира. Индекс миграции Baidu отражает перемещения людей с помощью технологии визуализации данных. Миграция людей в цифровую эпоху – это лишь небольшая страница в эпопее миграции людей за миллионы лет. Но эпоха огромных массивов информации тоже имеет свою первую историческую страницу.
Я бы сказал, что это тоже исторический момент в эпоху искусственного интеллекта. Это интеллектуальная картографическая технология для восприятия человеческой деятельности, человеческой судьбы. Искусственный интеллект сам по себе не является гуманным, но в сочетании с творческими идеями разработчиков, философией может обеспечить новую перспективу, даже другое человеческое отношение.
Компьютер и интернет – это тело искусственного интеллекта. А массивы данных или записи человеческой деятельности и человеческой природы могут наконец-то стать его «душой».
Один философ сказал, что человек – это существо «в постоянном пути». Baidu накапливает огромное количество картографических данных, дополненных мудростью создателя и различными сложными алгоритмами, которые изображают действия человека и демонстрируют его путь выживания.
Именно наше поколение слушает песню Дуна Ангера: «Ради жизни люди бегают, а их судьбы сплетаются. Я надеюсь, что благодаря искусственному интеллекту траектория движения человечества будет не просто пульсировать, но постоянно пересекаться. Она будет сливаться в одну полноводную реку и длиться бесконечно».
Молодой ученый из лаборатории больших данных Baidu в Принстоне по студенчеству изучал закономерности движения рыб. По возвращении домой он увидел карту миграции Baidu и заметил, что человеческие перемещения очень напоминают перемещения рыб. Изучение человеческих миграций даже более удобно за счет наличия масштабных данных и сведений. Так началась его работа в нашей компании. В 2016 году он и его коллеги использовали данные Baidu о миграции, чтобы предсказать падение продаж iPhone (Apple Phone). Подобный умный подход к анализу стал возможен за счет многочисленных данных, собираемых лабораторией, о разнообразии городской жизни и деятельности производственных предприятий.
В 2014 году Министерство транспорта предложило провести реформу. Было принято решение ускорить развитие программы «четырех перевозок» и строительства, ориентированного на рынок промышленности и научно-исследовательской отрасли. Это стало возможным благодаря технологическим инновациям, которые способны преобразовать научные достижения в производительность транспорта. Сейчас мы сосредоточены на создании многоканальной многорежимной системы и интегрированной платформы информационных услуг в сфере транспорта и путешествий. Она позволит мгновенно публиковать актуальную информацию и решит ряд вопросов человека, который отправляется в очередное путешествие.
В поддержку реформы Baidu выдвинул «интеллектуальный план платформы облачных услуг транспорта Китая». Планировалось совместно с Научно-исследовательским институтом автомобильных дорог Министерства транспорта и Национальным центром интеллектуальных транспортных систем инженерных технологий создать платформу для сотрудничества – эффективную систему обмена информационными ресурсами между провинциями, государственными предприятиями и другими членами общества.
Умная карта может измерить степень затора на дороге, анализируя скорость движения пользователя. И во избежание потери времени сконструировать маршрут объезда пробки. Это стало возможным благодаря использованию технологии виртуальной реальности. На основе данных и с помощью эффективного алгоритма принятия решений карта способна облегчить нагрузку на транспортную систему города и сократить работу для сектора управления дорожным движением.
Современные карты собирают всевозможные географические данные, что позволяет расширить число интеллектуальных проектов. Технология навигации высокой четкости достигает точности до сантиметра. И поэтому была задействована в разработке беспилотных автомобилей. В 2016 году на Всемирном интернет-конгрессе беспилотный автомобиль Baidu был публично протестирован и введен в эксплуатацию в городе Ву. Опыт проходил в условиях движения города. Машина проехала 3,16 километра, 3 светофора и несколько поворотов. Она не только не сталкивалась с людьми, которые перемещались в различных направлениях, но и учитывала погодные условия – дождь, туман, дымку. Полученный результат не уступает успехам коллег из Кремниевой долины, которые проводили подобные испытания в Северной Америке. В рамках разработки беспилотного автомобиля эти успехи незначительны. Но для развития искусственного интеллекта – это внушительный шаг вперед.
ИИ не упал с неба. Ему предшествовали десятилетия работы над компьютерными сетевыми технологиями и технологиями обработки данных, а также сбор необходимой информации о человеческой жизни и деятельности. Baidu Search и Baidu Maps являются материальным результатом процесса развития.
Сегодня в средствах массовой информации появляется множество новостей о роботах и масса шуток. Например, в недавнем выпуске новостей был сюжет о роботе, который ранит людей. На самом деле это был робот, который упал с платформы. Существует также мнение, что роботы – это игрушки. Но если взглянуть на ситуацию с точки зрения науки, обнаружится, что ИИ – не миф и не шутка. Он – результат человеческого труда. И он не нуждается ни в поклонении, ни в страхе.
Ученые в области искусственного интеллекта часто скромно описывают свои достижения. Ву Цзюнь, бывший инженер Google, рассказывал, что в 2003 году, когда он и его компаньоны работали над повышением точности вводимых ключевых слов в поисковике, основной проблемой стал подбор синонимов для удовлетворения запроса пользователя. Если компьютер не выдает необходимого результата при поиске информации, то человек будет продолжать подбирать ключевые слова. Но в этой ситуации пользователь фактически делает всю работу самостоятельно. Нужно было усовершенствовать технологию, чтобы ускорить процесс поиска и улучшить механизм обратной связи. Инженер сказал: «Может показаться, что у нас нет соответствующих технологий для решения проблемы. На протяжении многих лет пользователи сами подбирали ключевые слова для поиска. Но в 2003 году во время долгих выходных в честь Дня Независимости Соединенных Штатов мы приостановили работу одного из пяти крупнейших центров обработки данных. И за 4 дня сделали обработку каждого ключевого слова. По сути, это был метод исчерпывания. Мы выявили сочетания слов, которые часто использовались для того, чтобы сузить результат поиска. Теперь, когда поступает аналогичный запрос, система дает более точные результаты гораздо быстрее».
Чтобы идти в ногу со стратегией поиска, использующей метод исчерпывания, машинный перевод и другие области технической логики должны иметь сходства. В июне 2016 года на заседании бюро переводов Google активно обсуждалась статья в «Нью-Йорк Таймс», в которой сообщалось о результатах исследований в области машинного перевода, опубликованных Baidu. Высказывание Майка Шустера привело конференц-зал в чувство: «Да, Baidu выпустила новую статью. И такое чувство, что кто-то видит то, что происходит в наших стенах. Потому что все тезисы имеют аналогичную нашим структуру и результат». Баллы BLEU Baidu (оценка качества искуственного перевода в сравнении с человевеческим) в основном совпадали с результатами, достигнутыми Google во внутренних тестах в феврале и марте. Квок Вей Ле, ведущий исследователь Google, не был расстроен. Он пришел к выводу, что исследования двигаются в правильном направлении. «Их система очень похожа на нашу», – прошептал он.
Квок Вей Ле – докторант Ву Энда. И он, вероятно, не знает, что результаты исследований не имеют к профессору никакого отношения и совершенствование перевода осуществлялось независимо. Статья в «Нью-Йорк Таймс», конечно, не получила широкой огласки. Ву Энда считает, что и отечественные СМИ должны изменить свои привычки и перестать подсознательно считать, что новые технологии всегда являются продуктом более сильной зарубежной страны. На самом деле, многие ведущие открытия в области искусственного интеллекта китайцы делают первыми.
Baidu leading выпустила систему перевода на основе NMT. А спустя год, в 2016 году, Google последовал нашему примеру и выпустил аналогичную программу. Таким образом, основные технологии исследователей, которые находятся на передовых позициях в этой сфере, почти всегда одинаковы. Но отметьте, кто накопил и кто оптимизировал данные, чтобы выпустить стоящий продукт.
Сегодняшние идеи ИИ отличаются от прошлых в правилах мышления компьютера при работе с данными и стратегиями решений. В прошлом мы хотели создать идеальную логику для компьютеров, постоянно абстрагируя правила человеческой логики и внедряя их в машины. Сегодня искусственный интеллект основывается на базе данных и алгоритмах. То есть современные достижения ИИ опираются на интернет-достижения конца 1990-х. С интернетом у нас появились необходимые объемы информации. И обратите внимание, эти данные (имя, возраст, адрес, хобби и т. п.) пользователь вводит неосознанно. Они генерируются при использовании интернета. Каждый клик, каждый запрос, каждое перемещение порождают данные.
Китай уже является крупнейшей в мире производственной державой. Теперь нам необходимо расширить влияние «мягкой силы». Дух и культура – это «мягкая сила». Вычисления и данные – это также «мягкая сила». Когда «мягкая сила» накладывается на производственные мощности, рождается сила, называемая «умной». Это скажется на всех сферах нашей жизни.
У каждого предприятия своя стратегия и тактика. В 2013 году начало подъем отечественное интернет-предпринимательство. Множество бизнесменов вливают огромные средства в эту «бездонную яму», тем самым демонстрируя свою стратегическую храбрость. Baidu сфокусировался на долгосрочной научной стратегии. В то время не многие заметили, что наша компания занялась развитием искусственного интеллекта. А сегодня в мире ИИ часто отмечают твердость и целенаправленность стратегического планирования Baidu. Компания заранее оценивает природу информационной интернет-индустрии и неуклонно двигается вперед, не заботясь о мнении посторонних. Возникновение макета Baidu multipart – это прорыв в сфере искусственного интеллекта. Сейчас направлению ИИ в Китае уделяется большое внимание. Baidu находится на передовых позициях.
Вместо того, чтобы участвовать в развитии таких инструментов, как Go и Predictive Singer, мы сосредоточились на преобразовании искусственного интеллекта в практические средства, которые должны улучшить человеческую жизнь. Мы не только применяем глубокое обучение в таких областях, как распознавание речи, машинный перевод и распознавание номеров домов и улиц, но и успешно используем технологию для того, чтобы усовершенствовать пользовательский опыт.
В 2013 году мы выпустили в мир Baidu Navigator – первый китайский навигатор, доступный для обычных пользователей. Они могут использовать технологии позиционирования и решения от Baidu Maps, чтобы сэкономить значительное количество ресурсов в сравнении с традиционным GPS-трекером. Курьерская компания может использовать программу для планирования оптимального маршрута доставки. У разработчиков игр появилась возможность создавать такие игры, как PokemonGo. Мы открываем Baidu для того, чтобы люди могли использовать его глаза и уши в своих интересах. Мы открываем платформу глубокого обучения PaddlePaddle, чтобы больше людей могли создавать собственные сервисы с функциями ИИ. Мы хотим, чтобы самый неосведомленный в технических новинках и средствах человек научился использовать данные и оптимизировал свою работу, подчеркнул свою индивидуальность и продолжил двигаться к своим мечтам и идеалам.
Многие абитуриенты, кажется, используют приложения-ассистенты для того, чтобы помочь себе выбрать экзамены для поступления в колледж в соответствии с интересами. В Китае многие прибегают к этой технологии. В мои годы учебы люди называли вступительные экзамены «изнурительным мостом». Приложения-ассистенты с технологией глубокого обучения, подобно картографическим данным, реагируют на желания и тревоги кандидатов и стараются дать свой точный ответ. Здесь искусственный интеллект записывает не траекторию движения в физическом пространстве, а психическую траекторию роста студентов.
В начале 1990-х я отправился в Америку изучать компьютерные технологии. В то время многие молодые люди с желанием менять мир с помощью кода путешествовали между Китаем и США, как птицы. Сейчас было бы интересно взглянуть на карту этих трансокеанских перемещений. Теперь, когда ученые, занимающиеся развитием ИИ, вернулись на родину, я думаю, что пламя технологий будущего разгорится с новой силой. Потому что в Китае достаточно необходимого топлива. Огромное количество образованного населения, быстрое распространение компьютеров и мобильных устройств, большое количество данных дают Китаю уникальные преимущества в развитии и применении технологий глубокого обучения. С этими преимуществами мы можем создать легендарное войско исследователей по аналогу Кремниевой долины 90-х.
Baidu должен не просто создать передовую разработку в сфере ИИ. Но и обеспечить функциональную инфраструктуру для перемещения и обработки данных пользователей и платформу для развития технологии глубокого обучения. Мы должны стать сетью для сбора человеческой мудрости.
До того, как Трамп был избран президентом США, более ста человек из числа элиты Кремниевой долины опубликовали открытое письмо. В нем заявлялось, что избрание Трампа будет катастрофой для инноваций. Это затронуло бы и меня, если бы американские инновации действительно пострадали. Кто возьмет флаг, чтобы возглавить инновационное направление? Можем ли мы открыть инновационный центр мира Кремниевой долины для Китая?
Да, к нам стекаются таланты. Baidu основал лабораторию в Кремниевой долине, которая открыла нам доступ к американским талантам. План китайского мозга, предложенный Baidu, сопоставим с любым суперпроектом.
Вспомните, 70 лет тому назад ведущие ученые были полны решимости возвратиться из-за рубежа, чтобы реализовать в Китае грандиозный проект.
Конечно, следует отметить, что великий проект той эпохи опирался на Национальную инвестиционную и промышленную политику. После окончания «холодной войны» конкурентное давление в стране уменьшилось, а инвестиции в передовые технологии значительно сократились. Маск отправился на разработку ракеты, но на самом деле страна передала ему ракетные технологии и команду НАСА. В Китае решимость и правительственные инвестиции по-прежнему сильны. А развитие промышленности концентрируется на сфере искусственного интеллекта. Это лучшая и в то же время самая неопределенная эпоха. Искусственный интеллект – это способ приспособиться к неопределенности. Крупные и малые компании инвестируют в исследования и разработки в области ИИ, чтобы обеспечить конкуренцию и диверсификацию. Они, в свою очередь, должны спровоцировать рост и усиление сотрудничества.
Развитие искусственного интеллекта приведет к неопределенности. Доклад Белого дома уже обращает внимание на влияние искусственного интеллекта на занятость. Стремительное развитие Кремниевой долины в США и упадок Центрального обрабатывающего сектора усилили раскол в стране. Некоторые пользуются достижениями прогресса, другие – выброшены с передовых судов и потеряли направление. Для того, чтобы превратить Baidu в ковчег талантов, нужно мотивировать китайские предприятия к созданию этого ковчега. Важно осознавать, что мы вступаем в новую интеллектуальную эпоху.
Вице-президент Baidu, доктор Ван Хайфэн в ноябре 2016 года был избран членом ACL (Association for Computational Linguistics, International Computing linguistics Society). В настоящее время он является самым молодым членом Ассоциации. Комитет по отбору написал: «Господин Ван достиг выдающихся достижений в области машинного перевода, обработки естественного языка и поисковых технологий в академических и промышленных кругах. А также внес значительный вклад в развитие ACL в Азии». В начале 2017 года известные ученые и руководители в области искусственного интеллекта присоединились к Baidu. Это свидетельствует о тенденции к международной мобильности талантов. Сотни выдающихся ученых, работающих в области искусственного интеллекта в Китае, собираются вместе, чтобы строить будущее человечества.
Не так давно появление «бескассового супермаркета» Amazon спровоцировало взрыв в сфере шопинга, или процесса совершения покупок. За опытом Amazon виднеется всего лишь тень «ИИ-кассира». Сегодня обслуживание клиента человеком заменено онлайн-сервисом. Стенографический перевод – распознаванием голоса. Даже кассиры, водители, работники фабрик и юристы заменены искусственным интеллектом. Как люди выживают в этом мире? Как правительства и предприятия должны поддерживать работников? Как мы должны адаптировать экономические, социальные, экологические институты к эпохе ИИ? Мы должны прислушиваться к потребностям обычных людей. И это то, чему наша команда решила посвятить данную книгу.
В Кремниевой долине есть гирлянда с Питером Тилем, сделанная Марком Андерсоном. Он является основателем PayPal, хорошо разбирается в технологии глубокого обучения и часто заслуживает в свой адрес определение – «темная лошадка». В 2016 году он снова оказался в центре внимания за свое точное предсказание, что Трамп будет избран президентом США. В 2011 году он сказал: «Нам нужны летающие автомобили, а вместо этого у нас всего 140 символов». 140-символьный Twitter когда-то был очень веселым, но Питер Тиль ясно видел, чего не хватает. Он критиковал людей за замедление прогресса, за культуру хиппи, за инвестиции в компании со светлыми активами, но без четкого планирования и уверенности в завтрашнем дне. Большинство подобных компаний – мобильные интернет-компании, такие как Airbnb, Uber и т. д. Он считал, что бит-уровень интернет-эры человечества сделал значительный шаг вперед, а атомный уровень практически остановился в развитии. Поэтому он инвестировал в ракеты, препараты для борьбы с онкологией и в искусственный интеллект.
Я также считаю, что суета в интернет-предпринимательстве отдаляет от нас прогресс. Baidu, опираясь на свою долгосрочную стратегию, двигается в выбранном направлении, чтобы внести вклад в развитие человеческих способностей. Господин Тиль говорит, что американцы в начале XX века были готовы пробовать что-то новое и осмелились спланировать и реализовать план покорения Луны. Сейчас у человечества такого плана нет. Мы только всюду ищем добавленную стоимость и сиюминутное удовольствие. Baidu фантазирует об интеллектуальном мире и стремится реализовать его. Мы хотим, чтобы ИИ стал новой операционной системой не только для компьютера, но и для всего мира. При этом не закрываем глаза на все опасности и вызовы и заранее ищем их решения. В конечном итоге мы должны сделать мир другим. Потому что я сказал, что должен сделать это!
Интеллектуальная революция – это добродетельная революция в производстве и образе жизни. Революция в нашем образе мышления. Огромные возможности и проблемы уживаются вместе. Ниже мы рассмотрим все аспекты интеллектуальной революции. Подробно поговорим о визуальном распознавании, распознавании речи, обработке естественного языка и других прорывах, основанных на глубоком обучении. Рассмотрим возможности модернизации производства, беспилотные автомобили, финансовые инновации, интеллектуальную жизнь и многое другое. Мы изобразим предстоящее интеллектуальное общество. А потом вместе с читателями перейдем к обсуждению вопроса о том, как реагировать на развитие ИИ. И все это для того, чтобы ощутить пульс интеллектуальной революции.