Пока технологические компании отчаянно конкурируют за передовые позиции в разработке инструментов ИИ, многие «обычные люди» стараются не замечать новшеств в надежде, что перемены не слишком сильно повлияют на их жизнь. Однако изменения в обществе в связи с развитием ИИ будут настолько всеобъемлющими, что избежать их воздействия не удастся никому. Мы живем в эпоху новой технологической революции, сравнимой с изобретением колеса, паровых машин, двигателя внутреннего сгорания или распространением интернета.
Изобретение ИИ – технологическая революция, которая уже сегодня меняет все аспекты жизни – от здравоохранения и транспорта до образования и производства. Она обещает повысить эффективность множества процессов, улучшить качество жизни и создать такие возможности для людей и бизнеса, о которых мы недавно даже не мечтали. Но одновременно она поднимает очень важные и отчасти болезненные вопросы о конфиденциальности, безопасности, неравенстве.
Эта революция имеет принципиальное отличие от всех прежних технологических прорывов: впервые в истории изобретение расширяет не физические, а интеллектуальные возможности человека.
Мы получили в свое распоряжение дополнительный интеллект. Еще в 1970-х футуролог Рой Амара сформулировал ключевой закон в области прогнозирования технологического развития: «Мы склонны переоценивать эффект технологии в краткосрочной перспективе и недооценивать в долгосрочной». Давайте же обсудим оба эти ракурса и попробуем понять, как устроен и на что способен ИИ, как он изменит наш мир и что делать, чтобы преуспеть в новой реальности.
Первые опыты по созданию инструментов искусственного интеллекта начались еще в 1950-х годах. Но долгое время ИИ оставался «игрушкой технарей», которая обещала гораздо больше, чем реально могла сделать. С распространением интернета и Big Data[2] ИИ вошел в нашу жизнь в виде улучшенных алгоритмов поиска, навигации, интернет-торговли и т. д. – но все эти изменения были связаны со статистической обработкой и прогнозированием на основе понятных, четко ограниченных алгоритмов.
Перелом наступил в ноябре 2022 года, когда появился Chat GPT- 3.5. Всего в течение месяца с момента появления Chat GPT- 3.5 успешно прошел как тест Тьюринга (пользователь не может определить, кто с ним общается – ИИ или человек), так и тест Лавлейс (пользователь не может определить, кто решил творческую задачу – ИИ или человек).
В отличие от предыдущих технологических революций, результаты которых распространялись довольно медленно, новое изобретение охватило планету в считаные недели. И чтобы начать использовать все преимущества ИИ, человечеству не понадобятся десятилетия, как это было с паровыми машинами, двигателем внутреннего сгорания, конвейерами и даже интернетом. Физическая база для успеха этой технологии уже есть в руке у каждого жителя развитых стран – это обычный смартфон. Кроме того, эта модель ИИ общается с человеком на его естественном языке. В невероятно короткие сроки новый ИИ стал самым быстро распространяющимся технологическим решением в истории человечества.
Бесплатный Chat GPT-3.5 всего за три месяца существования набрал свыше 100 млн пользователей.
По оценкам исследователей, паровые двигатели подняли эффективность производственных процессов на 18–22 %. Потенциальный эффект от внедрения инструментов ИИ составляет 20–80 % в различных областях человеческой деятельности.
Конечно, это вызывает растерянность у многих людей. Приведет ли новая технологическая революция к тому, что человек во многих сферах станет ненужным? Кто потеряет работу? Кто преуспеет в новой реальности? Чему и как мы должны учиться теперь?
Современные модели ИИ называют большими языковыми моделями (LLM, Large Language Models). В основе их работы лежит принцип трансформера, разработанный специалистами Google в 2017 году: ИИ присваивает словам и выражениям разный вес и сосредоточивается на наиболее значимых частях текста, чтобы облегчить понимание и создать более человечный ответ на запрос.
С технической точки зрения ChatGPT действует как очень сложный автозаполнитель, как в поисковике: ему дают начальный текст, который он продолжает на основе вероятностного анализа.
ИИ непрерывно обучается на огромном количестве текстов, оценивая их значимость и анализируя взаимосвязи между словами и их частями.
В версии ChatGPT конца 2023 года содержалось 175 млрд кодов, описывающих взаимные связи слов и частей слов. Важно, что эти коды не были заданы в ИИ изначально, он сгенерировал их сам в процессе работы.
Модели ИИ для обработки изображений обучаются на картинках, сопровождаемых соответствующими текстовыми подписями. Сопоставляя изображение с его описанием, модель учится ассоциировать слова с визуальными концепциями.
Модели ИИ, которые работают с текстами и с изображениями, называют мультимодальными.
Поначалу картинка может быть очень странной или искаженной – но за несколько итераций модель постепенно добивается большой реалистичности изображения. Чем глубже обучается модель, тем успешнее она превращает текстовые запросы в релевантные картинки.
Необходимость масштабного обучения делает производство ИИ очень дорогим и доступным ограниченному числу компаний.
Потребность в огромных объемах данных для обучения также обостряет вопросы авторского права и защиты информации. Как быть, если ИИ точно воспроизводит уникальный стиль художника или автора текстов? Что делать, если ИИ получил в свое распоряжение конфиденциальную информацию? Ответов на большинство этих вопросов у человечества пока нет.
Из всех стран мира пока только Япония уже приняла закон о том, что ИИ имеет право обучаться на любых данных, которые стали ему доступны.
Возникают также вопросы к этическим границам действий ИИ. ИИ безразлично, предлагать пользователю рецепт яичницы с беконом или рецепт взрывчатки, милую картинку или изображение сцен жесткого насилия. Но для человека эта разница огромна.
Чтобы скорректировать ответы ИИ с точки зрения этики и параллельно улучшить их релевантность запросам, модели ИИ проходят и вторую фазу обучения – так называемую тонкую настройку, в которой участвуют живые люди