«Переизбыток информации - пища для искусственного интеллекта»
28 апреля на Международной мобильной конференции MBLT16 в Москве выступила Нелл Уотсон - инженер-футурист и сооснователь QuantaCorp. Уотсон на простых примерах объяснила, почему именно сейчас происходит стремительное развитие искусственного интеллекта и как используются и обучаются нейронные сети.
Редакция публикует запись выступления и его конспект, который подготовила менеджер по маркетингу студии мобильной разработки e-Legion Александра Митрошина.
Я Нелл, я сейчас живу в Бельгии, но вообще я из Северной Ирландии. Я много лет работала с искусственным интеллектом и использовала его для коммерческих предприятий и opensource-проектов.
Мы видим, что в последние пару лет невероятно быстро и мощно развивается искусственный интеллект. Почему это происходит сейчас, а не на 10 лет раньше или позже? Чтобы ответить на этот вопрос, нужно подумать о развитии человеческого интеллекта. Мозг способен выполнять множество невероятных задач: от понимания речи до изучения собственного тела и исследования мира вокруг.
Говоря о человеческом мозге, мы думаем об однородной массе, о неком умном желе, но он состоит из нескольких частей, которые работают сообща, как оркестр на концерте. Части мозга развивались в разные периоды эволюции нашего вида, в нем есть разные функции. Грубо говоря, их можно представить в виде системы 1 и системы 2.
С системой 1 связано творчество и вещи, которые мы делаем не задумываясь, - танцуем, например. Если во время танца начать думать, ничего хорошего не выйдет. Система 2, напротив, состоит из правил, грамматики, математики - из того, на чем нужно концентрировать внимание. Оба способа видения мира необходимы для повседневной жизни, для развития цивилизации.
Система 1 отвечает за интуитивное, креативное восприятие - за то, как мы создаем и обновляем модель мира, как мы исследуем мир и понимаем его. Машины же, как принято считать, программируются, все они представляют систему 2 - то есть они не могут делать предположения о мире, исследовать его и создавать его модели, как мы.
Но это скоро изменится. Уже применяется структурное обучение, в котором мы предоставляем компьютеру некоторые данные и спрашиваем, например: «Что значат эти дорожные знаки?». Этот значит «стоп», этот - «уступи дорогу», и так далее. В узкой сфере применения такой способ обучения компьютеров может быть полезен, но он не очень гибок. Если машина встречает что-то странное или неоднозначное, она попадает в тупик.
Что это такое, это круг? Вроде того. Это задумывалось как круг? Может быть. Его кто-то нарисовал или это просто след от кружки с кофе? Люди могут ответить на эти вопросы, исходя из идей и догадок, но для машин это, как принято считать, невероятно сложно.
В решении таких спорных вопросов очень хороши нейронные сети. Наш мозг состоит из сетей нейронов, и нейронные сети не основываются на математически верных структурах системы 2. Они больше похожи на вот такую игрушку. Вы выбиваете шарик, он падает, и это происходит случайным образом.
Сценарий, в котором опускающийся шарик может пойти и по одному пути, и по другому, - это способ превратить упорядоченную, логическую и основанную на правилах систему машинного мышления (систему 2) в нечто, напоминающее человеческую интуицию и творческое начало. Это искусственная нейронная сеть. С ее помощью мы можем научить машины понимать мир так, как его понимаем мы.
Когда вы смотрите на других, ваш мозг очень быстро распознает определенные черты лица: форму и прочие очевидные особенности. Вы собираете из этих черт образ и на его основе можете решить, знаете вы человека или нет. Мы строим картинку, потом прикрепляем к ней некие атрибуты. Машины могут делать нечто подобное с помощью компьютерного зрения: выбрать наиболее очевидные черты, построить их слоями для создания образа. Искусственные нейронные сети можно использовать для распознавания животных - например, они могут различить кота и медведя.
Эти алгоритмы похожи на ребенка: они обучаются всему, что встречается им на пути. Мы пытаемся защитить детей от нежелательной информации, ведь они впитывают все, что видят, как губка. Как и в случае с детьми, чтобы обучить алгоритмы искусственного интеллекта, мы должны предоставить им материалы.
Facebook использует детские книжки, чтобы обучать свои алгоритмы искусственного интеллекта тому, как функционирует мир и общество людей, как строятся взаимоотношения, кто плохой, а кто хороший, где конфликт, а где его разрешение, и так далее. Поэтому мы можем воспринимать такие алгоритмы как нечто вроде сознания ребенка.
Чтобы работать, алгоритмам нужны данные. Поэтому между появлением алгоритма и появлением данных, которые могут сделать его полезным, есть значительный временной разрыв - около 15 лет или даже больше. Алгоритмы, которые сейчас используются для определения лиц или перевода речи, были разработаны еще 20?25 лет назад, но стали приносить пользу только недавно из-за появления данных.
Итак, откуда берутся эти данные?
Мы можем видеть, как выросло количество информации, которая производится, распространяется, обрабатывается и так далее. Мы видим, как сильно все изменилось за 20 лет. За всю историю человечества - с тех пор как мы привязывали камни к палкам и жили в пещерах, до 2000 года - наша цивилизация создала около 5 эксабайт информации. Это громадное количество данных, но оно вырабатывалось всю историю цивилизации. Такое же количество информации к 2010 году стало удваиваться каждые 10 часов. Сегодня оно удваивается чаще, чем раз в две минуты.
Данных так много, что мы в них тонем. Откуда они берутся? Только на YouTube каждую минуту выгружается 48 часов контента. Мы производим огромное количество информации, компьютеры вырабатывают огромное количество информации, и все эти данные могут быть отфильтрованы и использованы для обучения алгоритмов искусственного интеллекта. Именно поэтому в последние годы мы наблюдаем такой скачок в способностях и мощности искусственного интеллекта, и эта тенденция сохраняется.
Мы принимаем различные виды пакетов данных - от графических знаков и медицинских изображений до китайских иероглифов. Мы можем заставить машину понимать их, находить нужный контекст и распознавать, что происходит на картинке.
Эту картинку компьютер распознал так: «Мужчина работает с ноутбуком, пока его кот смотрит на экран». Сейчас машины создают новое видение мира на базе подобных данных. В скором времени они даже научатся предсказывать движение объекта - прямо как мы, когда прогнозируем, что произойдет дальше.
Мы живем в новой эпохе. В 19 веке мы провели в дома воду, сделали проще путешествия через океаны и долгие морские переправы. В 20 веке в наших домах появилось электричество, люди усовершенствовали использование топлива для личного транспорта. В 21 веке у нас из крана идут данные.
Данные встали в ряд с незаменимыми ресурсами, которые доступны каждому практически в любое время, и чем больше растет мощность алгоритмов, там больше применений мы можем найти данным. Это как с электричеством: когда оно появилось в домах, мы использовали его только для освещения, потом научились с его помощью обогревать дома, а теперь у нас сотни различных приспособлений и устройств, работающих от электричества. Что-то похожее мы сейчас наблюдаем с искусственным интеллектом.
Количество проектов Google с использованием искуственного интеллекта
Вы и сами уже пользуетесь искусственным интеллектом в сервисах Googlе. Вы можете загрузить фотографии в Google Photos, а программа сделает из них видео и рассортирует снимки по категориям благодаря функции распознавания объектов. А если вам понравилась люстра в Pinterest, сервис сможет подсказать, где такую приобрести.
Современный искусственный интеллект умеет не только играть в шахматы - он может наблюдать за игрой людей и обучиться игре на уровне мастера спорта международного класса всего за 72 часа. В Корее алгоритмы, разработанные Deepmind, выиграли человека в го со счетом 4:1.
Столь же продвинутые виды интеллекта сейчас используются для перевода в реальном времени. Действующая бета-версия, которая сейчас используется в Skype для выполнения перевода в прямом эфире в паре английский - испанский.
Итак, можно взять этот гигантский объем данных, в которых мы тонем, и сотворить из них знание. Дальше мы можем посмотреть, что делает с этим знанием человеческий разум, и сгенерировать опыт. Следующий уровень развития искусственного интеллекта - способность мыслить о будущем и творить, создавая нечто, чего раньше не существовало.
Посмотрите на алгоритм, который может создать историю на основе картинки. В данном случае алгоритм опирается на романтические рассказы.
«Это был мужчина без рубашки себе на уме, и у меня вырвалось ругательство, когда он наклонился, чтобы поцеловать меня в плечо. Он хотел придушить меня, думая, как бы мне пошли его шорты».
Еще пример: вы можете превратить простейший рисунок из Paint в прекрасную картину наподобие этой, используя машинные алгоритмы, базирующиеся на различных картинах. В Нидерландах была создана новая картина Рембрандта, которую сам Рембрандт не писал, но базируется она на технике, в которой выполнены все его существующие картины. Творческий подход, не так ли?
Компьютер также может помочь в восстановлении данных. Картинка слева довольно размытая, качество изображения низкое. Справа - ее восстановленная версия, улучшенная с помощью подобных алгоритмов.
Повторюсь, данных будет поступать все больше и больше. Машина может «воображать» текстуры для игры, которые больше не придется рисовать вручную.
Мы видели, как картинка может стать рассказом. Это работает и в обратную сторону: мы можем взять отрывок текста и превратить его в изображение. «Стильный бык стоит перед стеной из сена. Облачно. На земле яркая трава. На быке громадный гамбургер. За стеной огромная золотая курица».
Сейчас картинка выглядит немного по-детски, но система постоянно улучшается. Если правда хотите понять мощь этих технологий, взгляните на героя из Doom, «расшифрованного» искусственным интеллектом. С помощью алгоритмов даже очень «грубые» данные можно разогнать до большого разрешения.
Алгоритм Deepmind способен обучаться компьютерным играм. Сначала он играет плохо, но за 600 попыток развивается и разрабатывает новую стратегию. Вы можете решить, что это случайность, но нет, он знает, что делает. С этими технологиями можно не только играть в Atari - можно ориентироваться в сложном трехмерном пространстве. Теперь беспилотники могут воспринимать мир вокруг и летать по лесу, ничего не задевая.
У нас в Университете сингулярности сейчас продвигается стартап, в котором используются подобные технологии. Беспилотник как бы обстреливает землю саженцами в тех местах, где лес был вырублен, чтобы возместить нанесенный ущерб.
Еще один экземпляр «зеленого» робота - COTSBot, робот против морских звезд вида «терновый венец», который используется на побережье Австралии. Эти кружочки называются «вейвлеты Хаара», это техника машинного зрения. Робот плавает в океанских водах и убивает определенных морских звезд. Это паразитический вид, который вредит коралловым рифам, а робот самостоятельно их узнает и уничтожает. Роботы помогают нам улучшить мир, в котором мы живем.
Но роботы обманчивы. Вот пример робота, который пытается сделать нечто, что было разработано под человека. Видео снято на «олимпиаде роботов» DARPA Robot Challenge пару месяцев назад. Вы вот сейчас посмотрите и скажете: «Так себе!». Но вспомните, на что был способен самоуправляемый автомобиль шесть лет назад: не очень впечатляет. А что теперь? Tesla едет по шоссе, и какой-то идиот встревает прямо перед ней.
Искусственный интеллект обманчив. Вы смотрите и думаете: «Пройдут годы, пока это заработает!». Но вы и глазом не моргнете, как технологии поднимутся над уровнем человека. В этом весь смысл их революционности.
Следующая ступень - обучение роботов передвижению в нашем мире. У роботов есть «детский сад», где они учатся, прямо как маленькие дети. Роботы способны распознавать свои оболочки, тела, в которых они находятся, и учатся в них передвигаться. Они делают это либо физически, либо виртуально. В виртуальном мире процесс может протекать в тысячу раз быстрее, чем в жизни, поэтому там машины учатся очень быстро.
Опыт общения с искусственным интеллектом приводит к появлению таких вещей, как Watson - вопросно-ответный движок от IBM. Интеллект берется из «облака» и внедряется в любую оболочку. Возможно, скоро ваши дети будут задавать сложные философские вопросы не вам, а кукле Барби, а она будет всевозможными способами собирать информацию о людях.
Обувь, которая сейчас на мне, сделана в Индии и называется Lechal. В нее встроен компьютер, связанный с моим смартфоном по Bluetooth. Обувь помогает мне ориентироваться в городе, вибрирует на каждом углу: «налево», «направо» и так далее, в зависимости от проложенного маршрута.
Мы видим, как интеллект внедряется в устройства по всему миру, даже в самые простые. На что будет похож искусственный интеллект в ближайшем будущем? Это будет никакое не серверное хранилище - скорее планктон в океане. Множество микроскопических, «глупых» интеллектов, но каждый из них по-своему умен, и все они взаимодействуют как единая экосистема.
В ближайшие годы человек и машина окажутся в тандеме, основанном на совместной работе, - подобно тому, как взрослые присматривают за детьми. Это называется Cobotics: машины и люди работают как партнеры. Не только мы будем направлять машины - машины будут направлять нас. К примеру, Google Goals - приложение-календарь, которое помогает достичь поставленных перед собой целей (например, сходить в спортзал). Оно находит самое удобное для этого время и дает вам небольшой толчок в правильном направлении.
Сейчас машины учатся понимать человеческую природу, понимать наши ценности, наш характер. Возможно, уже скоро они будут знать нас лучше, чем мы сами. Но если машины станут консультировать нас в важных жизненных вопросах, станут понимать нас и работать с нами наравне, им нужно понимать нашу этику и мораль. Как и детей, их нужно научить морали, научить тому, что хорошо, а что плохо.
И машины уже испытывают с этим трудности. К примеру, телефонный робот, который «разговаривает» записями человеческого голоса, позвонит вам и на вопрос, робот ли он, скажет: «Нет, я не робот, я настоящий». Это происходит уже сейчас. Если мы выстраиваем человеческие отношения друг с другом, то можем добиться максимальной помощи в плане опосредованного общения и от машины, но мы должны привить машинам этику, чтобы можно было им доверять. Это способ донести радость общения с искусственным интеллектом до каждого человека.