Новости и события » Hi-Tech » «Если бы разработки были сравнимы с технологиями Google или Facebook, о них бы услышали»

«Если бы разработки были сравнимы с технологиями Google или Facebook, о них бы услышали»

«Если бы разработки были сравнимы с технологиями Google или Facebook, о них бы услышали»

Технологический журналист Стивен Леви побывал в офисе Apple и узнал, как компания работает над технологиями, о которых раньше практически никогда не рассказывала - над алгоритмами искусственного интеллекта и машинного обучения. Редакция выбрала наиболее интересные моменты из заметки.

Голосовой помощник Siri впервые появился в мобильных устройствах от Apple в 2011 году с выходом модели iPhone 4S. Изначально система была разработана независимой командой, которую корпорация выкупила в 2010 году вместе с созданной сотрудниками технологией. Siri, пишет Леви, сразу пришлась по вкусу пользователям iPhone, но вскоре выяснилось, что на роль полноценного помощника Siri претендовать не могла - технология слишком часто неверно интерпретировала различные команды, а выпущенные обновления не исправляли ситуацию.

В июле 2014 года команда Apple кардинально изменила алгоритмы Siri. Теперь работа помощника базируется на принципах нейронных сетей. Разработчики, замечает Леви, предпочли не изменять систему полностью, а оставить некоторые уже применявшиеся в Siri сценарии.

«Если вы помните, в работе Siri и раньше применялись скрытые марковские модели (разновидность статистической модели, которая используется для определения неизвестных параметров на основе текущих; одна из наиболее эффективных моделей для распознавания речи - прим. ред.), но теперь система использует и различные методы машинного обучения и распознавания речи - в том числе, набор алгоритмов глубинного обучения, сверточные нейронные сети, N-граммы ( модель, которую, например, используют в анализе естественного языка для определения последнего слова в последовательности на основе всех предыдущих - прим. ред.) и так далее».

Apple не стала публично рассказывать об изменениях - как отмечает Леви, крупные компании, и Apple в особенности, традиционно не освещают внутренние решения, которые могли бы раньше времени раскрыть конкурентам долгосрочные планы и стратегию организации.

«Заметить изменения могли только пользователи - лишь потому, что Siri стала совершать меньше ошибок. На самом же деле, по словам команды Apple, результаты внедрения новой системы оказались ошеломляющими», - пишет Стивен Леви.

По мнению автора заметки, самое удивительное в этой истории не то, какие изменения принесло внедрение нейронных сетей и алгоритмов машинного обучения, а то, насколько закрыто Apple провела всю работу. «Компания недавно приобрела несколько стартапов в области разработки искусственного интеллекта, и эксперты рассматривают корпорацию скорее как отстающего игрока этого рынка. Apple делала все так тихо, что они и не подозревали о разработках компании - а она вела их еще до того, как все заговорили о машинном обучении».

«Команда Apple не является частью сообщества исследователей и разработчиков подобных технологий. Apple - АНБ в области искусственного интеллекта», - говорит преподаватель истории искусственного интеллекта в Стэнфордском университете Джерри Каплан. «Эксперты полагали, что если бы разработки Apple оказались сравнимы с технологиями Google или Facebook, они бы все равно о них услышали», - продолжает Леви.

Владельцы iPhone сталкиваются с разработками Apple в области искусственного интеллекта не только при работе с голосовым помощником. В iOS 9 компания представила систему идентификации входящего звонка - она отображает на экране имя звонящего, даже если его нет в адресной книге владельца смартфона. Для определения имени используется система распознавания речи - она просматривает SMS, заметки и электронные письма пользователя и подыскивает подходящие варианты. Технологии искусственного интеллекта напоминают владельцам смартфонах о встречах, которые они забыли занести в календарь, и о месте, где припаркован автомобиль.

Стивену Леви удалось пообщаться с командой топ-менеджеров корпорации, в зону ответственности которых попадают технологии искусственного интеллекта. По их словам, алгоритмы машинного обучения уже применяется практически во всех продуктах и сервисах Apple.

Как замечают руководители компании, множество конкурентов Apple занимаются перечисленными проблемами - но ни одной компании не удалось одновременно работать над применением технологий искусственного интеллекта в настолько разных областях и при этом делать все настолько тихо и скрытно. «И, конечно же, никто из них не производит продукцию Apple».

Apple начала работать с технологиями искусственного интеллекта еще в 1990-е годы - тогда компания встроила алгоритмы машинного обучения в инструменты для распознавания рукописного текста. Эти же технологии компания применяет и до сих пор - например, для распознавания рукописного ввода на Apple Watch и для преобразования иероглифов в текст на латинице, рассказывает Леви.

Однако в последние пять лет это направление в компании переживает подъем. «Наши устройства постоянно становятся умнее, и все происходит настолько быстро. Для всех продуктов находятся какие-то причины, чтобы перевести их на технологии машинного обучения», - рассказывает Фил Шиллер, старший вице-президент по маркетингу Apple.

Руководители компании замечают, что алгоритмы искусственного интеллекта для них - хоть и инновационный, но все-таки такой же бизнес, как и все остальное. «Да, эти технологии трансформируют отрасль - но не сильнее, чем это сделали сенсорные экраны или, например, парадигма объектно-ориентированного программирования, - полагают они. - Алгоритмы машинного обучения - не последний рубеж в развитии технологий».

Никто из собеседников Леви, отмечает журналист, не хочет касаться темы опасности искусственного интеллекта. Руководители Apple также отказываются раскрывать, ведет ли команда работу над самоуправляемым автомобилем или собственным аналогом сервиса для просмотра фильмов и сериалов Netflix. «Что они ясно дают понять - Apple не ведет разработку Skynet», - пишет автор заметки.

Алгоритмы машинного обучения в устройствах от Apple работают через локализованный динамический кэш («база знаний») на каждом устройстве. Объем этого кэша, по словам руководителей компании, составляет около 200 МБ. В «базу знаний» поступает информация об использовании приложений, взаимодействиях с другими людьми, о предпочтениях и пристрастиях владельца смартфона. При этом, замечают топ-менеджеры Apple, все эти данные остаются закрытыми.

Сотрудники, принимающие участие в разработке технологий машинного обучения, работают по всей компании. «У нас нет централизованной системы разработки таких алгоритмов, вся Apple - храм машинного обучения. Нам нужно, чтобы команды, которым потребуются такие технологии, могли ими воспользоваться», - объясняет старший вице-президент по разработке ПО Крейг Федериги. Руководство не называет конкретное число сотрудников, работающих над улучшением технологии машинного обучения.

Подход Apple базируется на секретности: здесь скорее предпочтут взять на работу талантливого исследователя, который болеет за продукты компании, а не того, кто нацелен на публикацию собственных работ в научных журналах и на конференциях. «Если ученый совершит прорыв в своей области, пока будет заниматься улучшением нашего продукта - это, конечно, здорово. Но нами движет видение конечного результата», - говорит Эдди Кью.

Помимо найма специалистов, Apple приобретает уже сформировавшиеся команды в области искусственного интеллекта - и таким образом получает доступ к их работникам. «Мы не говорим себе: вот большой новый кусок исследований в области искусственного интеллекта, давайте попытаемся интегрировать его в наши продукты. Мы ищем талантливых людей, которые помогут нам создавать удивительный опыт», - говорит Федериги.

Вне зависимости от того, как именно сотрудник попал в корпорацию, инфраструктура и ресурсы Apple позволяют ему заняться тем, что раньше ему было недоступно. «У нас в Apple списку действительно крутых идей никогда не видно конца», - замечает Фил Шиллер. И, по его словам, алгоритмы машинного обучения только расширили возможности компании.

В качестве одного из примеров продукта, появление которого было бы невозможно до совершенствования технологий машинного обучения, - стилус Apple Pencil. При его разработке создатели устройства столкнулись с проблемой: во время работы со стилусом рука пользователя, придерживающая iPad Pro, непременно касалась бы экрана. Для того, чтобы различить касания руки и стилуса, в iPad Pro применяются алгоритмы машинного обучения. «Если вы довольны своим Apple Pencil - скажите спасибо этим технологиям».

Лучший способ осознать, насколько далеко Apple зашла в изучении технологий машинного обучения - взглянуть на развитие персонального ассистента Siri, пишет Стивен Леви. «Компанию Siri запустили несколько ученых, которые ранее работали на агентство DARPA и занимались там разработкой интеллектуальных помощников. Стив Джобс убедил основателей продать ему компанию в 2010 году, а уже в 2011 году технология была встроена в iPhone. Siri использует алгоритмы машинного обучения даже для распознавания сигнала "Эй, Siri" - технологии помогают смартфону постоянно "слушать" владельца, но не расходовать на это заряд батареи».

Технология Siri состоит из четырех основных компонент: распознавание речи (что говорит владелец), анализ естественного языка (какова цель его запроса), выполнение запроса и синтез речи. По словам руководства Apple, машинное обучение принимает участие в каждом из этапов обработки запроса.

Перевод Siri на нейронные сети начался с приходом в Apple в 2013 году эксперта по технологиям искусственного интеллекта Алекса Асеро и нескольких других специалистов. К тому времени Apple пользовалась лицензиями на сторонние технологии распознавания речи. Команда решила построить внутренние технологии и алгоритмы для реализации первой компоненты - по мнению руководства, это помогло бы обеспечить лучший пользовательский опыт.

Сотрудники начали разработку нейронной сети, которая могла бы заменить систему распознавания речи Siri. «Уже в 2014 году стало ясно, что все это ненапрасно. Частота появления ошибок распознавания сократилась в два раза во всех языках, на которых работала Siri, а для многих и более чем в два раза».

Инженерам компании пришлось разработать специальную прошивку для всех устройств Apple, работающих с Siri, - для достижения максимальной производительности нейронной сети. «Потребности команда разработки Siri повлияли даже на "железо" iPhone».

В ноябре 2014 года Siri начала использовать алгоритмы машинного обучения для второй компоненты - анализа естественного языка. Спустя год технология получила значительное обновление, и стала распознавать цель запроса еще точнее. В качестве примера Эдди Кью сначала произносит «Отправить Джейн $20 через Square Cash», а затем «Скинь 20 баксов моей жене». Результат обоих действий один и тот же - Siri открывает нужный сервис и заполняет его данными.

Команда Apple считает, что если бы не быстрое развитие Siri, компании не удалось бы выпустить новую версию Apple TV, которую от предыдущей отличает сложная система голосового управления. Сейчас же приставка Apple TV способна распознавать такие запросы, как «покажи мне хороший триллер с Томом Хэнксом».

Вместе с iOS 10, пишет Леви, обновление наконец получит и четвертая компонента работы Siri - технология синтеза речи. Новая технология тоже базируется на нейронной сети. Алгоритмы машинного обучения помогут сделать речь Siri более гладкой и «бесшовной» - такой, что пользователь не будет замечать переходы от одной записи речи к другой. Для пользователей это изменение окажется очень важным, полагают руководители корпорации - дело в том, что чем естественнее звучит речь собеседника, тем больше ему склонен доверять пользователь.

«Вероятно, самый большой вопрос, с которым придется столкнуться Apple - как развивать технологии машинного обучения, не раскрывая данные пользователей и придерживаясь заданной политики строгой конфиденциальности. Компания шифрует информацию, так что к ней не могут получить доступ даже сотрудники ФБР с ордером, и очень гордится тем, что не собирает данные в рекламных целях», - пишет Стивен Леви.

Топ-менеджеры Apple настаивают, что вполне возможно развернуть технологии машинного обучения, не загружая данные пользователей в «облако». «Однако возникает пара вопросов, - пишет Леви. - И один из них - как можно распознать поведение пользователя, не собирая о нем никаких данных?». Руководство Apple утверждает, что команда нашла способы сделать это. Все данные, которые хранит компания, остаются на устройстве пользователя, вычисления также проводятся на смартфоне.

Компания хранит резервные копии данных в «облаке», но частично - даже выгрузив их из облака, хакер ничего не получит. «Нет необходимости хранить персональную информацию покупателей на серверах Apple. Нам не нужно ничего о вас знать - ни о ваших привычках, ни о том, куда вы направляетесь прямо сейчас», - замечает Федериги. Кроме того, Apple стремится минимизировать и размер нужных для вычислений данных.

«Ясно, что технологии машинного обучения изменили продукты Apple, но непонятно, изменили ли они саму Apple. Кажется, что применение таких технологий несколько противоречит культуре и принципам компании. Apple тщательно контролирует все аспекты пользовательского опыта, все решения заранее определены. Машинное обучение же предполагает, что разработчик отходит в сторону и предоставляет право принимать решение алгоритму», - пишет Леви.

Федериги отмечает, что этот вопрос действительно провоцирует множество споров внутри Apple, но компания готова пойти на это ради повышения качества продуктов.

«Если бы разработки были сравнимы с технологиями Google или Facebook, о них бы услышали»

«Если бы разработки были сравнимы с технологиями Google или Facebook, о них бы услышали»

«Если бы разработки были сравнимы с технологиями Google или Facebook, о них бы услышали»

IPhone Netflix


Свежие новости Украины на сегодня и последние события в мире экономики и политики, культуры и спорта, технологий, здоровья, происшествий, авто и мото

Вверх