Как искусственный интеллект помогает в работе функции "Привет, Siri"
Мы уже рассказывали о журнале компании Apple, в котором она публикует свои наработки в области искусственного интеллекта. В журнале уже есть несколько публикаций, и все они не слишком просты для понимания, если, конечно, вы сами не занимаетесь разработками в сфере машинного обучения. В новой публикации много сложностей, но есть и вещи, понятные обывателю. Она посвящена работе функции "Привет, Siri".
Публикация помогает понять, что происходит в вашем iPhone, когда вы говорите "Привет, Siri". Существует этап анализа звукового спектра, на котором звуковые волны преобразуются в кадры по 0,01 секунды. Около 20 таких кадров совмещаются с акустической моделью. DNN (Deep Neural Network) по каждому из звуковых кадров оценивает вероятность воспроизведения тех, которые используются при проговаривании фразы "Привет, Siri". Помимо этого класса кадров существует молчание и другая речь. Всего их около 20.
В сложных звуковых условиях работает система, которая упрощает запуск Siri, но предотвращает ложные срабатывания. Для срабатывания функции существует высший порог, низший порог и нормальный порог. Siri активируется лишь при достижении высшего порога. При понимании того, что событие случилось в нормальном пороге, система переключается на более чувствительный режим работы. Это позволяет пользователю активировать ассистента, сказав "Привет, Siri" повторно, не прикладывая больше усилий.
Описанный выше подход позволяет повысить удобство использования функции, но не увеличивает количество ложных срабатываний, так как система находится в такой настройке очень короткое время.
Кроме того, публикация объяснила, что функция "Привет, Siri" срабатывает на часах Apple Watch только тогда, когда сопроцессор движения определяет жест поднятия руки. В этот момент часы выполняют большую работу. Им необходимо отобразить всю информацию на экране. На распознавание фразы "Привет, Siri" отводится около 5 процентов вычислительной мощности.
Больше информации о работе функции "Привет, Siri" вы можете узнать, прочитав публикацию компании Apple.