Новости и события » Общество » Как работает распознавание речи в iOS 13.2

Как работает распознавание речи в iOS 13.2

Как работает распознавание речи в iOS 13.2

Несмотря на простоту и логичность iOS, иногда мы можем даже не подозревать о существовании в ней тех или иных функций, пока случайно на них не наткнемся. В таких ситуациях мы чаще всего верим, что открыли Америку, не подозревая о том, что Apple целенаправленно добавила в свою операционную систему найденный нами механизм для нашего же удобства. Чаще всего находка проявляет себя сама, но иногда для того, чтобы определить скрытое нововведение, может понадобиться нечто вроде лакмусовой бумажки, роль которой запросто может исполнить стороннее приложение.

Наверняка вы не знали, что в iOS 13.2 появилась поддержка API распознавания речи. Не то чтобы iOS раньше плохо распознавала речь, просто раньше для того, чтобы перевести речь в текст приложениям чаще всего требовалось подключение к интернету. Но благодаря новому пакету инструментов, появившихся в iOS с последним обновлением, теперь разработчики, которые интегрируют API в свои приложения, смогут существенно облегчить жизнь своим пользователям.

Как перевести речь в текст на iOS

Первым приложением, которое продемонстрировало работу нового API, стало Dictation от студии Blueshift. Оно работает без подключения к интернету и распознает речь в реальном времени на 13 языках мира. Русский среди них тоже есть, а вот других языков, на которых говорят в странах СНГ, нет. Однако это ограничение самого приложения, а не служб, которые Apple внедрила в iOS 13.2. Поэтому, если разработчики этого или любого другого софта с функцией распознавания речи с последующей транскрипцией, захотят, чтобы новые языки появились, ничто и никто, в том числе Apple, им не помешает.

На данный момент Dictation от Blueshift является первым в своем роде приложением, которое основывается на API Apple и умеет переводить речь в текст без подключения к интернету. Видимо, этим обусловлена его цена - разработчики хотят за доступ к возможностям своей программы 2 тысячи рублей в год, продавая его по подписке. Это довольно дорого, учитывая, что возможности Dictation ограничиваются только записью, транскрибированием и редактированием речи.

Зачем может понадобиться распознавание речи

Возможность транскрибировать свою речь без подключения к интернету может оказаться довольно полезной самому широкому кругу пользователей. Первое, что приходит на ум - запись лекций, которые затем не придется расшифровывать самостоятельно, потому что это можно поручить приложению. При этом неважно, будет интернет доступен во время записи или нет - расшифровка записанной речи произойдет в любом случае. А поскольку для этого ее не приходится отправлять на удаленный сервер, удается обеспечить сохранность конфиденциальных данных, потому что они не покидают пределов устройства, ведь все вычисления производятся в его памяти.

Скорее всего, вскоре разработчики распробуют преимущества нового API и начнут оснащать свои приложения его поддержкой. А раз так, наверняка цены, по которым они будут доступны в App Store, начнут падать, пока не достигнут сколь-нибудь приемлемых для большинства пользователей пределов. Но что еще более важное, - это проработка новых сценариев использования, в которых транскрипция голосовых заметок может пригодиться. Если разработчики найдут применение этой функции, она может появиться в большом количестве программ разной направленности - от текстовых редакторов до приложений для заметок.

Apple


Свежие новости Украины на сегодня и последние события в мире экономики и политики, культуры и спорта, технологий, здоровья, происшествий, авто и мото

Вверх