ChatGPT теперь умеет распознавать изображения и вести диалог голосом
OpenAI запускает голосовые и графические возможности чат-бота ChatGPT, что работает на базе большой языковой модели GPT. Об этом стартап сообщил в своем блоге.
Голосовой чат. ChatGPT и прежде можно было задавать вопросы голосом через мобильное приложение. Но теперь чат-бот обрел свой голос - точнее, сразу пять голосов на выбор.
Для создания голосов OpenAI работала с профессиональными актерами дубляжа, а в преобразовании речи в текст используется собственная технология Whisper.
Распознавание изображений. Текст и голос - не единственные формы общения с ChatGPT. Теперь чат-боту можно показать одно или несколько изображений. Например, чтобы просканировать содержимое холодильника и составить список рецептов из имеющихся продуктов. Или проанализировать сложный график и сделать выводы.
Для выделения определенного фрагмента изображения в мобильном приложении есть инструмент для рисования.
Новые возможности постепенно станут доступны для подписчиков тарифов Plus (19,99 USD в месяц) и Enterprise. Формат голосового чата работает только в приложениях ChatGPT для iOS и Android.