В США нейросеть научили искать объекты на изображении по голосовому описанию
Искусственный интеллект способен в доли секунды обнаружить требуемую область на картинке.
Технологии искусственного интеллекта сегодня активно развиваются и даже уже доступны в определенных пределах рядовому обывателю в мобильных устройствах. В то же время наиболее мощные и высокопроизводительные технологии по-прежнему находятся в ведении ученых, которые непосредственно занимаются разработкой таких систем.
К примеру, на днях стало известно, что в США изобрели нейросеть, которая умеет искать объекты на изображении по голосовому описанию. «Научили» ее этому ученые из Массачусетского технического университета (MIT). Алгоритм позволяет обнаружить или выбрать определенную область на картинке путем передачи компьютеру простой фразы без дополнительных уточнений.
Отмечается, что в основу технологии положена работа не одной, а сразу двух нейросетей. Первая занимается тем, что делит изображение на мелкие области, вторая обрабатывает голос оператора так, чтобы максимально точно понять, чего именно хочет человек.
Ранее мы писали, что ученые хотят создать автономного бесконтрольного робота. Исследователи пришли к выводу, что на сегодняшний день наука способна справиться с такой задачей.