РБК: правообладателей не устроил робот «Яндекса» для поиска пиратских ссылок
Компания пообещала доработать алгоритм.
По словам авторов, «Яндекс» прислал правообладателям файл с 3 млн URL-адресов. У части получателей он открылся в программе «Блокнот», а у части не открылся совсем. При этом данные не были рассортированы по принадлежности к тому или иному правообладателю.
Кроме того, один из правообладателей выборочно проверил тысячу ссылок и 67% оказались нерелевантными: на них не было видео или оно было легальным. При переходе по остальным ссылкам не оказалось контента данного правообладателя, и только две ссылки содержали пиратское видео.
По мнению собеседников издания, робот «Яндекса» был бы полезен, если бы не просто находил ссылки, но и анализировал их. Они добавляют, что для части компаний эту работу сейчас выполняет Group-IB.
«Яндекс» разработал робота по собственной инициативе в марте 2019 года. Программа ищет интернет-страницы, похожие на те, что уже попали в реестр сайтов с пиратским контентом. Для этого используются принципы машинного обучения.
В «Яндексе» заверили, что буду постоянно работать над увеличением точности инструмента. В частности, на днях разработчики улучшили разметку ссылок, что сделало объем новых выборок меньше и релевантнее.