Суд США полностью легализовал скрапинг сайтов и запретил ему технически препятствовать
Вчера Апелляционный суд 9-го округа США принял решение (pdf), что скрапинг публичных сайтов не противоречит закону CFAA (Computer Fraud and Abuse Act).
Это действительно важное решение. Суд не только легализовал эту практику, но запретил мешать конкурентам снимать информацию с вашего сайта в автоматическом режиме, если сайт является общедоступным. Суд подтвердил понятную логику, что заход бота-скрапера юридически не отличается от захода браузера. В обоих случаях "пользователь" запрашивает открытые данные - и что-то делает с ними на своей стороне.
Сейчас многие владельцы сайтов пытаются поставить технические препоны конкурентам, которые полностью копируют их информацию, не защищенную копирайтом. Например, цены на билеты, товарные лоты, открытые профили пользователей и т. д. Некоторые сайты считают эту информацию "своей", а скрапинг расценивают как "воровство". Юридически это не так, что теперь закреплено официально в США.
Решение принято в ходе судебного процесса LinkedIn (принадлежит Microsoft) против небольшой компании по анализу данных под названием hiQ Labs.
HiQ скрапила данные из общедоступных профилей пользователей LinkedIn, а затем использовала их для консалтинга работодателей, чьи сотрудники выкладывали свои резюме на сайте.
LinkedIn несколько лет терпела активность hiQ, но в 2017 году направила компании требование (cease-and-desist letter) прекратить автоматизированный сбор данных из профилей. Среди прочего, LinkedIn утверждала, что hiQ нарушает закон о компьютерном мошенничестве и злоупотреблениях (CFAA), главный американский закон против хакеров. Принятый более 30 лет назад, этот закон запрещает "доступ к компьютеру без авторизации или с превышением прав доступа".
Требование стало экзистенциальной угрозой для hiQ, поскольку веб-сайт LinkedIn - основной источник данных для hiQ. Аналитической фирме ничего не оставалось, кроме как подать в суд на LinkedIn. Она добивалась не только легализации скрапинга, но и запрета на технические препоны.
В 2017 году суд первой инстанции встал на сторону hiQ. Ответчик подал апелляцию, и вчера Апелляционный суд 9-го округа согласился с нижестоящим судом - он заявил, что закон о компьютерном мошенничестве и злоупотреблениях не применяется к информации, доступной для широкой общественности.
"CFAA принят для предотвращения преднамеренного вторжения на чужой компьютер - в частности, компьютерного взлома", - сказано в судебном решении. Суд отмечает, что участники процесса неоднократно проводили аналогии с физическими преступлениями, такими как взлом и проникновение. По мнению судей, это означает, что CFAA применяется только к информации или компьютерным системам, которые изначально закрыты для публики - обычно на это указывает требование авторизации на входе.
Вот соответствующий фрагмент судебного решения:
Суд отметил, что закон CFAA был изначально принят в 80-е годы специально для защиты определенных категорий компьютеров, содержащих военные, финансовые или другие конфиденциальные данные. Но когда закон распространили на большее количество компьютеров в 1996 году, в докладе Сената говорилось, что его целью является "повышение конфиденциальности". Другими словами, его целью является защита именно частной, приватной информации.
HiQ забирает информацию только из общедоступных профилей LinkedIn. По определению, любой представитель общественности имеет право доступа к этой информации.
Самое главное, что апелляционный суд также поддержал постановление суда низшей инстанции, которое запрещает LinkedIn вмешиваться в деятельность hiQ по скрапингу ее сайта. Это принципиально меняет баланс сил в рассмотрении подобных дел в будущем.
Возможно, это специфика американского законодательства. В данном случае hiQ утверждала, что технические меры LinkedIn по блокировке скрапинга мешают контрактам hiQ с собственными клиентами, которые полагаются на эти данные. На юридическом жаргоне это называется "злостным вмешательством в контракт" (tortious interference with contract), что запрещено американским законодательством.