С быстрым развитием генеративного ИИ возникла целая волна судебных разбирательств, касающихся грани между оригинальным контентом и материалами, созданными ИИ. Модели ИИ, такие как ChatGPT и Claude, становятся все более совершенными, и для их обучения требуется огромное количество данных, часто заимствованных из открытых источников. Это вызывает значительные опасения по поводу нарушения авторских прав, особенно когда такие модели обучаются на защищенных авторским правом произведениях. Недавнее судебное разбирательство с участием компании Anthropic, создателя модели Claude, продемонстрировало эти проблемы. И хотя исход дела выглядит в пользу Anthropic, решение суда содержит важные оговорки.

24 июня 2025 года судья федерального суда США Уильям Алсап вынес знаковое решение в пользу Anthropic, заявив, что использование законно приобретенных и оцифрованных книг для обучения ИИ, таких как Claude, подпадает под доктрину «добросовестного использования» в рамках авторского права США. Судья отметил важную разницу: обучение модели ИИ с использованием защищенных авторским правом текстов не является их копированием или распространением. Вместо этого это рассматривается как трансформация текста в форму знаний, что, по мнению суда, соответствует требованиям добросовестного использования.
Тем не менее суд не оправдал компанию по всем пунктам. Алсап подчеркнул, что компания все же несет ответственность за использование пиратских книг, скачанных с таких сайтов, как Book3 и LibGen. Судья ясно дал понять, что, даже если цель использования пиратского контента была трансформационной, пиратство не может быть оправдано как часть защиты добросовестного использования. Это решение открывает путь к отдельному судебному разбирательству, в ходе которого будет решаться, какие штрафы и компенсации Anthropic придется выплатить за использование незаконно полученных материалов.
В своем решении судья Алсап отметил, что трудно представить, что какая-либо сторона, обвиняемая в нарушении авторских прав, сможет доказать, что скачивание пиратских материалов с сайтов, которые можно было бы законно приобрести, было «разумно необходимо» для обучения ИИ. Это заявление создает потенциально важный прецедент для будущих дел, связанных с ИИ, и подчеркивает необходимость соблюдать авторские права, даже работая с такими трансформационными технологиями, как ИИ.
Это решение оставляет открытым важный юридический вопрос: как суды будут сбалансировать потребности разработчиков ИИ с защитой прав интеллектуальной собственности? Этот случай представляет собой ключевой момент для всей отрасли ИИ, поскольку он демонстрирует, что обучение на законных материалах допустимо, но использование пиратских данных будет караться. С развитием технологий ИИ это решение, вероятно, окажет большое влияние на будущее использование данных для машинного обучения.