Le tribunal rejette les plaintes pour violation du droit d'auteur des auteurs contre OpenAI

  • Le tribunal rejette les plaintes des auteurs pour violation du droit d'auteur contre OpenAI.
  • Les plaintes alléguaient que OpenAI avait utilisé illégalement des livres pour former ses modèles d'IA.
  • La juge a statué en faveur d'OpenAI, rejetant les accusations de violations du DMCA et de droits d'auteur indirects, mais la plainte directe pour violation du droit d'auteur demeure.

Ces derniers mois, les ayants droit de tous acabits ont intenté des poursuites contre les entreprises qui développent des modèles d’IA.

La liste comprend des maisons de disques, des auteurs individuels, des artistes visuels et même le New York Times. Ces ayants droit s'opposent tous à l'utilisation présumée de leur œuvre sans compensation adéquate.

Plusieurs des poursuites intentées par des auteurs de livres incluent un élément de piratage. Les affaires allèguent que des entreprises technologiques, notamment Meta et OpenAI, ont utilisé l’ensemble de données controversé Books3 pour former leurs modèles.

Le tribunal rejette les plaintes pour violation du droit d'auteur des auteurs contre OpenAI

L'ensemble de données Books3 a été créé par le chercheur en IA Shawn Presser en 2020, qui a récupéré la bibliothèque du site « pirate » Bibliotik. La vision générale était que la collection de texte brut de plus de 195 000 livres, d’une taille de près de 37 Go, pourrait aider les passionnés d’IA à créer de meilleurs modèles.

La vision n'était pas fausse ; les grandes archives de textes constituent un excellent matériel de formation pour les grands modèles linguistiques, mais de nombreux auteurs désapprouvent que leurs œuvres soient utilisées de cette manière, sans autorisation ni compensation.

Les auteurs Sue, OpenAI répond

Dans une poursuite déposée en juin dernier, les auteurs Paul Tremblay et Mona Awad ont accusé OpenAI de violation directe et indirecte du droit d'auteur, entre autres. Peu de temps après, l'écrivaine et comédienne Sarah Silverman s'est associée aux auteurs Christopher Golden et Richard Kadrey dans un procès identique.

Les plaintes allèguent que les livres des auteurs proviennent de sites pirates. Ils mentionnent spécifiquement l'ensemble de données controversé Books3, ainsi que les données d'autres bibliothèques fantômes telles que LibGen, Z-Library et Sci-Hub.

« Les livres regroupés par ces sites Web ont également été disponibles en masse via des systèmes torrent. Ces bibliothèques fantômes manifestement illégales intéressent depuis longtemps la communauté de formation en IA… », ont écrit les auteurs.

OpenAI n'a pas nié directement ces allégations, mais n'est néanmoins pas d'accord sur le fait que l'utilisation de livres pour entraîner l'IA équivaut à une violation indirecte du droit d'auteur ou à des violations du DMCA.

Dans une requête en rejet, OpenAI a demandé au tribunal fédéral de Californie de « réduire » la portée de l'affaire. La seule allégation qui devrait pouvoir survivre est la violation directe du droit d'auteur, mais OpenAI a déclaré qu'il espérait y remédier à un stade ultérieur.

Le tribunal rejette les réclamations relatives aux droits d'auteur et au DMCA

la juge du district de Californie, Araceli Martínez-Olguín, a statué sur la question. Dans sa commande, elle se range largement du côté d’OpenAI.

La plainte pour violation indirecte du droit d'auteur échoue parce que le tribunal n'accepte pas que toutes les sorties produites par les modèles d'OpenAI puissent être considérées comme une œuvre dérivée. Pour survivre, la plainte pour contrefaçon doit être plus concrète.

« L'allégation des plaignants selon laquelle « chaque sortie des modèles de langage OpenAI est une œuvre dérivée contrefaite » est insuffisante. Les plaignants n’expliquent pas ce qu’impliquent les résultats ou prétendent qu’un résultat particulier est substantiellement similaire – ou similaire du tout – à leurs livres », indique l’ordonnance :

En plus de la violation du droit d'auteur, les auteurs ont accusé OpenAI d'avoir violé le DMCA en modifiant intentionnellement les informations de gestion des droits d'auteur (CMI). Des détails tels que le titre, l'auteur et le titulaire du droit d'auteur auraient été supprimés pour « permettre » ou « dissimuler » la violation.

Le juge Martínez-Olguín ne voit aucune preuve de la suppression intentionnelle de ces informations de droit d'auteur. Et même si ces allégations sont vraies, rien ne prouve que cela ait été fait pour des raisons néfastes.

« Les plaignants soutiennent que l'incapacité d'OpenAI à indiquer quels livres Internet elle utilise pour former ChatGPT montre qu'elle a sciemment permis la violation, car les utilisateurs de ChatGPT ne sauront pas si une sortie est en infraction.

« Cependant, les plaignants ne citent aucune jurisprudence suggérant que le fait de ne pas révéler de telles informations a une quelconque incidence sur la question de savoir si la suppression alléguée de CMI dans une base de données interne permettra sciemment une contrefaçon. »

Les auteurs ont en outre affirmé qu'OpenAI distribuait ses œuvres sans CMI, ce qui violerait également le DMCA. Cet argument échoue également, a statué le tribunal, car OpenAI ne distribuait pas d'exemplaires complets des livres.

« Plutôt, [the authors] ont allégué que « chaque sortie des modèles de langage OpenAI est une œuvre dérivée contrefaite » sans fournir aucune indication sur ce que ces sorties impliquent – ​​c’est-à-dire s’il s’agit de livres protégés par le droit d’auteur ou de copies de livres », indique l’ordonnance.

La plainte directe pour violation du droit d'auteur demeure

En plus de la violation indirecte du droit d'auteur et des violations du DMCA, le juge Martínez-Olguín a également rejeté les plaintes déposées par la loi californienne sur la concurrence déloyale (UCL) pour « pratique commerciale illégale », « conduite frauduleuse », « négligence » et « enrichissement sans cause ». La plainte de l'UCL pour « pratiques déloyales » peut être poursuivie.

Ce n'est pas la fin de la bataille juridique. Les auteurs ont la possibilité de déposer une plainte modifiée pour corriger toute lacune, s'ils souhaitent poursuivre les réclamations rejetées.

Enfin, il convient de réitérer que la plainte pour violation directe du droit d'auteur n'était pas couverte par la requête en rejet d'OpenAI, donc cela ira également de l'avant. Comme le feront de nombreuses autres poursuites en matière de droits d’auteur sur l’IA.

Une copie de l'ordonnance du juge de district de Californie Araceli Martínez-Olguín sur la requête en rejet est disponible ici (pdf).

De : TF, pour les dernières nouvelles sur les batailles en matière de droits d'auteur, le piratage et plus encore.