2023 : l'année de l'IA


2023 démarre avec la promesse de l’intelligence artificielle (IA) renforcée par les succès de ChatGPT pour générer des conversations de type humain, générer de l’art et de la musique, et même écrire du code de travail pour les développeurs. Pour la première fois, les développeurs doutent que leurs emplois puissent éventuellement être remplacés par l’IA. Bien que ce ne soit pas quelque chose qui inquiète cet auteur, la portée de ce qui est possible avec l’IA a augmenté à pas de géant au cours de la dernière année, et pour la première fois, de nombreuses questions sur la faisabilité économique de l’IA sont envisagées.

Ceci, à son tour, a fait émerger certaines des questions les plus banales mais critiques entourant la future économie alimentée par l’IA.

Les données sont tout

Premièrement, si vous êtes nouveau dans l’IA, la chose que vous devez comprendre est que la chose la plus importante à propos de la sophistication d’un modèle d’IA est qu’elle dépend uniquement de l’ensemble de données sur lequel il a été formé.

2023 : l'année de l'IA

Nulle part ailleurs n’est-il plus vrai l’adage séculaire du « poubelle ; ; poubelles. La formation d’une IA pour réussir à simuler l’intelligence ou la créativité dépend de la taille / de la propreté d’un ensemble de données sur lequel vous pouvez donner la « boîte noire » pour apprendre, et grâce aux 20 dernières années d’Internet et à l’avènement du « surpartage génération’ (et des gens comme Mark Zuckerberg qui a formé une génération d’humains à ce qu’il soit acceptable de donner vos données gratuitement). filtrer et conserver.

Les lois sur la confidentialité des informations personnelles sont arrivées en retard, et ce n’est que ces dernières années que les gens sont devenus plus conscients de ce qu’ils donnent gratuitement juste pour pouvoir utiliser les moteurs de recherche, les médias sociaux et les portails d’agrégation de contenu sur Internet.

donc si un chercheur en intelligence artificielle s’approche et souhaite acheter un ensemble de données, ce serait Facebook, WhatsApp, Flickr ou YouTube qui gagneraient de l’argent pour les ventes de données, pas les personnes qui ont réellement contribué aux données/contenu/images.

Cette structure est un prolongement du modèle « intermédiaire » d’Internet. Semblable à la façon dont votre FAI a toujours été votre fournisseur de services pour Internet, il a également été votre agent pour tout ce que vous voulez faire sur Internet, comme l’hébergement d’un site Web, l’exécution d’un serveur d’applications et la conservation de votre courrier électronique. Ce modèle intermédiaire fonctionne lorsque le fournisseur de services fournit uniquement un service pour vous, de la même manière que la compagnie d’électricité fournit de l’électricité à votre maison ou que la compagnie de gaz fournit du gaz pour votre cuisinière et vos chauffe-eau.

Cependant, avec les plateformes de médias sociaux et Internet en général, les fournisseurs de services ont franchi le Rubicon lorsqu’ils ont commencé à voler vos données à des fins lucratives. Au début, ils l’ont fait uniquement pour améliorer leurs plates-formes de services, par exemple, pour identifier les tendances, les modèles d’utilisation ou les préférences qui les aideraient à personnaliser votre expérience sur leur plate-forme. Mais bientôt, ils ont réalisé que les annonceurs et autres paieraient des millions de dollars pour accéder à ce trésor de données collectées – et le modèle actuel de monétisation d’Internet était né.

Il est responsable de la croissance explosive des plateformes de médias sociaux en général, dont le seul modèle est de capturer autant d’utilisateurs que possible sans rien facturer pour leurs services. Le coût caché, bien sûr, est que vos données, votre activité et vos « méta » informations sont exploitées et utilisées à leur guise.

En quoi est-ce pertinent pour l’IA ? Eh bien, parce que cela va augmenter considérablement cette demande du marché pour les métadonnées et le contenu des gens. Jusqu’à présent, les seuls acheteurs d’ensembles de données étaient des annonceurs et des éléments criminels occasionnels à la recherche de cibles potentielles pour les jeux d’escroquerie et le vol d’identité, mais avec l’IA vient la plus grande demande potentielle de données. Rappelez-vous que la qualité d’un modèle d’IA est une fonction directe de la qualité et de la taille de l’ensemble de données d’apprentissage. Donc, si vous pensez que l’IA va être de plus en plus utilisée en raison de son utilité potentiellement illimitée, alors la demande pour (voler) vos données va également monter en flèche.

Et vous n’en verrez pas un centime.

Propriété intellectuelle

Le revers de la médaille est que les lois existantes, telles que les lois sur le droit d’auteur et les droits de propriété intellectuelle (PI), ont peut-être déjà été violées en masse par l’IA. Il s’agit d’un nouveau problème, car les données sont utilisées pour générer des œuvres potentiellement dérivées, alors toute image ou œuvre protégée par le droit d’auteur dans un ensemble de données utilisé par une IA pour former ses modèles pourrait constituer une violation flagrante des lois qui protègent les droits des propriétaires de propriété intellectuelle..

Une action en justice intentée en Californie contre Stability.ai et MidJourney pour leur utilisation de l’ensemble de données d’images LAION-5B dans leur modèle StableDiffusion, qui génère de l’art, pourrait créer un précédent sur l’utilisation qui peut être considérée comme une utilisation équitable des œuvres protégées par le droit d’auteur, ce qui pourrait considérablement changer la façon dont les modèles d’IA peuvent acquérir leurs données, en fonction des résultats du procès. Les fournisseurs de l’ensemble de données LAION ne prétendent clairement affirmer aucune restriction quant à son utilisation, mais il indique également que les images contenues sont sous leur propre droit d’auteur, ne conférant ainsi aucune licence implicite pour l’utiliser en dehors de l’utilisation équitable.

ai/blog/laion-5b/

Si l’utilisation de ces ensembles de données protégés par le droit d’auteur pour produire une sortie d’IA est considérée comme une œuvre dérivée, alors les fournisseurs de modèles d’IA sont clairement en violation du droit d’auteur et pourraient être responsables de réclamations pour dommages massifs. Cependant, si l’œuvre produite était considérée comme un usage loyal ou transformatrice. alors elle serait claire. Malheureusement, cet auteur est d’avis que l’utilisation actuelle de StableDiffusion pour créer de l’art à l’aide d’un modèle d’IA entraîné sera probablement considérée comme des œuvres dérivées, mais je ne suis pas avocat.

Dans tous les cas, il semble y avoir un besoin croissant de technologies capables de mesurer, de signaler, de détecter et d’auditer lorsqu’une œuvre protégée par le droit d’auteur est utilisée dans un ensemble de données et, surtout, de permettre le paiement des frais de licence au titulaire du droit d’auteur de manière automatisée. L’ensemble de données LAION contient des MILLIARDS d’images et des centaines de téraoctets, et il serait totalement impossible de retrouver et de payer tous les détenteurs de droits d’auteur par des moyens traditionnels. Ce qu’il faut, c’est un moyen pour les propriétaires d’images d’intégrer certaines conditions et modalités de licence2 (métadonnées) dans les images afin que, lorsqu’elles sont publiées en ligne, toute personne copiant l’image et l’utilisant puisse payer par programmation les frais d’utilisation de la licence au propriétaire du contenu, en une manière dont leur paiement peut être prouvable et vérifiable.

Cela résoudrait le problème du droit d’auteur et, plus important encore, permettrait aux créateurs de contenu de tirer un revenu passif de leur contenu téléchargé et éliminerait l’intermédiaire (inefficace) des plateformes de médias sociaux dans la prochaine économie centrée sur les données.

Et c’est là que Bitcoin SV (BSV) et Bitcoin peuvent contribuer.

/

En vérité, ce n’est pas gratuit. Il utilise simplement le même modèle de monétisation de l’Internet actuel, c’est-à-dire qu’ils volent en échange de votre utilisation de leur service.

Si vous êtes un fan de ma chronique et de mes travaux, vous reconnaîtrez probablement cette ampoule qui vient de surgir au-dessus de votre tête comme « Cela ressemble à quelque chose qui se fait facilement sur BSV », et vous auriez raison.

Regarder  : Blockchain pour l’intégrité des données et la gestion des processus métier

width= »560″ height= »315″ frameborder= »0″ allowfullscreen= »allowfullscreen »>