Vue lecture

OpenAI, entre de nouvelles plaintes et un accord de licence avec le Financial Times

ActuIA

Par : Marie-Claude Benoit

2 mai 2024 à 14:00

Si la semaine a débuté avec l’annonce d’un accord de licence avec le Financial Times lui permettant d’exploiter son contenu, OpenAI a été de nouveau la cible de nouvelles plaintes. Lundi, l’association autrichienne NOYB (None Of Your Business) a ainsi demandé une enquête sur le traitement des données personnelles et des mesures pour assurer sa conformité avec le RGPD. Le lendemain, huit journaux américains d’un même groupe portaient plainte pour violation de droit d’auteur contre la start-up et Microsoft.

2023 a été une année de batailles judiciaires pour OpenAI et s’est terminé pour elle par une nouvelle plainte : celle du New York Times. Le journal l’accusait de violer le droit d’auteur en entraînant les modèles tels que GPT-4 sur ses publications sans autorisation, lui faisant ainsi perdre des milliards de dollars.

OpenAI s’est défendu de vouloir spolier les éditeurs et créateurs, se disant prêt à collaborer avec eux “afin qu’ils tirent profit d’une technologie IA avancée et d’un nouveau modèle de revenus”.

La start-up a cherché à se rapprocher de différents médias afin que les réponses fournies par les versions payantes de ChatGPT soient d’actualité et produites en toute légalité. Elle a ainsi signé un accord avec le groupe de presse allemand Axel Springer après avoir conclu un partenariat avec l’Associated Press en juillet 2023. Plus récemment, en mars dernier, c’est avec le quotidien français Le Monde que le premier accord a été signé en France parallèlement à un partenariat avec le groupe de presse espagnol Prisa Media.

La collaboration avec le Financial Times

C’est le Financial Times lui-même qui a annoncé un accord de licence avec OpenAI et un partenariat stratégique pour développer de nouveaux produits et fonctionnalités d’IA pour ses lecteurs.

Il déclare également avoir acquis un accès à ChatGPT Enterprise pour tous ses employés afin que “ses équipes connaissent bien la technologie et puissent bénéficier des gains de créativité et de productivité rendus possibles par les outils d’OpenAI”.

L’article cite John Ridding, PDG de FT Group :

“Il s’agit d’un accord important à plusieurs égards. Cela reconnaît la valeur de notre journalisme primé et nous donnera un aperçu précoce de la façon dont le contenu est mis en évidence par l’IA. Nous sommes depuis longtemps un chef de file en matière d’innovation dans les médias d’information, pionniers du modèle d’abonnement et des technologies d’engagement, et ce partenariat nous aidera à rester à l’avant-garde des développements dans la façon dont les gens accèdent à l’information et l’utilisent”.

La plainte des journaux américains pour violation de droits d’auteur

Si certains quotidiens se sont dits prêts à négocier, certains refusent de laisser OpenAI explorer et collecter des données à partir de leurs contenus comme la BBC, CNN ou Reuters.

C’est également le cas du New York Daily News, du Chicago Tribune, de l’Orlando Sentinel, du Sun Sentinel of Florida, du San Jose Mercury News, du Denver Post, de l’Orange County Register et du St. Paul Pioneer Press, huit journaux appartenant à Alden Global Capital. Ils accusent OpenAI d’avoir illégalement copié des millions de leurs articles pour entraîner ses modèles, et ce, sans contrepartie financière, tout comme Microsoft, qui en aurait fait de même pour Copilot.

Ces litiges en cours avec les médias soulignent les défis complexes auxquels l’industrie de l’IA est confrontée dans la recherche d’un équilibre entre innovation technologique, protection des droits d’auteur et rémunération équitable des créateurs de contenu.

La plainte de NOYB

Organisation à but non lucratif basée à Vienne, en Autriche, Noyb vise à faire respecter les droits à la vie privée et à la protection des données personnelles. Alors qu’une personnalité publique n’a pu faire rectifier la date erronée de sa naissance par OpenAI, elle a porté plainte auprès de l’autorité autrichienne de protection des données. Elle lui a demandé d’enquêter sur le traitement des données personnelles par OpenAI et d’imposer une amende pour garantir sa conformité future au RGPD.

Le RGPD exige que les informations concernant les individus soient exactes, que ceux-ci aient un accès complet aux informations stockées et à leur source, ce qu’OpenAI reconnait lui-même ne pas pouvoir faire. La start-up aurait toutefois déclaré que “la précision des faits dans les grands modèles de langage reste un domaine de recherche actif”.

Maartje de Graaf, avocate spécialisée dans la protection des données chez Noyb, commente:

“Inventer de fausses informations est déjà problématique en soi. Mais lorsqu’il s’agit de fausses informations sur des personnes, les conséquences peuvent être graves. Il est clair que les entreprises sont actuellement incapables de faire en sorte que les chatbots tels que ChatGPT soient conformes à la législation de l’UE lorsqu’ils traitent des données concernant des personnes. Si un système ne peut pas produire des résultats précis et transparents, il ne peut pas être utilisé pour générer des données sur des personnes. La technologie doit suivre les exigences légales, et non l’inverse”.

OpenAI, entre de nouvelles plaintes et un accord de licence avec le Financial Times

Reddit : Entre annonce d’une introduction en bourse et un accord de licence avec Google

ActuIA

Par : Marie-Claude Benoit

26 février 2024 à 13:00

Le 23 février dernier, le réseau social Reddit a annoncé avoir déposé un dossier d’introduction en bourse auprès de la SEC (Securities and Exchange Commission) et confirmé avoir passé un accord de licence de 60 millions de dollars annuels avec Google afin que celui-ci puisse exploiter le contenu de sa plateforme pour entraîner ses modèles d’IA générative.

Lancé en 2005, Reddit, qui revendique 73 millions d’utilisateurs actifs quotidiens, est un site web communautaire où les utilisateurs peuvent soumettre du contenu, tel que des liens, des images et des textes, et voter pour le contenu soumis par d’autres utilisateurs. Les discussions sur Reddit se déroulent dans des “subreddits”, des sous-sections thématiques dédiées à des sujets spécifiques, tels que la technologie, les jeux vidéo, le sport, les actualités… Les utilisateurs peuvent commenter les publications, créer de nouvelles discussions et interagir avec d’autres membres de la communauté.

La plateforme qui héberge 2,8 millions de subreddits et plus de 100 000 communautés actives a vu son chiffre d’affaires passer à plus de 800 millions de dollars en 2023, contre 666,7 millions de dollars en 2022 mais a tout de même accusé une perte de 91 millions de dollars l’an passé. Sa principale source de revenus, la publicité, n’a pas suffi à combler son déficit.

Reddit a vu une augmentation de 27 % des utilisateurs actifs quotidiens dans le monde au cours du dernier trimestre de 2023, ce qui peut inciter les investisseurs à considérer l’IPO de l’entreprise comme une opportunité intéressante malgré ses déficits financiers.

La réaction de ses utilisateurs, les “Redittors” à l’annonce de l’IPO a été mitigée. Certains se sont réjouis de la possibilité d’acheter des actions de Reddit au prix de l’introduction, avant que le titre ne commence à être négocié sur le marché, Reddit prévoyant de réserver un nombre indéterminé d’actions pour ses 75 000 redittors les plus engagés.

D’autres s’inquiètent pour leur indépendance, leur liberté d’expression et la protection de leurs données.

L’accord de licence avec Google

Certaines sources avaient laissé entendre que Reddit avait décidé de monétiser ce qui s’avère aujourd’hui le plus précieux pour les développeurs d’IA générative : les données. C’est sur son blog, tout comme Google l’a fait sur le sien, qu’il a annoncé une extension du partenariat entre les 2 sociétés.

Dans le cadre de cet accord, Google va donc exploiter le contenu de la plateforme pour son modèle Gemini, ce qui est loin de rassurer certains redittors. Ainsi, si Reddit mise toujours sur la publicité, il identifie aujourd’hui l’IA générative comme levier de croissance.

Dans le dossier de l’IPO, Reddit argumente :

“Notre contenu est particulièrement important pour l’intelligence artificielle (‘IA’) – il fait partie intégrante de la formation de nombreux modèles de langage de pointe”.

Steve Huffman, son PDG, y écrit :

“Les données de Reddit se développent et se régénèrent constamment au fur et à mesure que les utilisateurs conversent. Alors que le monde devient de plus en plus axé sur les données, nous proposons des solutions qui sont centrées sur l’humain et l’expérience. Nous nous attendons à ce que notre avantage en matière de données et notre propriété intellectuelle continuent à être un élément clé dans la formation des futurs MLL”.

Il est probable que Reddit établisse prochainement d’autres accords de licence avec des acteurs de l’IA générative, OpenAI pourrait être l’un d’entre eux, puisque Sam Altman, avec 8,7% des actions de Reddit en est le troisième actionnaire principal.