Vue normale

Il y a de nouveaux articles disponibles, cliquez pour rafraîchir la page.
Hier — 22 mai 2026Flux principal
  • ✇LEBIGDATA.FR
  • Warp : comment le terminal open source réinvente le code à l’ère de l’IA agentique
    L’ingénierie logicielle se transforme profondément sous l’impulsion de l’intelligence artificielle. Les développeurs ne cherchent plus de simples assistants de saisie, mais des partenaires autonomes. C’est ici qu’intervient Warp, un terminal moderne qui s’élargit en environnement de développement agentique et redéfinit notre espace de travail quotidien. L’outil s’ancre au cœur de la ligne de commande pour transformer nos routines de production. Cette approche bouscule des habitudes techniques

Warp : comment le terminal open source réinvente le code à l’ère de l’IA agentique

Par : Roberto R.
21 mai 2026 à 20:56

L’ingénierie logicielle se transforme profondément sous l’impulsion de l’intelligence artificielle. Les développeurs ne cherchent plus de simples assistants de saisie, mais des partenaires autonomes. C’est ici qu’intervient Warp, un terminal moderne qui s’élargit en environnement de développement agentique et redéfinit notre espace de travail quotidien. L’outil s’ancre au cœur de la ligne de commande pour transformer nos routines de production.

Cette approche bouscule des habitudes techniques ancrées depuis des décennies. Une nouvelle ère de productivité s’ouvre désormais pour le développement de logiciels. L’interface invite à réinventer notre relation avec la ligne de commande. Grâce à ces technologies agentiques, les ingénieurs se libèrent des tâches répétitives pour se concentrer sur la conception.

C’est quoi Warp, concrètement ?

L’application se présente comme la réinvention complète de l’invite de commande traditionnelle. Conçu en Rust, il remplace les émulateurs classiques comme iTerm2 ou les consoles natives. Le projet visait d’abord à corriger la lenteur et le manque d’ergonomie des outils existants. Désormais, il transforme la simple saisie de texte en un centre de pilotage intelligent.

L’interface intègre l’intelligence artificielle au cœur des tâches quotidiennes. Les développeurs ne tapent plus de commandes apprises par cœur. L’application comprend l’intention derrière chaque saisie et analyse l’architecture du projet en cours. Ce fonctionnement réduit le fossé entre le code et son exécution.

Alliant vitesse native et fonctions IA, la plateforme marque une rupture. Elle dépasse largement la coloration syntaxique et les simples raccourcis. Le terminal devient un partenaire proactif pour l’ingénieur. Cet espace de travail centralise ainsi toutes les opérations du développement moderne.

La fin d’un vieux mythe : l’écran noir austère

Le shell n’a pas évolué depuis quarante ans. Les ingénieurs dépendent toujours d’interfaces rigides héritées des premiers terminaux. Cette stagnation a contraint des générations de professionnels à composer avec des outils peu adaptés. Ce manque d’ergonomie textuelle était alors accepté comme une fatalité informatique.

Le quotidien des développeurs s’est pourtant complexifié, fragmentant leur attention. Ils doivent constamment basculer entre l’éditeur de code, la documentation web et l’IA générative. Ce va-et-vient permanent fait perdre un temps précieux et provoque une réelle fatigue cognitive. Le copier-coller de messages d’erreur est ainsi devenu la norme.

L’application élimine cette rupture de flux. En regroupant la documentation, l’analyse des pannes et l’exécution au même endroit, elle met fin à la dispersion mentale. Le terminal abandonne la rigidité des anciens émulateurs pour s’adapter aux exigences de productivité actuelles. Cette modernisation graphique et fonctionnelle transforme en profondeur l’environnement de travail.

développeur travaillant avec une IA

Le concept d’environnement de développement agentique

Il faut distinguer les assistants de code traditionnels des systèmes agentiques. Un outil classique se limite à suggérer une ligne ou à corriger une erreur après coup. À l’inverse, l’écosystème agentique est autonome : l’utilisateur fixe un objectif en langage naturel, puis le système planifie et exécute les tâches.

Cette approche repose sur une compréhension globale du projet. Le terminal ne se limite pas à la commande saisie. Il analyse l’arborescence, indexe les configurations et cartographie les dépendances grâce à une base vectorielle locale. Ce contexte lui permet d’adapter ses décisions à l’architecture de l’application.

Une fois l’ordre validé, l’environnement lance une boucle continue d’action et de vérification. Le système écrit des scripts, démarre les serveurs, lit les erreurs et corrige le code source en cas d’échec. Cette autonomie libère l’humain des micro‑décisions fastidieuses. Le développeur devient alors le superviseur de processus automatisés.

Des blocs visuels pour y voir enfin clair

L’innovation visuelle majeure est l’abandon du flux textuel continu. L’application découpe la fenêtre de commande en unités graphiques indépendantes : les blocs. Chaque instruction et son résultat s’encapsulent ainsi dans un conteneur dédié. Ce cloisonnement transforme radicalement la lecture et la navigation dans l’historique.

Au‑delà de l’esthétique, ces blocs sont de véritables objets interactifs. On peut y sélectionner du texte à la souris, utiliser des curseurs multiples ou isoler un résultat en un clic. Partager un extrait de journal ou sauvegarder une commande devient immédiat. L’expérience s’aligne enfin sur les standards des éditeurs de code modernes.

Cette structure offre un avantage décisif pour l’intégration de l’intelligence artificielle. Lorsqu’un script échoue, l’agent cible précisément le bloc concerné sans être pollué par le reste de l’historique. Le traitement gagne en rapidité, car le contexte est déjà naturellement délimité par l’interface. Cette clarté visuelle optimise directement l’efficacité de l’IA.

Quand l’IA arrête de parler et commence à agir

De nombreux développeurs dialoguent avec une IA externe puis copient‑collent les scripts. Ce flux de travail contraignant disparaît grâce à l’intégration directe dans le terminal. L’agent ne se contente plus d’écrire des suggestions théoriques dans un chat séparé. Il formule et propose directement des commandes applicables dans le shell actif.

Face à une requête en langage naturel, le système conçoit un plan d’action transparent. Cette feuille de route détaille les modifications de fichiers, les créations de dossiers et les vérifications de sécurité. L’utilisateur garde le contrôle total. Il peut ajuster ou valider ce plan d’un clic avant l’exécution. Cette clarté élimine l’effet « boîte noire » des outils automatisés.

La force du dispositif réside dans sa gestion des erreurs d’exécution. Si une commande échoue, l’agent analyse immédiatement le rapport de plantage. Il modifie le code source défectueux de manière autonome. Puis, il relance le processus jusqu’à sa réussite. Cette auto‑correction en boucle fermée réduit considérablement le temps de débogage manuel.

interface de l'outil OZ sur un PC

La plateforme Oz, le chef d’orchestre invisible

L’infrastructure du terminal s’appuie sur Oz, une plateforme d’orchestration cloud. Elle gère la charge de travail des agents à distance sans encombrer la machine locale. Le système coordonne ainsi plusieurs processus complexes en simultané. Cette puissance déportée s’avère idéale pour les tâches de grande envergure.

Cette architecture permet de confier des projets lourds à des agents asynchrones, comme le refactoring massif ou les audits de sécurité. Ces outils travaillent en arrière‑plan sur des serveurs distants. Le processeur local ne sature pas et la batterie reste préservée. Le développeur peut même fermer l’application ou changer de projet pendant l’intervention.

Un tableau de bord épuré permet de suivre ces opérations en temps réel. Chaque étape franchie par l’agent s’affiche instantanément dans l’interface de bureau. L’utilisateur conserve un contrôle permanent. Il peut interrompre ou réorienter l’orchestrateur à tout moment. Cette liaison fluide unifie les ressources locales et la puissance du cloud.

Un outil ouvert à Claude, Gemini et aux modèles mondiaux

Le projet refuse d’enfermer les développeurs dans un écosystème propriétaire. L’application reste agnostique et accueille les meilleurs modèles du marché. Cette ouverture garantit une totale liberté de choix. Chacun adapte ainsi son terminal selon ses exigences techniques ou contractuelles.

Les ingénieurs basculent nativement entre Claude Code, Gemini et OpenAI. Cette compatibilité s’appuie sur un protocole standardisé pour la communication avec les modèles. Il assure une interaction fluide et des performances homogènes. Le terminal devient une interface unique pour piloter toutes ces IA.

Un routage intelligent oriente chaque requête vers le modèle idéal pour optimiser performances et coûts. Une simple correction syntaxique revient à un modèle local, rapide et économe. À l’inverse, un refactoring complexe est transmis à un grand modèle cloud. Cette gestion dynamique équilibre vitesse et pertinence.

La technique derrière l’environnement de développement agentic

Un terminal exige une fluidité absolue. L’interface graphique repose sur un moteur de rendu sur mesure écrit en Rust. Ce système sollicite directement la carte graphique de l’ordinateur. Le temps de réponse au clavier reste ainsi imperceptible, même lors de l’affichage de flux de données massifs.

Le logiciel assure une parité fonctionnelle stricte entre macOS, Linux et Windows. L’application propose des versions natives pour les architectures ARM64, ciblant les puces Apple Silicon et les PC Copilot+. Cette optimisation matérielle réduit la consommation d’énergie tout en maximisant la réactivité.

La sécurité et la vitesse reposent sur un index vectoriel installé localement. Cet outil cartographie la structure des projets sans envoyer les fichiers sources vers des serveurs tiers. Le terminal extrait uniquement les fragments de contexte indispensables pour les transmettre de façon sécurisée. Ce choix technique allie performance et confidentialité.

Le pari fou du passage à l’open source pour Warp

L’entreprise opère un virage stratégique en ouvrant le code source de son application. Le framework graphique adopte la licence MIT, tandis que le cœur du client passe sous AGPL v3. Cette décision inscrit durablement le projet dans l’écosystème du logiciel libre.

Ce choix répond à la méfiance des développeurs envers les IA propriétaires. Les professionnels exigent une transparence totale pour un outil qui accède à leurs lignes de commande et à leurs fichiers locaux. La publication du code sur GitHub permet désormais à chacun d’auditer les algorithmes et de valider la sécurité.

Cette transition transforme la stratégie commerciale de l’éditeur. L’application de bureau devient un bien commun, gratuit et ouverte aux contributions externes. La rentabilité repose désormais sur les services cloud destinés aux entreprises et sur la puissance d’orchestration de la plateforme Oz.

L’alliance surprenante entre OpenAI et Warp

L’ouverture du code s’accompagne d’un partenariat avec OpenAI, désormais sponsor fondateur du dépôt public. Ce soutien apporte d’importantes ressources financières et techniques au projet. Ces nouveaux moyens accéléreront la recherche sur les agents logiciels.

Concrètement, les modèles GPT automatisent la maintenance de l’application. Les ingénieurs testent des processus où l’IA valide le code soumis par la communauté. Le projet applique ainsi ses propres concepts à son propre développement pour en prouver l’efficacité.

Plus marquant encore, un système de contribution automatisé voit le jour. Sur les canaux publics, des agents autonomes trient déjà les bugs et rédigent des correctifs. Ils soumettent aussi leurs propres requêtes d’intégration. Je suis convaincu que ce laboratoire à ciel ouvert préfigure l’avenir du développement, où humains et IA coopèrent sur un pied d’égalité.

Garder le contrôle d’une machine qui code toute seule

Confier le terminal à un programme autonome soulève des enjeux de sécurité. Pour éviter les dérives, l’application intègre des barrières strictes. Une supervision humaine obligatoire empêche le système de lancer des commandes destructrices. Aucune modification profonde ne s’exécute sans validation.

La protection de la propriété intellectuelle s’appuie sur des protocoles rigoureux. Les offres professionnelles incluent des clauses de non‑rétention. Ainsi, le code transmis n’est jamais stocké sur des serveurs tiers et ne sert pas à l’entraînement des modèles.

En local, un algorithme intercepte les informations sensibles avant leur sortie du poste. Les clés d’API, mots de passe et certificats sont automatiquement masqués dans les blocs de texte. Ce filtrage maintient les secrets au sein de l’entreprise, et le développeur maîtrise ainsi les données partagées.

Cet article Warp : comment le terminal open source réinvente le code à l’ère de l’IA agentique a été publié sur LEBIGDATA.FR.

À partir d’avant-hierFlux principal

« L’open source est mort » : ce projet majeur ferme subitement son code par peur de l’IA

Cal, application de planification parmi les plus importantes de l'écosystème open source, abandonne sa licence ouverte. En cause : la capacité des IA à analyser du code à la recherche de failles. Un signal qui en dit long sur l'état du logiciel libre.

Mozilla lance cq : le projet qui veut permettre aux IA de partager leurs connaissances entre elles

Tous les jours, les agents IA résolvent les mêmes problèmes en boucle, sans jamais partager ce qu'ils ont appris. Un ingénieur de Mozilla veut y remédier avec cq, un projet open source venu prendre le relais de Stack Overflow, la plateforme similaire délaissée par les humains.

Voici Nearby Glasses, l’app qui permet de repérer les lunettes Meta Ray-Ban autour de soi

Disponible sur le Google Play Store, l'application « Nearby Glasses », développée par un amateur, attire l’attention. Elle permet à ses utilisateurs d’être avertis si des personnes à proximité portent des lunettes « intelligentes », comme les lunettes Ray-Ban de Meta.

Bug OpenClaw : quand l’agent IA efface les mails d’une directrice de Meta

Ce 23 février 2026, Summer Yue est au centre des discussions tech sur X. La responsable de l’alignement IA chez Meta a raconté comment son agent autonome OpenClaw lui a désobéi, supprimant sans autorisation des emails de sa boîte Gmail. Un incident qui soulève de sérieuses questions sur la fiabilité des agents IA.

« Un désastre se profile à l’horizon » : pourquoi le phénomène Clawdbot inquiète autant qu’il fascine ?

Clawdbot s’est imposé en quelques jours comme le nouveau jouet à la mode de l’écosystème IA : un agent personnel capable de lire vos messages et, plus généralement, d’organiser votre vie numérique de manière proactive, 24 heures sur 24. Mais dans l’enthousiasme général, un point crucial est relégué au second plan par un bon nombre d’utilisateurs : la cybersécurité.

Amazon attaque Perplexity : que se passe-t-il entre le géant et la startup IA ?

Quelques semaines après le lancement de Comet, le navigateur de Perplexity, Amazon porte plainte contre l’entreprise. Il lui reproche d’encourager les achats accidentels, puisque Comet peut passer des commandes pour son utilisateur. Amazon prie Perplexity de ne plus toucher à son site.

Salesforce intègre les modèles Gemini de Google dans Agentforce

25 février 2025 à 17:45
Le géant du CRM veut faire de sa plateforme Agentforce un outil complet pour la création et le déploiement d'agents autonomes. Pour ce faire,...

Amazon s'apprête à lancer une nouvelle version d'Alexa pour concurrencer ChatGPT

6 février 2025 à 11:30
Amazon a envoyé aujourd’hui des invitations pour un événement qui se tiendra le 26 février à New York, en présence du responsable de son équipe...

Des développeurs ont copié ChatGPT Deep Research en 24 heures (et c’est open source)

Deep Research, le nouvel outil d'OpenAI, est capable d'effectuer de longues recherches en ligne et de synthétiser les résultats en quelques dizaines de minutes. Des développeurs de Hugging Face ont conçu leur propre version du système afin de proposer une alternative open source.

  • ✇ActuIA
  • AI2 lance Tülu 3 405B : une avancée vers un nouveau standard de l’IA open source
    Après avoir publié en décembre dernier sa famille de modèles OLMO 2, l’Allen Institute for Artificial Intelligence (AI2) poursuit son engagement envers l’open source avec le lancement de Tülu 3 405B. Basé sur Llama 3.1, exploitant le cadre d’apprentissage par renforcement à partir de récompenses vérifiables (RLVR) d’AI2, ce nouveau modèle atteint des performances compétitives ou supérieures à celles de DeepSeek V3 (sur lequel est basé DeepSeek R1) et GPT-4o, surpassant également les modèles post

AI2 lance Tülu 3 405B : une avancée vers un nouveau standard de l’IA open source

4 février 2025 à 14:00

Après avoir publié en décembre dernier sa famille de modèles OLMO 2, l’Allen Institute for Artificial Intelligence (AI2) poursuit son engagement envers l’open source avec le lancement de Tülu 3 405B. Basé sur Llama 3.1, exploitant le cadre d’apprentissage par renforcement à partir de récompenses vérifiables (RLVR) d’AI2, ce nouveau modèle atteint des performances compétitives ou supérieures à celles de DeepSeek V3 (sur lequel est basé DeepSeek R1) et GPT-4o, surpassant également les modèles post-entraînés précédents de même taille, comme Llama 3.1 405B Instruct et Hermes 3 405B de Nous Research.

Un post entraînement optimisé

La recette de post-entraînement de Tülu 3 405B est similaire à celle de ses prédécesseurs, Tülu 3 8B et 70B, publés par AI2 en novembre dernier. Elle inclut la curation minutieuse des données, la mise au point supervisée (SFT), l’optimisation directe des préférences (DPO) ainsi que le Reinforcement Learning with Verifiable Rewards (RLVR).

Crédit image AI. Schéma décrivant le processus d’apprentissage par renforcement avec récompenses vérifiables (RLVR).

Cette nouvelle méthode permet d’améliorer significativement les performances des modèles Tülu sur des tâches complexes comme la résolution de problèmes mathématiques et le suivi d’instructions. Fait intéressant, les résultats montrent que l’échelle du modèle influence positivement l’efficacité du RLVR : alors que les modèles plus petits bénéficient d’un entraînement sur des ensembles de données diversifiés, Tülu 3 405B obtient de meilleures performances en se concentrant sur des données plus spécialisées.

Performances du modèle

Selon les évaluations internes d’AI2, Tülu 3 405B surpasse DeepSeek V3, GPT-4o, et Llama 3.1 405B sur le benchmark PopQA, un ensemble de 14 000 paires de questions-réponses qui permet de vérifier l’efficacité des modèles dans la récupération et la génération d’informations précises. Le modèle a également obtenu les performances les plus élevées de tous les modèles de sa catégorie sur GSM8K, un ensemble de données composé d’environ 8 500 problèmes mathématiques de niveau scolaire créé par OpenAI, utilisé pour tester les capacités des modèles de langage à effectuer un raisonnement mathématique multi-étapes.

Enjeux techniques et défis d’implémentation

La mise à l’échelle du modèle n’a pas été sans défis. L’entraînement de Tülu 3 405B a nécessité une infrastructure considérable, avec 256 GPU déployés en parallèle. La gestion du parallélisme tensoriel et l’optimisation des hyperparamètres ont été des points clés, nécessitant un suivi rigoureux. L’’intégration de corrections pour la diffusion NCCL (NVIDIA Collective Communications Library, une bibliothèque open source qui permet de réduire les goulots d’étranglement liés aux échanges de données et améliore les performances globales du système) a cependant permis une synchronisation efficace des poids du modèle, réduisant ainsi les délais d’inférence et de mise à jour.

Tülu 3 405B est un modèle véritablement ouvert, répondant aux critères stricts de l’OSAID, la définition de l’IA open source de l’OSI. Il peut être testé sur le site d’Ai2, est accessible sur Hugging Face et son code d’entraînement sur GitHub.

Hébergé sur Google Cloud, le modèle sera prochainement disponible sur Vertex AI.

AI2 lance Tülu 3 405B
  • ✇ActuIA
  • Mistral Small 3 : la réponse open source française optimisée pour la latence aux modèles GenAI propriétaires
    En fin de semaine dernière, alors que tout le monde avait les yeux rivés sur DeepSeek et son modèle R1, Mistral AI, licorne française de la GenAI, a lancé plus discrètement Mistral Small 3. Publié sous la licence Apache 2.0, ce modèle de 24 milliards de paramètres optimisé pour la latence est “une excellente alternative open source aux modèles propriétaires opaques comme GPT4o-mini” selon elle. Avec Small 3, la licorne, démontre une fois de plus que pour être performant, un LLM ne requiert pas u

Mistral Small 3 : la réponse open source française optimisée pour la latence aux modèles GenAI propriétaires

3 février 2025 à 14:00

En fin de semaine dernière, alors que tout le monde avait les yeux rivés sur DeepSeek et son modèle R1, Mistral AI, licorne française de la GenAI, a lancé plus discrètement Mistral Small 3. Publié sous la licence Apache 2.0, ce modèle de 24 milliards de paramètres optimisé pour la latence est “une excellente alternative open source aux modèles propriétaires opaques comme GPT4o-mini” selon elle.

Avec Small 3, la licorne, démontre une fois de plus que pour être performant, un LLM ne requiert pas un nombre astronomique de paramètres. Le modèle se positionne comme une réponse aux besoins croissants d’efficacité en offrant un taux de traitement de 150 tokens par seconde, tout en affichant une précision de plus de 81 % sur le benchmark MMLU.

Cette prouesse technique est rendue possible grâce à une architecture optimisée qui réduit le nombre de couches traditionnelles, diminuant ainsi le temps de passage avant (forward pass time, ou temps nécessaire à un modèle de réseau de neurones pour traiter une entrée et produise une sortie) sans compromettre la qualité des réponses.

Ce choix architectural, qui en fait “actuellement le modèle le plus efficace de sa catégorie”, permet à la version optimisée, Mistral Small 3 Instruct, de rivaliser avec des modèles bien plus imposants comme Llama 3.3 70B ou Qwen 32B, tout en garantissant une exécution rapide et efficace sur du matériel standard.

Des applications pour divers secteurs

Le Mistral Small 3 ne se contente pas d’afficher des performances techniques remarquables : il s’inscrit également dans une logique d’adaptabilité aux besoins concrets des entreprises. Parmi les cas d’usage envisagés, plusieurs domaines se démarquent :

  • Assistance conversationnelle et appels de fonction : la faible latence garantit des interactions en temps réel, essentielles pour les chatbots ou assistants virtuels ;
  • Fine-tuning pour des expertises spécifiques : sa taille modeste facilite l’ajustement fin pour des domaines précis, comme le diagnostic médical ou le conseil juridique ;
  • Inférence locale : la possibilité de déployer le modèle sur du matériel accessible favorise l’usage dans des secteurs où les données sensibles nécessitent un traitement en local.

Comme les “Ministraux”, Small 3 répond également aux besoins croissants de calcul local et de protection de la vie privée : la possibilité de le déployer sur des configurations matérielles accessibles, comme une RTX 4090 ou un MacBook avec 32 Go de RAM, offre aux organisations le contrôle sur leurs données sensibles sans dépendance à une infrastructure cloud centralisée.

Une stratégie de diffusion ouverte et collaborative

Selon Mistral AI, faisant référence aux derniers modèles de DeepSeek, et au projet Open-R1,”Ce furent des jours passionnants pour la communauté open source ! Mistral Small 3 complète les grands modèles de raisonnement open source comme les récentes versions de DeepSeek, et peut servir de modèle de base solide pour faire émerger des capacités de raisonnement”.

L’entreprise a fait le choix de le publier sous la licence Apache 2.0, faisant le choix d’abandonner peu à peu sa licence plus restrictive MRL pour les modèles à usage général. Elle annonce d’ores et déjà “des modèles Mistral petits et grands avec des capacités de raisonnement améliorées dans les semaines à venir”.

Actuellement disponible sur les plateformes Hugging Face, Ollama, Kaggle, Together AI et Fireworks AI, Mistral Small 3 le sera également bientôt sur NVIDIA NIM, Amazon SageMaker, Groq, Databricks et Snowflake.

Mistral Small 3
  • ✇ActuIA
  • Les chercheurs de Hugging Face invitent la communauté open source à contribuer au projet Open-R1
    Dix jours après son lancement, DeepSeek R1, qui a suscité l’émoi de la Silicon Valley et perturbé le marché de Wall Street, continue d’alimenter la une des médias internationaux. L’entreprise éponyme qui dit l’avoir mis open source pour soutenir la communauté IA n’a cependant pas révélé tous les éléments qui lui ont permis de développer ce modèle, notamment les ensembles de données et le code d’entraînement. Hugging Face, loin des polémiques, lance le projet Open-R1 et propose à la communauté de

Les chercheurs de Hugging Face invitent la communauté open source à contribuer au projet Open-R1

30 janvier 2025 à 14:00

Dix jours après son lancement, DeepSeek R1, qui a suscité l’émoi de la Silicon Valley et perturbé le marché de Wall Street, continue d’alimenter la une des médias internationaux. L’entreprise éponyme qui dit l’avoir mis open source pour soutenir la communauté IA n’a cependant pas révélé tous les éléments qui lui ont permis de développer ce modèle, notamment les ensembles de données et le code d’entraînement. Hugging Face, loin des polémiques, lance le projet Open-R1 et propose à la communauté de l’aider à construire les pièces manquantes du pipeline R1.

Mené par Leandro von Werra, directeur de la recherche chez Hugging Face, Elie Bakouch et Lewis Tunstall, le projet Open-R1 se veut un exemple de transparence et de partage des connaissances, permettant à chacun de contribuer et d’améliorer le modèle pour des applications variées, allant de la médecine à l’éducation, en passant par la recherche fondamentale.

Ils expliquent le but de leur démarche dans un blog :

“Le projet Open-R1 est une initiative visant à reconstruire systématiquement le pipeline de données et de formation de DeepSeek-R1, à valider ses affirmations et à repousser les limites des modèles de raisonnement ouvert. En créant Open-R1, nous visons à fournir de la transparence sur la façon dont l’apprentissage par renforcement peut améliorer le raisonnement, partager des informations reproductibles avec la communauté open source et créer une base pour de futurs modèles permettant d’exploiter ces techniques.”

Un plan en trois étapes

Pour les trois hommes, “la sortie de DeepSeek-R1 est une aubaine incroyable pour la communauté”.

DeepSeek-R1 est un modèle de raisonnement construit sur la base de DeepSeek-V3, présenté par la start-up chinoise fin décembre dernier, dont les performances sont comparables, à celles de principaux modèles à source fermée, comme GPT-4o ou Claude 3.5 Sonnet, et ce, malgré un coût d’entraînement nettement inférieur.

Le modèle compte 2 versions : DeepSeek-R1-Zero, entraîné par apprentissage par renforcement (RL) sans réglage fin supervisé (SFT), a montré de solides performances. Cependant, il présente des défis tels que la répétition sans fin et la mauvaise lisibilité. Pour résoudre ces problèmes, DeepSeek-R1 intègre des données de démarrage à froid avant l’application du RL et de plusieurs étapes de raffinement qui rejettent les résultats de mauvaise qualité et produisent des réponses polies et cohérentes.

DeepSeek a mis ces 2 versions et six modèles denses distillés à partir de DeepSeek-R1 basés sur Llama et Qwen à la disposition de la communauté.

Les chercheurs de Hugging Face proposent à ceux qui voudront contribuer au projet de les aider à :

  • Étape 1 : Répliquer les modèles R1-Distill en distillant un ensemble de données de raisonnement de haute qualité à partir de DeepSeek-R1.
  • Étape 2 : Répliquer le pipeline RL pur que DeepSeek a utilisé pour créer R1-Zero. Cela impliquera la conservation de nouveaux ensembles de données à grande échelle pour les mathématiques, le raisonnement et le code.
  • Étape 3 : Montrer qu’il est possible de passer du modèle de base → SFT (Supervised Fine-Tuning)→ RL via une formation en plusieurs étapes.

Les chercheurs d’Hugging Face concluent :

“Cette initiative ne consiste pas seulement à reproduire les résultats, mais aussi à partager des idées avec la communauté. En documentant ce qui fonctionne, ce qui ne fonctionne pas et pourquoi, nous espérons éviter à d’autres de perdre du temps et de calculer sur des chemins improductifs.”

Le projet, hébergé sur GitHub, compte plus de 12 000 étoiles, ce qui démontre l’intérêt qu’il suscite.

Les chercheurs de Hugging Face invitent la communauté open source à contribuer au projet Open-R1
  • ✇ActuIA
  • Alibaba : l’équipe Qwen annonce l’ajout de deux nouveaux modèles open source à Qwen2.5-1M
    L’avancement des LLMs repose souvent sur leur capacité à traiter des volumes croissants de données dans des contextes plus longs et plus complexes. Avec le lancement des modèles open source Qwen2.5-7B-Instruct-1M et Qwen2.5-14B-Instruct-1M, l’équipe Qwen d’Alibaba Cloud place la barre très haut. Pour permettre aux développeurs de déployer plus efficacement les modèles de la série Qwen2.5-1M, ceux-ci sont accompagnés d’un cadre d’inférence innovant, intégrant une méthode d’extrapolation de longu

Alibaba : l’équipe Qwen annonce l’ajout de deux nouveaux modèles open source à Qwen2.5-1M

29 janvier 2025 à 11:00

L’avancement des LLMs repose souvent sur leur capacité à traiter des volumes croissants de données dans des contextes plus longs et plus complexes. Avec le lancement des modèles open source Qwen2.5-7B-Instruct-1M et Qwen2.5-14B-Instruct-1M, l’équipe Qwen d’Alibaba Cloud place la barre très haut.

Pour permettre aux développeurs de déployer plus efficacement les modèles de la série Qwen2.5-1M, ceux-ci sont accompagnés d’un cadre d’inférence innovant, intégrant une méthode d’extrapolation de longueur et une méthode d’attention clairsemée, visant à réduire les coûts d’inférence et à améliorer la précision.

Les avancées techniques de Qwen2.5-1M

L’entraînement avec des séquences aussi longues représente un défi monumental en termes de calcul. L’équipe Qwen a adopté une approche progressive :

  • Augmentation graduelle : les modèles passent de 4K à 256K jetons au pré-entraînement, grâce à l’ajustement de la fréquence de base RoPE ;
  • Fine-tuning supervisé : une stratégie en deux étapes combine des instructions courtes (32K jetons) et longues (jusqu’à 256K jetons), garantissant une performance équilibrée ;
  • Extrapolation à 1 M : l’intégration de l’attention à double bloc (DCA) permet de gérer des distances de position relative invisibles pendant l’entraînement classique, tout en évitant une dégradation des performances.

Optimisations de l’inférence

Les besoins matériels pour traiter des contextes longs sont élevés, mais l’attention clairsemée et d’autres améliorations ont permis de réduire ces contraintes :

  • Chunked Prefill : cette méthode divise les séquences en blocs pour diminuer l’utilisation de la mémoire vive (VRAM) d’activation jusqu’à 96,7 % ;
  • Optimisation du parallélisme : une meilleure gestion des ressources GPU assure une exécution fluide même sur des dispositifs limités ;
  • Efficacité accrue : ces optimisations aboutissent à une augmentation de la vitesse de traitement, qui peut être jusqu’à 6,7 fois supérieures à celle des modèles classiques.

Performances de la famille de modèles Qwen2.5-1M

Tâches à contexte long

La série Qwen2.5-1M comprend actuellement les modèles open source Qwen2.5-7B-Instruct-1M et Qwen2.5-14B-Instruct-1M, ainsi que le modèle accessible via API Qwen2.5-Turbo, qui alimente désormais Qwen Chat.

Les modèles Qwen2.5-1M excellent sur des benchmarks complexes comme RULER, LV-Eval et LongBenchChat, souvent utilisés pour tester la compréhension de longs contextes, où ils surpassent leurs homologues 128K dans la plupart des tâches à contexte long, en particulier pour les séquences de plus de 64 Ko.

Le modèle 14B-Instruct-1M surpasse non seulement Qwen2.5-Turbo, mais aussi des modèles concurrents comme GPT-4o-mini, offrant une alternative open-source robuste pour les tâches à contexte long.

Évalués sur la tâche Passkey Retrieval, leurs résultats démontrent qu’ils peuvent récupérer avec précision des informations cachées dans des documents contenant jusqu’à 1 million de jetons, avec seulement des erreurs mineures observées dans le modèle 7B.

Tâches à contexte court

L’équipe a comparé les performances des modèles Qwen2.5-1M sur des séquences courtes par rapport à celles de leurs versions 128K et de GPT-4o-mini. Ils ont constaté que les versions 1M sont aussi précises que leurs homologues 128K sur des tâches classiques et qu’avec une longueur de contexte huit fois supérieure à celle de GPT-4o-mini, les modèles Qwen2.5-14B-Instruct-1M et Qwen2.5-Turbo atteignent des performances similaires au modèle d’OpenAI.

Le lancement de Qwen2.5-1M marque un tournant pour les modèles à contexte long, repoussant les limites techniques tout en élargissant le champ des possibles pour les applications qui nécessitent un traitement contextuel étendu telles que l’analyse juridique ou la gestion documentaire.

Pour plus d’informations sur les modèles, cliquer ici.

Alibaba, l'équipe Qwen annonce l'ajout de deux nouveaux modèles open source

Palona AI lève 10 millions de dollars pour rendre les chatbots de service client plus pertinents

24 janvier 2025 à 14:34
Palona AI, start-up californienne spécialisée dans le développement de modèles d'intelligence artificielle, a annoncé le 23 janvier une levée...
  • ✇ActuIA
  • Etude IBM : l’IA open source au service du ROI
    Une récente étude menée par Morning Consult en collaboration avec Lopez Research pour IBM auprès de plus de 2 400 décideurs informatiques, révèle que les entreprises, en quête de rentabilité et d’innovation, se tournent de plus en plus vers des solutions d’IA basées sur l’open source. Une évolution qui pourrait redéfinir la manière dont elles conçoivent et gèrent leurs stratégies d’IA. Selon l’étude, 85 % des décideurs IT à l’échelle mondiale rapportent des progrès dans la mise en œuvre de leur

Etude IBM : l’IA open source au service du ROI

13 janvier 2025 à 12:25

Une récente étude menée par Morning Consult en collaboration avec Lopez Research pour IBM auprès de plus de 2 400 décideurs informatiques, révèle que les entreprises, en quête de rentabilité et d’innovation, se tournent de plus en plus vers des solutions d’IA basées sur l’open source. Une évolution qui pourrait redéfinir la manière dont elles conçoivent et gèrent leurs stratégies d’IA.

Selon l’étude, 85 % des décideurs IT à l’échelle mondiale rapportent des progrès dans la mise en œuvre de leurs stratégies IA pour 2024, tandis que 47 % d’entre eux observent déjà un retour sur investissement (ROI) positif. En France, ces chiffres chutent respectivement à 77 % et 29 %.

Thomas Dognin, AI Market Sales Leader – Data & AI, IBM France, explique ces résultats :

“Concernant les activités autour des sujets d’IA l’an dernier, les entreprises en France ont lancé beaucoup d’initiatives autour de l’IA, mais plutôt à destination des employés, et moins pour l’entreprise avec l’automatisation des processus métier. Or, ce sont justement ces cas d’usages qui apportent le ROI attendu.”

L’open source : un accélérateur de rentabilité ?

Six responsables informatiques interrogés sur 10 au niveau mondial déclarent utiliser des écosystèmes open source comme source d’outils d’IA. Plus de 80 % (84 % en France) affirment qu’au moins un quart des solutions ou plateformes d’IA de leur entreprise sont basées sur l’open source.

L’open source semble être un élément différenciateur. Parmi les entreprises ayant adopté des outils d’IA open source, 51 % rapportent un ROI positif, contre 41 % pour celles qui ne les utilisent pas.

En outre, l’open source favorise une multiplication des projets pilotes : 38 % des entreprises utilisant ces écosystèmes prévoient de lancer plus de 21 projets pilotes en 2025, contre seulement 26 % pour celles qui ne s’appuient pas sur ces outils.

En France, bien que 41 % des entreprises prévoient de s’appuyer davantage sur l’open source en 2025 pour optimiser leurs mises en œuvre de l’IA, cette adoption reste inférieure à la moyenne mondiale de 48 %.

Une vision à long terme : quels indicateurs de succès ?

L’étude met également en lumière un écart entre les attentes en matière de ROI et les indicateurs réellement utilisés pour évaluer le succès des projets d’IA. Si le ROI financier traditionnel reste un objectif, il est souvent supplanté par des indicateurs comme :

  • Les gains de productivité (22 % des réponses au niveau mondial) ;
  • L’accélération de l’innovation (23 %) ;
  • La rapidité du développement logiciel (25 %).

Pour 2025, l’étude prévoit une augmentation générale des investissements dans l’IA. Près de 62 % des entreprises mondiales et 41 % en France comptent accroître leurs dépenses. Parmi les priorités stratégiques, l’adoption des services cloud managés (51 %), le recrutement de talents spécialisés (48 %) et l’utilisation de l’open source (48 %) se distinguent.

Maribel Lopez de Lopez Research commente : 

“Alors que les entreprises commencent à mettre en œuvre l’IA à grande échelle, nombre d’entre elles accordent plus d’importance aux indicateurs de réussite tels que les gains de productivité, en partie parce que les avantages traditionnels du retour sur investissement en dollars n’apparaissent pas encore dans les bilans. Pourtant, les entreprises continuent de faire progresser rapidement leurs stratégies d’IA, sans aucun signe de ralentissement. Les entreprises reconnaissent désormais la valeur de la définition de cas d’usage spécifiques et de l’optimisation des projets d’IA. Elles s’appuient sur des stratégies de Cloud hybride et d’open source pour stimuler l’innovation en matière d’IA et obtenir des retours financiers”. 

@Pour consulter l’étude complète : https://newsroom.ibm.com/image/IBM_ROI_of_AI_Report-December_2024.pdf

Etude IBM : l'IA open source au service du ROI
  • ✇ActuIA
  • Accio : avec déjà 500 000 PME clientes, le moteur de recherche IA d’Alibaba redéfinit le commerce B2B
    Alibaba International, division du groupe Alibaba spécialisée dans le e-commerce, a annoncé ce lundi 6 janvier que son moteur de recherche B2B alimenté par l’IA, Accio, a atteint 500 000 utilisateurs PME depuis son lancement en novembre 2024. Une adoption rapide qui consolide la position de la plateforme chinoise de commerce B2B au niveau mondial. Des millions de fournisseurs et une recherche optimisée Accio utilise des techniques avancées de traitement du langage naturel (NLP) pour rendre le pr

Accio : avec déjà 500 000 PME clientes, le moteur de recherche IA d’Alibaba redéfinit le commerce B2B

7 janvier 2025 à 11:00

Alibaba International, division du groupe Alibaba spécialisée dans le e-commerce, a annoncé ce lundi 6 janvier que son moteur de recherche B2B alimenté par l’IA, Accio, a atteint 500 000 utilisateurs PME depuis son lancement en novembre 2024. Une adoption rapide qui consolide la position de la plateforme chinoise de commerce B2B au niveau mondial.

Des millions de fournisseurs et une recherche optimisée

Accio utilise des techniques avancées de traitement du langage naturel (NLP) pour rendre le processus de recherche plus intuitif et efficace. Le moteur de recherche connecte les acheteurs aux fournisseurs parmi des millions de profils répertoriés. En couvrant plus de 7 600 catégories de produits et en s’appuyant sur plus de 200 millions de paramètres liés au commerce mondial, Accio facilite la transformation des concepts de produits en projets commerciaux viables.

Les utilisateurs peuvent comparer des millions de produits en termes de prix, de quantités minimales de commandes, de frais d’expédition et de délais de livraison, obtenant ainsi une transparence sans précédent dans le processus de sourcing.

L’une de ses fonctionnalités clés, Accio Inspiration, a permis d’augmenter de près de 30 % les taux de conversion des fournisseurs, de la recherche initiale à la demande de devis.

Une performance impressionnante pendant les fêtes de fin d’année

Pendant la période critique des ventes en ligne en novembre et décembre 2024, plus de 50 000 PME ont utilisé activement le moteur pour trouver des produits et des inspirations pour le Black Friday et les fêtes de Noël.

Leurs retours démontrent l’efficacité du moteur de recherche qui détient, selon les données collectées le mois dernier, un Net Promoter Score (NPS) supérieur à 50, preuve d’un taux de satisfaction client élevé et d’une adéquation avec le marché. Le 13 décembre 2024, Accio a d’ailleurs été nommé “Produit du jour” sur Product Hunt, un site qui répertorie les nouveaux produits technologiques.

L’IA au service de la compétitivité des PME

Le lancement d’Accio s’inscrit dans une époque charnière pour le développement des outils d’IA et l’expansion du commerce B2B.

En remplaçant les recherches traditionnelles par mots-clés par des recherches en langage naturel, il rend les processus de sourcing plus rapides et précis, permettant aux PME de gagner en efficacité tout en réduisant les coûts. Actuellement, il prend en charge l’anglais, le français, l’allemand, le portugais et l’espagnol, et d’autres langues sont prévues pour les futures mises à jour.

Deux fonctionnalités renforcent son attractivité :

  • Accio Page : Une interface dynamique qui propose des informations produites dans un langage dans un format familier et convivial. Elle fournit des détails objectifs sur les produits et des comparaisons avec des articles similaires, ce qui permet aux entreprises de prendre facilement des décisions d’approvisionnement éclairées ;
  • Accio Agent : Un outil d’accompagnement pour la gestion des demandes, paiements et suivi après-vente, agissant comme un agent de sourcing professionnel grâce à l’infrastructure robuste d’Alibaba International.

le moteur de recherche IA d’Alibaba redéfinit le commerce B2B

Agentforce 2.0 : Salesforce veut aller "au-delà du CRM" et devenir un fournisseur de "travailleurs virtuels"

27 décembre 2024 à 06:55
Salesforce accélère sa stratégie autour des agents IA en cette fin d'année avec l'annonce d'Agentforce 2.0. Dévoilé fin novembre, Agentforce a...

DeepSeek-V3 : la Chine dévoile son ChatGPT dix fois moins cher

Avec DeepSeek-V3, la Chine a possiblement de quoi inquiéter OpenAI et les grands groupes américains. Son approche open source, sur un secteur de plus en plus dominé par des groupes privés, lui permet d'aller vite, pour beaucoup moins d'argent.

  • ✇ActuIA
  • Recherche sur les LLMs : AI2 présente OLMo 2, sa dernière famille de LLMs totalement open source
    Depuis l’émergence des grands modèles de langage (LLMs), certains ont été qualifiés d’“ouverts”, ce qui a pu prêter à confusion avec le terme “open source” lors de leur présentation. En février dernier, l’Allen Institute for Artificial Intelligence (Ai2), a publié la première version d’OLMo, (Open Language Model), un LLM qui répond aux critères stricts de l’OSAID, la définition de l’IA open source de l’OSI. Le modèle a depuis été mis à jour en avril et dernièrement avec OLMo 2 qu’il présente com

Recherche sur les LLMs : AI2 présente OLMo 2, sa dernière famille de LLMs totalement open source

5 décembre 2024 à 09:00

Depuis l’émergence des grands modèles de langage (LLMs), certains ont été qualifiés d’“ouverts”, ce qui a pu prêter à confusion avec le terme “open source” lors de leur présentation. En février dernier, l’Allen Institute for Artificial Intelligence (Ai2), a publié la première version d’OLMo, (Open Language Model), un LLM qui répond aux critères stricts de l’OSAID, la définition de l’IA open source de l’OSI. Le modèle a depuis été mis à jour en avril et dernièrement avec OLMo 2 qu’il présente comme “le meilleur modèle de langage entièrement ouvert à ce jour”. 

AI2 est un institut de recherche à but non-lucratif fondé en 2014 par Paul Allen, philanthrope et cofondateur de Microsoft, décédé en 2018. Son objectif est de favoriser le développement de l’intelligence artificielle au service de la société, en mettant l’accent sur des applications responsables et éthiques. L’institut collabore avec des universités, des entreprises et d’autres institutions de recherche pour stimuler l’innovation dans ce domaine.

AI2 se concentre sur des domaines variés tels que la compréhension du langage naturel, la vision par ordinateur, l’apprentissage automatique et la robotique. Parmi ses contributions majeures, on trouve Semantic Scholar, un moteur de recherche avancé destiné à aider les chercheurs à accéder et à analyser des articles scientifiques, ainsi que AllenNLP, une bibliothèque open source dédiée au traitement du langage naturel.

OLMo 2

Dans le domaine de la GenAI, AI2 milite également pour l’open source. Après Molmo, une famille de modèles d’IA multimodaux, il présente OLMo2, sa dernière famille de modèles de langage.

Dans le cadre de la validation et de la mise à l’essai de l’OSAID, la première version d’OLMo a été considérée comme réellement open source tout comme Pythia (Eleuther AI), Amber et CrystalCoder (LLM360) et T5 (Google) contrairement à Llama de Meta ou Grok de xAI. OLMo 2 correspond lui aussi pleinement aux critères exigés.

AI2 écrit sur son blog :

“Parce que la science entièrement ouverte nécessite plus que des poids ouverts, nous sommes ravis de partager une nouvelle série de mises à jour d’OLMo, y compris des poids, des données, du code, des recettes, des points de contrôle intermédiaires et des modèles optimisés pour les instructions, avec la communauté plus large de la modélisation du langage !”

Une architecture améliorée et un pré-entraînement optimisé

OLMo 2 est une nouvelle famille de modèles de langage de 7 et 13 milliards de paramètres, le premier a été entraîné sur environ 4,05 milliards de tokens tandis que le second l’a été sur un total de 5 000 milliards de tokens.

Les modifications architecturales principales apportées à OLMo incluent l’intégration de RMSNorm pour une meilleure stabilité et l’utilisation de plongements positionnels rotatifs.

AI2 a utilisé une approche en 2 étapes. Pour la 1ère, les modèles ont été pré-entraînés avec OLMo-Mix-1124, une collection d’environ 3,9 milliards de jetons. Les modèles ont, dans un second temps, été affinés avec un mélange composé à part égale de données web filtrées et de données spécifiques à un domaine (contenu académique, forums de questions-réponses, données d’instructions et cahiers d’exercices mathématiques, à la fois synthétiques et générés par l’homme) provenant de Dolmino-Mix-1124. L’Institut a ensuite échantillonné les 843 milliards de tokens obtenus pour optimiser leurs performances lors des étapes finales d’entraînement.

Performance et comparaison de OLMo 2

Selon les évaluations d’AI2, OLMo 2 7B et 13B sont les meilleurs modèles entièrement ouverts à ce jour, surpassant souvent les modèles de “poids ouverts” de taille équivalente, tout en égalant voire dépassant certains modèles partiellement propriétaires. Par exemple, OLMo-2-7B surpasse Llama 3.1 8B de Meta tandis qu’OLMo-2-13B dépasse Qwen 2.5 7B d’Alibaba Cloud malgré un coût de calcul moindre.

AI2 a utilisé Tülu 3, sa famille de modèles de suivi d’instructions, pour les variantes Instruct d’OLMo 2. Celles-ci ont été évaluées sur leurs capacités de suivi d’instructions, de rappel des connaissances, de mathématiques et de raisonnement général. Elles se sont révélées compétitives avec les meilleurs modèles à poids ouverts, OLMo 2 13B Instruct surpassant les modèles Qwen 2.5 14B instruct, Tülu 3 8B et Llama 3.1 8B instruct.

Recherche sur les LLMs
  • ✇ActuIA
  • E-commerce et expérience client : les Français misent sur l’IA pour leurs achats de fin d’année
    Une récente étude menée par Zendesk et YouGov révèle que 25 % des consommateurs français prévoient d’utiliser l’IA durant ce week-end du Black Friday et pour leurs achats de fin d’année. Cette tendance souligne l’importance croissante de l’IA dans l’amélioration de l’expérience d’achat, une priorité pour les entreprises, qui doivent répondre aux attentes croissantes des consommateurs tout en faisant face à une concurrence de plus en plus intense. Selon l’étude, 44 % des consommateurs français ut

E-commerce et expérience client : les Français misent sur l’IA pour leurs achats de fin d’année

29 novembre 2024 à 09:40

Une récente étude menée par Zendesk et YouGov révèle que 25 % des consommateurs français prévoient d’utiliser l’IA durant ce week-end du Black Friday et pour leurs achats de fin d’année. Cette tendance souligne l’importance croissante de l’IA dans l’amélioration de l’expérience d’achat, une priorité pour les entreprises, qui doivent répondre aux attentes croissantes des consommateurs tout en faisant face à une concurrence de plus en plus intense.

Selon l’étude, 44 % des consommateurs français utilisent l’IA principalement pour trouver les meilleures offres en ligne, 54 % pour obtenir des réponses rapides via les chatbots, évitant ainsi les longues attentes, particulièrement pendant les périodes de forte affluence comme les fêtes de fin d’année.

L’IA et la confiance des consommateurs

Un élément essentiel pour que l’IA devienne un levier de fidélisation réside dans la capacité des commerçants à bâtir une relation de confiance. Si l’étude révèle que 38 % des acheteurs français sont susceptibles de revenir vers un commerçant après une expérience positive avec un agent conversationnel, elle montre également que près de la moitié des consommateurs réticents à l’utilisation de l’IA préfère l’assistance humaine (45 %) et doute de la capacité de l’IA à résoudre des problèmes techniques complexes (48 %). D’autre part, plus de 50 % des consommateurs restent préoccupés par la confidentialité et la sécurité des données communiquées aux agents conversationnels.

Pour surmonter ces obstacles, les entreprises doivent réfléchir à une stratégie d’intégration axée sur la personnalisation de l’expérience client, mais celle-ci doit également prendre en compte les préoccupations existantes afin de rassurer les consommateurs.

Michael Chaouat, VP South EMEA chez Zendesk, commente :

“Nous approchons d’un tournant majeur dans la vente au détail en ligne, avec 80 % des interactions avec les clients qui devraient être gérées par l’IA d’ici cinq ans. Les entreprises capables d’exploiter le potentiel de l’IA pour offrir des expériences personnalisées et attrayantes à cette clientèle connectée bénéficieront d’un avantage concurrentiel significatif.

Cependant, la confiance reste un facteur clé, et une stratégie d’IA réussie doit s’assurer que les réponses sont pertinentes tout en intégrant la dimension humaine, et en accordant une attention particulière à la sécurité des données. Ces points de vigilance sont essentiels pour encourager l’utilisation de l’IA par tous les consommateurs”. 

Les jeunes générations comme moteur du changement

Les générations Z (18-24 ans) jouent un rôle crucial dans l’adoption de l’IA en tant qu’outil de shopping en France : 34 % des consommateurs de cette génération effectuent des achats en ligne au moins une fois par semaine, et 44 % d’entre eux sont prêts à revenir vers une marque si leur expérience avec l’IA a été positive.

Dans les autres pays étudiés, ce sont les 35-54 ans qui poussent la vente en ligne. Les Français de cette tranche d’âge, restent, quant à eux, attachés à l’expérience physique.

Les commerçants peuvent profiter de l’appétence des jeunes générations pour l’IA, leur proposer des offres personnalisées et des recommandations basées sur leurs comportements d’achat. En intégrant l’IA de manière stratégique et sécurisée, ils peuvent non seulement améliorer l’expérience d’achat, mais aussi fidéliser une clientèle connectée et exigeante.

E-commerce et expérience client : les Français misent sur l'IA pour leurs achats de fin d'année
  • ✇ActuIA
  • La Fondation Eclipse et l’OSI s’associent pour façonner l’avenir de l’IA open source
    La Fondation Eclipse, l’une des plus grandes fondations open source au monde, et l’Open Source Initiative (OSI), ont signé la semaine dernière un protocole d’accord (MoU) pour promouvoir l’intérêt de la communauté open source dans la mise en œuvre d’initiatives réglementaires sur l’intelligence artificielle open source (OSAI). L’OSI, une organisation californienne à but non-lucratif créée en 1998, qui défend et éduque sur les avantages de l’open source, a récemment publié la première définition

La Fondation Eclipse et l’OSI s’associent pour façonner l’avenir de l’IA open source

21 novembre 2024 à 14:00

La Fondation Eclipse, l’une des plus grandes fondations open source au monde, et l’Open Source Initiative (OSI), ont signé la semaine dernière un protocole d’accord (MoU) pour promouvoir l’intérêt de la communauté open source dans la mise en œuvre d’initiatives réglementaires sur l’intelligence artificielle open source (OSAI).

L’OSI, une organisation californienne à but non-lucratif créée en 1998, qui défend et éduque sur les avantages de l’open source, a récemment publié la première définition officielle de l’IA open source, l’OSAID. L’Eclipse Foundation a été l’une des premières à soutenir cette version.

Alors que les réglementations sur l’IA se multiplient, leur partenariat vise à ce qu’elles s’alignent sur cette définition et les valeurs de l’open source. La Fondation Eclipse et l’OSI s’efforceront d’apporter de la clarté dans le langage et les termes sur lesquels l’industrie, la communauté, la société civile et les décideurs peuvent se baser pour élaborer et appliquer les politiques publiques. Elles tireront parti de leurs plateformes et événements publics respectifs pour sensibiliser le public sur le sujet.

Stefano Maffulli, directeur exécutif de l’OSI, explique :

“L’IA est sans doute la technologie la plus transformatrice de notre génération. Le défi est maintenant d’élaborer des politiques qui non seulement favorisent la croissance de l’IA, mais garantissent que l’IA Open Source prospère dans ce paysage en évolution. Le partenariat avec la Fondation Eclipse et son expertise, combinée à son expérience en matière de développement open source en Europe et de conformité réglementaire, est important pour façonner l’avenir de l’IA Open Source”.

Objectifs et actions

Le mémorandum d’accord définit plusieurs domaines de coopération, notamment :

  • Échange d’Information : L’OSI et la Fondation Eclipse partageront des informations et des points de vue pertinents sur l’élaboration des politiques publiques et les activités réglementaires en matière d’intelligence artificielle ;
  • Représentation aux décideurs : OSI et la Fondation Eclipse coopéreront pour représenter les principes et les valeurs des licences open source auprès des décideurs politiques et des organisations de la société civile ;
  • Promotion des principes Open Source : Des efforts conjoints seront déployés pour sensibiliser le public au rôle de l’open source dans l’IA, en soulignant comment elle peut favoriser l’innovation tout en atténuant les risques.

Un partenariat pour l’avenir

Pour l’OSI et la Fondation Eclipse, l’évolution rapide des technologies de l’IA, ainsi que les nouveaux paysages réglementaires complexes à venir, exigent des orientations claires, cohérentes, alignées et enracinées dans les principes de l’open source. Les deux organisations s’engagent à fournir à la communauté open source, aux leaders de l’industrie et aux décideurs les outils et les connaissances dont ils ont besoin pour naviguer dans ce domaine en évolution rapide.

Ce protocole d’accord marque le début d’une collaboration à long terme, de nouvelles initiatives et activités conjointes seront prochainement annoncées.

La Fondation Eclipse et l'OSI s'associent pour façonner l'avenir de l'IA open source
❌
❌