Après avoir publié en décembre dernier sa famille de modèles OLMO 2, l’Allen Institute for Artificial Intelligence (AI2) poursuit son engagement envers l’open source avec le lancement de Tülu 3 405B. Basé sur Llama 3.1, exploitant le cadre d’apprentissage par renforcement à partir de récompenses vérifiables (RLVR) d’AI2, ce nouveau modèle atteint des performances compétitives ou supérieures à celles de DeepSeek V3 (sur lequel est basé DeepSeek R1) et GPT-4o, surpassant également les modèles post
Après avoir publié en décembre dernier sa famille de modèles OLMO 2, l’Allen Institute for Artificial Intelligence (AI2) poursuit son engagement envers l’open source avec le lancement de Tülu 3 405B. Basé sur Llama 3.1, exploitant le cadre d’apprentissage par renforcement à partir de récompenses vérifiables (RLVR) d’AI2, ce nouveau modèle atteint des performances compétitives ou supérieures à celles de DeepSeek V3 (sur lequel est basé DeepSeek R1) et GPT-4o, surpassant également les modèles post-entraînés précédents de même taille, comme Llama 3.1 405B Instruct et Hermes 3 405B de Nous Research.
Un post entraînement optimisé
La recette de post-entraînement de Tülu 3 405B est similaire à celle de ses prédécesseurs, Tülu 3 8B et 70B, publés par AI2 en novembre dernier. Elle inclut la curation minutieuse des données, la mise au point supervisée (SFT), l’optimisation directe des préférences (DPO) ainsi que le Reinforcement Learning with Verifiable Rewards (RLVR).
Crédit image AI. Schéma décrivant le processus d’apprentissage par renforcement avec récompenses vérifiables (RLVR).
Cette nouvelle méthode permet d’améliorer significativement les performances des modèles Tülu sur des tâches complexes comme la résolution de problèmes mathématiques et le suivi d’instructions. Fait intéressant, les résultats montrent que l’échelle du modèle influence positivement l’efficacité du RLVR : alors que les modèles plus petits bénéficient d’un entraînement sur des ensembles de données diversifiés, Tülu 3 405B obtient de meilleures performances en se concentrant sur des données plus spécialisées.
Performances du modèle
Selon les évaluations internes d’AI2, Tülu 3 405B surpasse DeepSeek V3, GPT-4o, et Llama 3.1 405B sur le benchmark PopQA, un ensemble de 14 000 paires de questions-réponses qui permet de vérifier l’efficacité des modèles dans la récupération et la génération d’informations précises. Le modèle a également obtenu les performances les plus élevées de tous les modèles de sa catégorie sur GSM8K, un ensemble de données composé d’environ 8 500 problèmes mathématiques de niveau scolaire créé par OpenAI, utilisé pour tester les capacités des modèles de langage à effectuer un raisonnement mathématique multi-étapes.
Enjeux techniques et défis d’implémentation
La mise à l’échelle du modèle n’a pas été sans défis. L’entraînement de Tülu 3 405B a nécessité une infrastructure considérable, avec 256 GPU déployés en parallèle. La gestion du parallélisme tensoriel et l’optimisation des hyperparamètres ont été des points clés, nécessitant un suivi rigoureux. L’’intégration de corrections pour la diffusion NCCL (NVIDIA Collective Communications Library, une bibliothèque open source qui permet de réduire les goulots d’étranglement liés aux échanges de données et améliore les performances globales du système) a cependant permis une synchronisation efficace des poids du modèle, réduisant ainsi les délais d’inférence et de mise à jour.
Tülu 3 405B est un modèle véritablement ouvert, répondant aux critères stricts de l’OSAID, la définition de l’IA open source de l’OSI. Il peut être testé sur le site d’Ai2, est accessible sur Hugging Face et son code d’entraînement sur GitHub.
Hébergé sur Google Cloud, le modèle sera prochainement disponible sur Vertex AI.
En fin de semaine dernière, alors que tout le monde avait les yeux rivés sur DeepSeek et son modèle R1, Mistral AI, licorne française de la GenAI, a lancé plus discrètement Mistral Small 3. Publié sous la licence Apache 2.0, ce modèle de 24 milliards de paramètres optimisé pour la latence est “une excellente alternative open source aux modèles propriétaires opaques comme GPT4o-mini” selon elle.
Avec Small 3, la licorne, démontre une fois de plus que pour être performant, un LLM ne requiert pas u
En fin de semaine dernière, alors que tout le monde avait les yeux rivés sur DeepSeek et son modèle R1, Mistral AI, licorne française de la GenAI, a lancé plus discrètement Mistral Small 3. Publié sous la licence Apache 2.0, ce modèle de 24 milliards de paramètres optimisé pour la latence est “une excellente alternative open source aux modèles propriétaires opaques comme GPT4o-mini” selon elle.
Avec Small 3, la licorne, démontre une fois de plus que pour être performant, un LLM ne requiert pas un nombre astronomique de paramètres. Le modèle se positionne comme une réponse aux besoins croissants d’efficacité en offrant un taux de traitement de 150 tokens par seconde, tout en affichant une précision de plus de 81 % sur le benchmark MMLU.
Cette prouesse technique est rendue possible grâce à une architecture optimisée qui réduit le nombre de couches traditionnelles, diminuant ainsi le temps de passage avant (forward pass time, ou temps nécessaire à un modèle de réseau de neurones pour traiter une entrée et produise une sortie) sans compromettre la qualité des réponses.
Ce choix architectural, qui en fait “actuellement le modèle le plus efficace de sa catégorie”, permet à la version optimisée, Mistral Small 3 Instruct, de rivaliser avec des modèles bien plus imposants comme Llama 3.3 70B ou Qwen 32B, tout en garantissant une exécution rapide et efficace sur du matériel standard.
Des applications pour divers secteurs
Le Mistral Small 3 ne se contente pas d’afficher des performances techniques remarquables : il s’inscrit également dans une logique d’adaptabilité aux besoins concrets des entreprises. Parmi les cas d’usage envisagés, plusieurs domaines se démarquent :
Assistance conversationnelle et appels de fonction : la faible latence garantit des interactions en temps réel, essentielles pour les chatbots ou assistants virtuels ;
Fine-tuning pour des expertises spécifiques : sa taille modeste facilite l’ajustement fin pour des domaines précis, comme le diagnostic médical ou le conseil juridique ;
Inférence locale : la possibilité de déployer le modèle sur du matériel accessible favorise l’usage dans des secteurs où les données sensibles nécessitent un traitement en local.
Comme les “Ministraux”, Small 3 répond également aux besoins croissants de calcul local et de protection de la vie privée : la possibilité de le déployer sur des configurations matérielles accessibles, comme une RTX 4090 ou un MacBook avec 32 Go de RAM, offre aux organisations le contrôle sur leurs données sensibles sans dépendance à une infrastructure cloud centralisée.
Une stratégie de diffusion ouverte et collaborative
Selon Mistral AI, faisant référence aux derniers modèles de DeepSeek, et au projet Open-R1,”Ce furent des jours passionnants pour la communauté open source ! Mistral Small 3 complète les grands modèles de raisonnement open source comme les récentes versions de DeepSeek, et peut servir de modèle de base solide pour faire émerger des capacités de raisonnement”.
L’entreprise a fait le choix de le publier sous la licence Apache 2.0, faisant le choix d’abandonner peu à peu sa licence plus restrictive MRL pour les modèles à usage général. Elle annonce d’ores et déjà “des modèles Mistral petits et grands avec des capacités de raisonnement améliorées dans les semaines à venir”.
Actuellement disponible sur les plateformes Hugging Face, Ollama, Kaggle, Together AI et Fireworks AI, Mistral Small 3 le sera également bientôt sur NVIDIA NIM, Amazon SageMaker, Groq, Databricks et Snowflake.
Dix jours après son lancement, DeepSeek R1, qui a suscité l’émoi de la Silicon Valley et perturbé le marché de Wall Street, continue d’alimenter la une des médias internationaux. L’entreprise éponyme qui dit l’avoir mis open source pour soutenir la communauté IA n’a cependant pas révélé tous les éléments qui lui ont permis de développer ce modèle, notamment les ensembles de données et le code d’entraînement. Hugging Face, loin des polémiques, lance le projet Open-R1 et propose à la communauté de
Dix jours après son lancement, DeepSeek R1, qui a suscité l’émoi de la Silicon Valley et perturbé le marché de Wall Street, continue d’alimenter la une des médias internationaux. L’entreprise éponyme qui dit l’avoir mis open source pour soutenir la communauté IA n’a cependant pas révélé tous les éléments qui lui ont permis de développer ce modèle, notamment les ensembles de données et le code d’entraînement. Hugging Face, loin des polémiques, lance le projet Open-R1 et propose à la communauté de l’aider à construire les pièces manquantes du pipeline R1.
Mené par Leandro von Werra, directeur de la recherche chez Hugging Face, Elie Bakouch et Lewis Tunstall, le projet Open-R1 se veut un exemple de transparence et de partage des connaissances, permettant à chacun de contribuer et d’améliorer le modèle pour des applications variées, allant de la médecine à l’éducation, en passant par la recherche fondamentale.
Ils expliquent le but de leur démarche dans un blog :
“Le projet Open-R1 est une initiative visant à reconstruire systématiquement le pipeline de données et de formation de DeepSeek-R1, à valider ses affirmations et à repousser les limites des modèles de raisonnement ouvert. En créant Open-R1, nous visons à fournir de la transparence sur la façon dont l’apprentissage par renforcement peut améliorer le raisonnement, partager des informations reproductibles avec la communauté open source et créer une base pour de futurs modèles permettant d’exploiter ces techniques.”
Un plan en trois étapes
Pour les trois hommes, “la sortie de DeepSeek-R1 est une aubaine incroyable pour la communauté”.
DeepSeek-R1 est un modèle de raisonnement construit sur la base de DeepSeek-V3, présenté par la start-up chinoise fin décembre dernier, dont les performances sont comparables, à celles de principaux modèles à source fermée, comme GPT-4o ou Claude 3.5 Sonnet, et ce, malgré un coût d’entraînement nettement inférieur.
Le modèle compte 2 versions : DeepSeek-R1-Zero, entraîné par apprentissage par renforcement (RL) sans réglage fin supervisé (SFT), a montré de solides performances. Cependant, il présente des défis tels que la répétition sans fin et la mauvaise lisibilité. Pour résoudre ces problèmes, DeepSeek-R1 intègre des données de démarrage à froid avant l’application du RL et de plusieurs étapes de raffinement qui rejettent les résultats de mauvaise qualité et produisent des réponses polies et cohérentes.
DeepSeek a mis ces 2 versions et six modèles denses distillés à partir de DeepSeek-R1 basés sur Llama et Qwen à la disposition de la communauté.
Les chercheurs de Hugging Face proposent à ceux qui voudront contribuer au projet de les aider à :
Étape 1 : Répliquer les modèles R1-Distill en distillant un ensemble de données de raisonnement de haute qualité à partir de DeepSeek-R1.
Étape 2 : Répliquer le pipeline RL pur que DeepSeek a utilisé pour créer R1-Zero. Cela impliquera la conservation de nouveaux ensembles de données à grande échelle pour les mathématiques, le raisonnement et le code.
Étape 3 : Montrer qu’il est possible de passer du modèle de base → SFT (Supervised Fine-Tuning)→ RL via une formation en plusieurs étapes.
Les chercheurs d’Hugging Face concluent :
“Cette initiative ne consiste pas seulement à reproduire les résultats, mais aussi à partager des idées avec la communauté. En documentant ce qui fonctionne, ce qui ne fonctionne pas et pourquoi, nous espérons éviter à d’autres de perdre du temps et de calculer sur des chemins improductifs.”
Le projet, hébergé sur GitHub, compte plus de 12 000 étoiles, ce qui démontre l’intérêt qu’il suscite.
Les chercheurs de Hugging Face invitent la communauté open source à contribuer au projet Open-R1
L’avancement des LLMs repose souvent sur leur capacité à traiter des volumes croissants de données dans des contextes plus longs et plus complexes. Avec le lancement des modèles open source Qwen2.5-7B-Instruct-1M et Qwen2.5-14B-Instruct-1M, l’équipe Qwen d’Alibaba Cloud place la barre très haut.
Pour permettre aux développeurs de déployer plus efficacement les modèles de la série Qwen2.5-1M, ceux-ci sont accompagnés d’un cadre d’inférence innovant, intégrant une méthode d’extrapolation de longu
L’avancement des LLMs repose souvent sur leur capacité à traiter des volumes croissants de données dans des contextes plus longs et plus complexes. Avec le lancement des modèles open source Qwen2.5-7B-Instruct-1M et Qwen2.5-14B-Instruct-1M, l’équipe Qwen d’Alibaba Cloud place la barre très haut.
Pour permettre aux développeurs de déployer plus efficacement les modèles de la série Qwen2.5-1M, ceux-ci sont accompagnés d’un cadre d’inférence innovant, intégrant une méthode d’extrapolation de longueur et une méthode d’attention clairsemée, visant à réduire les coûts d’inférence et à améliorer la précision.
Les avancées techniques de Qwen2.5-1M
L’entraînement avec des séquences aussi longues représente un défi monumental en termes de calcul. L’équipe Qwen a adopté une approche progressive :
Augmentation graduelle : les modèles passent de 4K à 256K jetons au pré-entraînement, grâce à l’ajustement de la fréquence de base RoPE ;
Fine-tuning supervisé : une stratégie en deux étapes combine des instructions courtes (32K jetons) et longues (jusqu’à 256K jetons), garantissant une performance équilibrée ;
Extrapolation à 1 M : l’intégration de l’attention à double bloc (DCA) permet de gérer des distances de position relative invisibles pendant l’entraînement classique, tout en évitant une dégradation des performances.
Optimisations de l’inférence
Les besoins matériels pour traiter des contextes longs sont élevés, mais l’attention clairsemée et d’autres améliorations ont permis de réduire ces contraintes :
Chunked Prefill : cette méthode divise les séquences en blocs pour diminuer l’utilisation de la mémoire vive (VRAM) d’activation jusqu’à 96,7 % ;
Optimisation du parallélisme : une meilleure gestion des ressources GPU assure une exécution fluide même sur des dispositifs limités ;
Efficacité accrue : ces optimisations aboutissent à une augmentation de la vitesse de traitement, qui peut être jusqu’à 6,7 fois supérieures à celle des modèles classiques.
Performances de la famille de modèles Qwen2.5-1M
Tâches à contexte long
La série Qwen2.5-1M comprend actuellement les modèles open source Qwen2.5-7B-Instruct-1M et Qwen2.5-14B-Instruct-1M, ainsi que le modèle accessible via API Qwen2.5-Turbo, qui alimente désormais Qwen Chat.
Les modèles Qwen2.5-1M excellent sur des benchmarks complexes comme RULER, LV-Eval et LongBenchChat, souvent utilisés pour tester la compréhension de longs contextes, où ils surpassent leurs homologues 128K dans la plupart des tâches à contexte long, en particulier pour les séquences de plus de 64 Ko.
Le modèle 14B-Instruct-1M surpasse non seulement Qwen2.5-Turbo, mais aussi des modèles concurrents comme GPT-4o-mini, offrant une alternative open-source robuste pour les tâches à contexte long.
Évalués sur la tâche Passkey Retrieval, leurs résultats démontrent qu’ils peuvent récupérer avec précision des informations cachées dans des documents contenant jusqu’à 1 million de jetons, avec seulement des erreurs mineures observées dans le modèle 7B.
Tâches à contexte court
L’équipe a comparé les performances des modèles Qwen2.5-1M sur des séquences courtes par rapport à celles de leurs versions 128K et de GPT-4o-mini. Ils ont constaté que les versions 1M sont aussi précises que leurs homologues 128K sur des tâches classiques et qu’avec une longueur de contexte huit fois supérieure à celle de GPT-4o-mini, les modèles Qwen2.5-14B-Instruct-1M et Qwen2.5-Turbo atteignent des performances similaires au modèle d’OpenAI.
Le lancement de Qwen2.5-1M marque un tournant pour les modèles à contexte long, repoussant les limites techniques tout en élargissant le champ des possibles pour les applications qui nécessitent un traitement contextuel étendu telles que l’analyse juridique ou la gestion documentaire.
Pour plus d’informations sur les modèles, cliquer ici.
Alibaba, l'équipe Qwen annonce l'ajout de deux nouveaux modèles open source
Une récente étude menée par Morning Consult en collaboration avec Lopez Research pour IBM auprès de plus de 2 400 décideurs informatiques, révèle que les entreprises, en quête de rentabilité et d’innovation, se tournent de plus en plus vers des solutions d’IA basées sur l’open source. Une évolution qui pourrait redéfinir la manière dont elles conçoivent et gèrent leurs stratégies d’IA.
Selon l’étude, 85 % des décideurs IT à l’échelle mondiale rapportent des progrès dans la mise en œuvre de leur
Une récente étude menée par Morning Consult en collaboration avec Lopez Research pour IBM auprès de plus de 2 400 décideurs informatiques, révèle que les entreprises, en quête de rentabilité et d’innovation, se tournent de plus en plus vers des solutions d’IA basées sur l’open source. Une évolution qui pourrait redéfinir la manière dont elles conçoivent et gèrent leurs stratégies d’IA.
Selon l’étude, 85 % des décideurs IT à l’échelle mondiale rapportent des progrès dans la mise en œuvre de leurs stratégies IA pour 2024, tandis que 47 % d’entre eux observent déjà un retour sur investissement (ROI) positif. En France, ces chiffres chutent respectivement à 77 % et 29 %.
Thomas Dognin, AI Market Sales Leader – Data & AI, IBM France, explique ces résultats :
“Concernant les activités autour des sujets d’IA l’an dernier, les entreprises en France ont lancé beaucoup d’initiatives autour de l’IA, mais plutôt à destination des employés, et moins pour l’entreprise avec l’automatisation des processus métier. Or, ce sont justement ces cas d’usages qui apportent le ROI attendu.”
L’open source : un accélérateur de rentabilité ?
Six responsables informatiques interrogés sur 10 au niveau mondial déclarent utiliser des écosystèmes open source comme source d’outils d’IA. Plus de 80 % (84 % en France) affirment qu’au moins un quart des solutions ou plateformes d’IA de leur entreprise sont basées sur l’open source.
L’open source semble être un élément différenciateur. Parmi les entreprises ayant adopté des outils d’IA open source, 51 % rapportent un ROI positif, contre 41 % pour celles qui ne les utilisent pas.
En outre, l’open source favorise une multiplication des projets pilotes : 38 % des entreprises utilisant ces écosystèmes prévoient de lancer plus de 21 projets pilotes en 2025, contre seulement 26 % pour celles qui ne s’appuient pas sur ces outils.
En France, bien que 41 % des entreprises prévoient de s’appuyer davantage sur l’open source en 2025 pour optimiser leurs mises en œuvre de l’IA, cette adoption reste inférieure à la moyenne mondiale de 48 %.
Une vision à long terme : quels indicateurs de succès ?
L’étude met également en lumière un écart entre les attentes en matière de ROI et les indicateurs réellement utilisés pour évaluer le succès des projets d’IA. Si le ROI financier traditionnel reste un objectif, il est souvent supplanté par des indicateurs comme :
Les gains de productivité (22 % des réponses au niveau mondial) ;
L’accélération de l’innovation (23 %) ;
La rapidité du développement logiciel (25 %).
Pour 2025, l’étude prévoit une augmentation générale des investissements dans l’IA. Près de 62 % des entreprises mondiales et 41 % en France comptent accroître leurs dépenses. Parmi les priorités stratégiques, l’adoption des services cloud managés (51 %), le recrutement de talents spécialisés (48 %) et l’utilisation de l’open source (48 %) se distinguent.
Maribel Lopez de Lopez Research commente :
“Alors que les entreprises commencent à mettre en œuvre l’IA à grande échelle, nombre d’entre elles accordent plus d’importance aux indicateurs de réussite tels que les gains de productivité, en partie parce que les avantages traditionnels du retour sur investissement en dollars n’apparaissent pas encore dans les bilans. Pourtant, les entreprises continuent de faire progresser rapidement leurs stratégies d’IA, sans aucun signe de ralentissement. Les entreprises reconnaissent désormais la valeur de la définition de cas d’usage spécifiques et de l’optimisation des projets d’IA. Elles s’appuient sur des stratégies de Cloud hybride et d’open source pour stimuler l’innovation en matière d’IA et obtenir des retours financiers”.
Alibaba International, division du groupe Alibaba spécialisée dans le e-commerce, a annoncé ce lundi 6 janvier que son moteur de recherche B2B alimenté par l’IA, Accio, a atteint 500 000 utilisateurs PME depuis son lancement en novembre 2024. Une adoption rapide qui consolide la position de la plateforme chinoise de commerce B2B au niveau mondial.
Des millions de fournisseurs et une recherche optimisée
Accio utilise des techniques avancées de traitement du langage naturel (NLP) pour rendre le pr
Alibaba International, division du groupe Alibaba spécialisée dans le e-commerce, a annoncé ce lundi 6 janvier que son moteur de recherche B2B alimenté par l’IA, Accio, a atteint 500 000 utilisateurs PME depuis son lancement en novembre 2024. Une adoption rapide qui consolide la position de la plateforme chinoise de commerce B2B au niveau mondial.
Des millions de fournisseurs et une recherche optimisée
Accio utilise des techniques avancées de traitement du langage naturel (NLP) pour rendre le processus de recherche plus intuitif et efficace. Le moteur de recherche connecte les acheteurs aux fournisseurs parmi des millions de profils répertoriés. En couvrant plus de 7 600 catégories de produits et en s’appuyant sur plus de 200 millions de paramètres liés au commerce mondial, Accio facilite la transformation des concepts de produits en projets commerciaux viables.
Les utilisateurs peuvent comparer des millions de produits en termes de prix, de quantités minimales de commandes, de frais d’expédition et de délais de livraison, obtenant ainsi une transparence sans précédent dans le processus de sourcing.
L’une de ses fonctionnalités clés, Accio Inspiration, a permis d’augmenter de près de 30 % les taux de conversion des fournisseurs, de la recherche initiale à la demande de devis.
Une performance impressionnante pendant les fêtes de fin d’année
Pendant la période critique des ventes en ligne en novembre et décembre 2024, plus de 50 000 PME ont utilisé activement le moteur pour trouver des produits et des inspirations pour le Black Friday et les fêtes de Noël.
Leurs retours démontrent l’efficacité du moteur de recherche qui détient, selon les données collectées le mois dernier, un Net Promoter Score (NPS) supérieur à 50, preuve d’un taux de satisfaction client élevé et d’une adéquation avec le marché. Le 13 décembre 2024, Accio a d’ailleurs été nommé “Produit du jour” sur Product Hunt, un site qui répertorie les nouveaux produits technologiques.
L’IA au service de la compétitivité des PME
Le lancement d’Accio s’inscrit dans une époque charnière pour le développement des outils d’IA et l’expansion du commerce B2B.
En remplaçant les recherches traditionnelles par mots-clés par des recherches en langage naturel, il rend les processus de sourcing plus rapides et précis, permettant aux PME de gagner en efficacité tout en réduisant les coûts. Actuellement, il prend en charge l’anglais, le français, l’allemand, le portugais et l’espagnol, et d’autres langues sont prévues pour les futures mises à jour.
Deux fonctionnalités renforcent son attractivité :
Accio Page : Une interface dynamique qui propose des informations produites dans un langage dans un format familier et convivial. Elle fournit des détails objectifs sur les produits et des comparaisons avec des articles similaires, ce qui permet aux entreprises de prendre facilement des décisions d’approvisionnement éclairées ;
Accio Agent : Un outil d’accompagnement pour la gestion des demandes, paiements et suivi après-vente, agissant comme un agent de sourcing professionnel grâce à l’infrastructure robuste d’Alibaba International.
le moteur de recherche IA d’Alibaba redéfinit le commerce B2B
Depuis l’émergence des grands modèles de langage (LLMs), certains ont été qualifiés d’“ouverts”, ce qui a pu prêter à confusion avec le terme “open source” lors de leur présentation. En février dernier, l’Allen Institute for Artificial Intelligence (Ai2), a publié la première version d’OLMo, (Open Language Model), un LLM qui répond aux critères stricts de l’OSAID, la définition de l’IA open source de l’OSI. Le modèle a depuis été mis à jour en avril et dernièrement avec OLMo 2 qu’il présente com
Depuis l’émergence des grands modèles de langage (LLMs), certains ont été qualifiés d’“ouverts”, ce qui a pu prêter à confusion avec le terme “open source” lors de leur présentation. En février dernier, l’Allen Institute for Artificial Intelligence (Ai2), a publié la première version d’OLMo, (Open Language Model), un LLM qui répond aux critères stricts de l’OSAID, la définition de l’IA open source de l’OSI. Le modèle a depuis été mis à jour en avril et dernièrement avec OLMo 2 qu’il présente comme “le meilleur modèle de langage entièrement ouvert à ce jour”.
AI2 est un institut de recherche à but non-lucratif fondé en 2014 par Paul Allen, philanthrope et cofondateur de Microsoft, décédé en 2018. Son objectif est de favoriser le développement de l’intelligence artificielle au service de la société, en mettant l’accent sur des applications responsables et éthiques. L’institut collabore avec des universités, des entreprises et d’autres institutions de recherche pour stimuler l’innovation dans ce domaine.
AI2 se concentre sur des domaines variés tels que la compréhension du langage naturel, la vision par ordinateur, l’apprentissage automatique et la robotique. Parmi ses contributions majeures, on trouve Semantic Scholar, un moteur de recherche avancé destiné à aider les chercheurs à accéder et à analyser des articles scientifiques, ainsi que AllenNLP, une bibliothèque open source dédiée au traitement du langage naturel.
OLMo 2
Dans le domaine de la GenAI, AI2 milite également pour l’open source. Après Molmo, une famille de modèles d’IA multimodaux, il présente OLMo2, sa dernière famille de modèles de langage.
Dans le cadre de la validation et de la mise à l’essai de l’OSAID, la première version d’OLMo a été considérée comme réellement open source tout comme Pythia (Eleuther AI), Amber et CrystalCoder (LLM360) et T5 (Google) contrairement à Llama de Meta ou Grok de xAI. OLMo 2 correspond lui aussi pleinement aux critères exigés.
AI2 écrit sur son blog :
“Parce que la science entièrement ouverte nécessite plus que des poids ouverts, nous sommes ravis de partager une nouvelle série de mises à jour d’OLMo, y compris des poids, des données, du code, des recettes, des points de contrôle intermédiaires et des modèles optimisés pour les instructions, avec la communauté plus large de la modélisation du langage !”
Une architecture améliorée et un pré-entraînement optimisé
OLMo 2 est une nouvelle famille de modèles de langage de 7 et 13 milliards de paramètres, le premier a été entraîné sur environ 4,05 milliards de tokens tandis que le second l’a été sur un total de 5 000 milliards de tokens.
Les modifications architecturales principales apportées à OLMo incluent l’intégration de RMSNorm pour une meilleure stabilité et l’utilisation de plongements positionnels rotatifs.
AI2 a utilisé une approche en 2 étapes. Pour la 1ère, les modèles ont été pré-entraînés avec OLMo-Mix-1124, une collection d’environ 3,9 milliards de jetons. Les modèles ont, dans un second temps, été affinés avec un mélange composé à part égale de données web filtrées et de données spécifiques à un domaine (contenu académique, forums de questions-réponses, données d’instructions et cahiers d’exercices mathématiques, à la fois synthétiques et générés par l’homme) provenant de Dolmino-Mix-1124. L’Institut a ensuite échantillonné les 843 milliards de tokens obtenus pour optimiser leurs performances lors des étapes finales d’entraînement.
Performance et comparaison de OLMo 2
Selon les évaluations d’AI2, OLMo 2 7B et 13B sont les meilleurs modèles entièrement ouverts à ce jour, surpassant souvent les modèles de “poids ouverts” de taille équivalente, tout en égalant voire dépassant certains modèles partiellement propriétaires. Par exemple, OLMo-2-7B surpasse Llama 3.1 8B de Meta tandis qu’OLMo-2-13B dépasse Qwen 2.5 7B d’Alibaba Cloud malgré un coût de calcul moindre.
AI2 a utilisé Tülu 3, sa famille de modèles de suivi d’instructions, pour les variantes Instruct d’OLMo 2. Celles-ci ont été évaluées sur leurs capacités de suivi d’instructions, de rappel des connaissances, de mathématiques et de raisonnement général. Elles se sont révélées compétitives avec les meilleurs modèles à poids ouverts, OLMo 2 13B Instruct surpassant les modèles Qwen 2.5 14B instruct, Tülu 3 8B et Llama 3.1 8B instruct.
Une récente étude menée par Zendesk et YouGov révèle que 25 % des consommateurs français prévoient d’utiliser l’IA durant ce week-end du Black Friday et pour leurs achats de fin d’année. Cette tendance souligne l’importance croissante de l’IA dans l’amélioration de l’expérience d’achat, une priorité pour les entreprises, qui doivent répondre aux attentes croissantes des consommateurs tout en faisant face à une concurrence de plus en plus intense.
Selon l’étude, 44 % des consommateurs français ut
Une récente étude menée par Zendesk et YouGov révèle que 25 % des consommateurs français prévoient d’utiliser l’IA durant ce week-end du Black Friday et pour leurs achats de fin d’année. Cette tendance souligne l’importance croissante de l’IA dans l’amélioration de l’expérience d’achat, une priorité pour les entreprises, qui doivent répondre aux attentes croissantes des consommateurs tout en faisant face à une concurrence de plus en plus intense.
Selon l’étude, 44 % des consommateurs français utilisent l’IA principalement pour trouver les meilleures offres en ligne, 54 % pour obtenir des réponses rapides via les chatbots, évitant ainsi les longues attentes, particulièrement pendant les périodes de forte affluence comme les fêtes de fin d’année.
L’IA et la confiance des consommateurs
Un élément essentiel pour que l’IA devienne un levier de fidélisation réside dans la capacité des commerçants à bâtir une relation de confiance. Si l’étude révèle que 38 % des acheteurs français sont susceptibles de revenir vers un commerçant après une expérience positive avec un agent conversationnel, elle montre également que près de la moitié des consommateurs réticents à l’utilisation de l’IA préfère l’assistance humaine (45 %) et doute de la capacité de l’IA à résoudre des problèmes techniques complexes (48 %). D’autre part, plus de 50 % des consommateurs restent préoccupés par la confidentialité et la sécurité des données communiquées aux agents conversationnels.
Pour surmonter ces obstacles, les entreprises doivent réfléchir à une stratégie d’intégration axée sur la personnalisation de l’expérience client, mais celle-ci doit également prendre en compte les préoccupations existantes afin de rassurer les consommateurs.
Michael Chaouat, VP South EMEA chez Zendesk, commente :
“Nous approchons d’un tournant majeur dans la vente au détail en ligne, avec 80 % des interactions avec les clients qui devraient être gérées par l’IA d’ici cinq ans. Les entreprises capables d’exploiter le potentiel de l’IA pour offrir des expériences personnalisées et attrayantes à cette clientèle connectée bénéficieront d’un avantage concurrentiel significatif.
Cependant, la confiance reste un facteur clé, et une stratégie d’IA réussie doit s’assurer que les réponses sont pertinentes tout en intégrant la dimension humaine, et en accordant une attention particulière à la sécurité des données. Ces points de vigilance sont essentiels pour encourager l’utilisation de l’IA par tous les consommateurs”.
Les jeunes générations comme moteur du changement
Les générations Z (18-24 ans) jouent un rôle crucial dans l’adoption de l’IA en tant qu’outil de shopping en France : 34 % des consommateurs de cette génération effectuent des achats en ligne au moins une fois par semaine, et 44 % d’entre eux sont prêts à revenir vers une marque si leur expérience avec l’IA a été positive.
Dans les autres pays étudiés, ce sont les 35-54 ans qui poussent la vente en ligne. Les Français de cette tranche d’âge, restent, quant à eux, attachés à l’expérience physique.
Les commerçants peuvent profiter de l’appétence des jeunes générations pour l’IA, leur proposer des offres personnalisées et des recommandations basées sur leurs comportements d’achat. En intégrant l’IA de manière stratégique et sécurisée, ils peuvent non seulement améliorer l’expérience d’achat, mais aussi fidéliser une clientèle connectée et exigeante.
E-commerce et expérience client : les Français misent sur l'IA pour leurs achats de fin d'année
La Fondation Eclipse, l’une des plus grandes fondations open source au monde, et l’Open Source Initiative (OSI), ont signé la semaine dernière un protocole d’accord (MoU) pour promouvoir l’intérêt de la communauté open source dans la mise en œuvre d’initiatives réglementaires sur l’intelligence artificielle open source (OSAI).
L’OSI, une organisation californienne à but non-lucratif créée en 1998, qui défend et éduque sur les avantages de l’open source, a récemment publié la première définition
La Fondation Eclipse, l’une des plus grandes fondations open source au monde, et l’Open Source Initiative (OSI), ont signé la semaine dernière un protocole d’accord (MoU) pour promouvoir l’intérêt de la communauté open source dans la mise en œuvre d’initiatives réglementaires sur l’intelligence artificielle open source (OSAI).
L’OSI, une organisation californienne à but non-lucratif créée en 1998, qui défend et éduque sur les avantages de l’open source, a récemment publié la première définition officielle de l’IA open source, l’OSAID. L’Eclipse Foundation a été l’une des premières à soutenir cette version.
Alors que les réglementations sur l’IA se multiplient, leur partenariat vise à ce qu’elles s’alignent sur cette définition et les valeurs de l’open source. La Fondation Eclipse et l’OSI s’efforceront d’apporter de la clarté dans le langage et les termes sur lesquels l’industrie, la communauté, la société civile et les décideurs peuvent se baser pour élaborer et appliquer les politiques publiques. Elles tireront parti de leurs plateformes et événements publics respectifs pour sensibiliser le public sur le sujet.
Stefano Maffulli, directeur exécutif de l’OSI, explique :
“L’IA est sans doute la technologie la plus transformatrice de notre génération. Le défi est maintenant d’élaborer des politiques qui non seulement favorisent la croissance de l’IA, mais garantissent que l’IA Open Source prospère dans ce paysage en évolution. Le partenariat avec la Fondation Eclipse et son expertise, combinée à son expérience en matière de développement open source en Europe et de conformité réglementaire, est important pour façonner l’avenir de l’IA Open Source”.
Objectifs et actions
Le mémorandum d’accord définit plusieurs domaines de coopération, notamment :
Échange d’Information : L’OSI et la Fondation Eclipse partageront des informations et des points de vue pertinents sur l’élaboration des politiques publiques et les activités réglementaires en matière d’intelligence artificielle ;
Représentation aux décideurs: OSI et la Fondation Eclipse coopéreront pour représenter les principes et les valeurs des licences open source auprès des décideurs politiques et des organisations de la société civile ;
Promotion des principes Open Source : Des efforts conjoints seront déployés pour sensibiliser le public au rôle de l’open source dans l’IA, en soulignant comment elle peut favoriser l’innovation tout en atténuant les risques.
Un partenariat pour l’avenir
Pour l’OSI et la Fondation Eclipse, l’évolution rapide des technologies de l’IA, ainsi que les nouveaux paysages réglementaires complexes à venir, exigent des orientations claires, cohérentes, alignées et enracinées dans les principes de l’open source. Les deux organisations s’engagent à fournir à la communauté open source, aux leaders de l’industrie et aux décideurs les outils et les connaissances dont ils ont besoin pour naviguer dans ce domaine en évolution rapide.
Ce protocole d’accord marque le début d’une collaboration à long terme, de nouvelles initiatives et activités conjointes seront prochainement annoncées.
La Fondation Eclipse et l'OSI s'associent pour façonner l'avenir de l'IA open source
Nick Clegg, président des Affaires mondiales de Meta, a annoncé le 4 novembre dernier que Meta a mis Llama à disposition des agences gouvernementales américaines et des entrepreneurs travaillant sur des applications de sécurité nationale. Alors que l’entreprise interdisait jusqu’à présent l’utilisation de son modèle à des fins militaires, sa nature open source permet à quiconque d’accéder et de modifier le modèle, une opportunité que la Chine a rapidement saisie.
Selon Nick Clegg, “Meta veut jou
Nick Clegg, président des Affaires mondiales de Meta, a annoncé le 4 novembre dernier que Meta a mis Llama à disposition des agences gouvernementales américaines et des entrepreneurs travaillant sur des applications de sécurité nationale. Alors que l’entreprise interdisait jusqu’à présent l’utilisation de son modèle à des fins militaires, sa nature open source permet à quiconque d’accéder et de modifier le modèle, une opportunité que la Chine a rapidement saisie.
Selon Nick Clegg, “Meta veut jouer son rôle pour soutenir la sûreté, la sécurité et la prospérité économique de l’Amérique, et de ses alliés les plus proches”. Il met en avant dans son blog les atouts de l’IA open source pour renforcer la position des États-Unis dans la course mondiale à l’IA, notamment dans les domaines de la sécurité nationale et de l’efficacité du secteur public, soulignant :
“Nous pensons qu’il est dans l’intérêt de l’Amérique et du monde démocratique au sens large que les modèles open source américains excellent et réussissent par rapport aux modèles de Chine et d’ailleurs”.
Un soutien massif aux agences de sécurité nationale américaines
Meta s’est associé avec un éventail de partenaires influents, tels qu’Amazon Web Services, Oracle, Microsoft, et des entreprises de défense comme Lockheed Martin, pour intégrer Llama dans divers projets destinés à renforcer la sécurité et la défense des États-Unis. Parmi les applications spécifiques, Oracle utilise Llama pour faciliter la maintenance des avions militaires, améliorant ainsi l’efficacité des techniciens grâce à des outils de diagnostic plus performants et rapides. De son côté, Scale AI travaille à adapter Llama pour la planification stratégique et l’évaluation des vulnérabilités dans des missions de sécurité nationale.
L’usage militaire de Llama par la Chine : une course à l’IA qui s’accélère
Des chercheurs de la République populaire de Chine ont affiné Llama 13B pour développer un chatbot militaire afin d’assister les analystes et les officiers dans des tâches stratégiques complexes. Ce chatbot, qui a été utilisé pour traiter des données de renseignement pourrait améliorer les communications cryptées entre les troupes et soutenir des simulations de scénarios de guerre, marquant ainsi une application offensive de l’IA open source.
Mais pour Meta, le rôle présumé d’une version antérieure et désormais obsolète d’un modèle open source américain n’est pas pertinent alors que la Chine investit massivement dans sa tentative de s’imposer comme leader de l’IA.
Cependant, l’utilisation de Llama par la Chine soulève des questions importantes : dans quelle mesure les États-Unis et leurs alliés pourront-ils continuer de promouvoir des technologies ouvertes, tout en préservant leur sécurité nationale face à des applications militaires adverses ?
Pour les États-Unis, la mise à disposition de Llama dans un cadre contrôlé permet d’utiliser la technologie tout en limitant les risques, et en formant un réseau public-privé pour anticiper les menaces potentielles. En Chine, l’utilisation de Llama pourrait accélérer l’automatisation militaire, avec des modèles capables d’assister les commandements en temps réel.
Open source et sécurité mondiale : Meta met Llama à disposition des agences gouvernementales américaines
A l’occasion de All Things Open 2024, l’un des événements les plus importants de l’industrie open source en Amérique du Nord, l’Open Source Initiative (OSI) a annoncé la publication de la première définition officielle de l’IA open source, l’OSAID.
Des modèles comme Gemma de Google sont souvent qualifiés de modèles “ouverts”, ce qui peut prêter à confusion avec le terme “open source” lors de leur présentation. Bien que tous les modèles open source soient ouverts, tous les modèles ouverts ne répo
A l’occasion de All Things Open 2024, l’un des événements les plus importants de l’industrie open source en Amérique du Nord, l’Open Source Initiative (OSI) a annoncé la publication de la première définition officielle de l’IA open source, l’OSAID.
Des modèles comme Gemma de Google sont souvent qualifiés de modèles “ouverts”, ce qui peut prêter à confusion avec le terme “open source” lors de leur présentation. Bien que tous les modèles open source soient ouverts, tous les modèles ouverts ne répondent pas nécessairement aux critères de l’open source.
Pour l’OSI, un système d’IA open source met à disposition non seulement une structure fonctionnelle, mais aussi des éléments distincts comme les modèles, les poids et les paramètres sous des conditions qui garantissent quatre libertés essentielles :
Liberté d’utilisation : Utiliser le système d’IA pour n’importe quelle finalité, sans autorisation préalable.
Liberté d’inspection : Étudier le fonctionnement interne du système.
Liberté de modification : Modifier le système pour adapter ses réponses ou ses capacités à d’autres fins.
Liberté de partage : Distribuer le système ou ses versions modifiées à d’autres utilisateurs, à des fins diverses.
Les exigences techniques d’une IA open source
Un modèle d’IA est constitué de trois éléments : l’architecture, les paramètres ou poids, et le code d’inférence. Pour qu’un modèle soit considéré comme open source, chacun de ces éléments doit être accompagné des informations nécessaires à sa modification et à sa compréhension. Selon l’OSI, il est indispensable de fournir un accès à trois éléments clés :
Informations sur les données : L’origine, le traitement et les caractéristiques des données d’entraînement doivent être documentés (provenance des données, méthodes de sélection, d’étiquetage et de filtrage) ;
Code source complet : Le code utilisé pour entraîner et exécuter le modèle doit être disponible, incluant le traitement des données, les tests et la validation ;
Paramètres et poids du modèle : Les poids et autres paramètres appris (points de contrôle d’entraînement, état final de l’optimiseur, etc.) doivent être accessibles pour permettre de reproduire ou de personnaliser le modèle.
Stefano Maffulli, directeur exécutif de l’OSI, commente :
“Arriver à la version 1.0 de l’OSAID aujourd’hui a été un parcours difficile, rempli de nouveaux défis pour la communauté OSI. Malgré ce processus délicat, rempli d’opinions divergentes et de frontières techniques inexplorées, et d’échanges houleux occasionnels, les résultats sont alignés sur les attentes énoncées au début de ce processus de deux ans. Il s’agit d’un point de départ pour un effort continu visant à s’engager auprès des communautés afin d’améliorer la définition au fil du temps, à mesure que nous développons avec la communauté Open Source plus large les connaissances nécessaires pour lire et appliquer OSAID v.1.0”.
Validation et soutien à l’OSAID
Dans le cadre de la validation et de la mise à l’essai de l’OSAID, les volontaires ont évalué si 13 systèmes d’IA offraient les libertés attendues. Les modèles ayant passé la phase de validation sont les suivants : Pythia (Eleuther AI), OLMo (AI2), Amber et CrystalCoder (LLM360) et T5 (Google). D’autres modèles, comme BLOOM (BigScience), Starcoder2 (BigCode) et Falcon (TII), pourraient passer s’ils modifiaient leurs licences ou conditions juridiques.
En revanche, certains modèles, tels que Llama2 (Meta), Grok (X/Twitter), Phi-2 (Microsoft) et Mixtral (Mistral), n’ont pas été validés en raison de composants manquants ou d’accords juridiques incompatibles avec les principes de l’open source.
L’Open Source Initiative précise que ces résultats doivent être considérés comme faisant partie du processus de définition et d’apprentissage, et ne constituent pas des certifications. Elle continuera de valider uniquement les documents juridiques et ne validera ni n’examinera les systèmes d’IA individuels, tout comme elle ne valide ni n’examine les projets logiciels.
Pour l’instant, une vingtaine d’entreprises ou organisations soutiennent cette version 1.0 de l’OCAID. Parmi elles, l’institut de recherche EleutherAI, Bloomberg, Mozilla, LLM360, CommonCrawl, Linagora Labs, Nextcloud, OpenInfra Foundation, SUSE, l’Eclipse Foundation, Mercado Libre…
Comme on peut s’y attendre, les entreprises dont les modèles ont été réfutés comme open source ont préféré s’abstenir… Un porte-parole de Meta a déclaré :
“Nous sommes d’accord avec notre partenaire l’OSI sur beaucoup de choses, mais nous, comme d’autres dans l’industrie, ne sommes pas d’accord avec leur nouvelle définition. Il n’existe pas de définition unique de l’IA open source, et la définir est un défi, car les définitions open source précédentes n’englobent pas les complexités des modèles d’IA qui évoluent rapidement aujourd’hui. Nous rendons Llama gratuit et librement disponible, et notre politique de licence et d’utilisation acceptable aide à assurer la sécurité des gens en mettant en place certaines restrictions. Nous continuerons à travailler avec l’OSI et d’autres groupes de l’industrie pour rendre l’IA plus accessible et gratuite de manière responsable, quelles que soient les définitions techniques”.
OSAID : l'OSI publie sa définition de l'IA open source
Lors de l’événement annuel TechXchange d’IBM, la société a annoncé la sortie de Granite 3.0, la dernière version de sa famille de modèles de langage (LLM) open source, adaptés aux besoins des entreprises. Granite 3.0 se distingue par son équilibre entre performance, sécurité et rentabilité, répondant aux défis de l’utilisation de LLMs dans des environnements professionnels.
La suite de modèles Granite 3.0 comprend :
Des LLM à usage général : Granite 3.0 8B-Instruct, Granite 3.0 2B-Instruct, G
Lors de l’événement annuel TechXchange d’IBM, la société a annoncé la sortie de Granite 3.0, la dernière version de sa famille de modèles de langage (LLM) open source, adaptés aux besoins des entreprises. Granite 3.0 se distingue par son équilibre entre performance, sécurité et rentabilité, répondant aux défis de l’utilisation de LLMs dans des environnements professionnels.
La suite de modèles Granite 3.0 comprend :
Des LLM à usage général : Granite 3.0 8B-Instruct, Granite 3.0 2B-Instruct, Granite 3.0 8B Base, Granite 3.0 2B Base
Granite 3.0 : un modèle d’efficacité et de flexibilité
Granite 3.0 8B et 2B ont été entraînés à partir de 12 000 milliards de jetons de données, provenant de 12 langages naturels et de 116 langages de programmation différents. Les entreprises peuvent les personnaliser avec leurs propres données grâce à la méthode d’alignement InstructLab, introduite par IBM et Red Hat en mai dernier. Elle permet aux entreprises de personnaliser les modèles en utilisant des données synthétiques et des protocoles de formation adaptés à leurs besoins, réduisant ainsi les coûts de trois à vingt-trois fois, et les délais de mise en œuvre.
Les modèles de la famille Granite 3.0 sont adaptés à différentes applications d’IA. Les modèles de base Granite 3.0 8B et 2B, qualifiés de “bourreaux de travail” par IBM, sont conçus pour des tâches variées comme la génération augmentée de récupération (RAG), la classification et la synthèse de données. Ils peuvent être facilement personnalisés avec des données d’entreprise, permettant ainsi aux organisations d’optimiser leurs performances à moindre coût.
Le modèle phare de cette version, Granite 3.0 8B Instruct, un modèle dense optimisé pour les instructions, est destiné à servir de bloc de construction principal pour les flux de travail sophistiqués et les cas d’utilisation basés sur des outils.
En matière de benchmarks académiques et professionnels, Granite 3.0 8B Instruct rivalise avec des modèles concurrents open source de taille similaire, comme Llama 3.1-8B de Meta et Mistral-7B de Mistral AI, tout en se distinguant par ses performances sur des tâches spécifiques à l’entreprise, notamment en cybersécurité. Il a ainsi dominé les évaluations sur RAGBench, un benchmark évaluant la génération augmentée par récupération (RAG) dans des contextes industriels tels que les manuels techniques.
Granite Guardian 3.0 : la sécurité au cœur de l’innovation
Outre ses modèles polyvalents, IBM introduit les modèles Granite 3.0 Guardian, spécialement conçus pour répondre aux besoins critiques de sécurité et de conformité des entreprises. Granite Guardian 3.0 8B et 2B sont des modèles renforcés avec des mécanismes de sécurité intégrés pour minimiser les risques liés aux biais et à l’exploitation malveillante des systèmes d’IA. Grâce à une série de mécanismes de contrôle et de supervision, ces modèles assurent une protection contre les fuites de données sensibles et les réponses inappropriées. Ils peuvent être utilisés pour mettre en œuvre des garde-fous avec n’importe quel modèle d’IA ouvert ou propriétaire.
IBM affirme que Granite Guardian excelle dans les environnements réglementés, où la conformité aux normes de sécurité et de confidentialité est primordiale. Ces modèles sont capables de détecter les anomalies dans les interactions utilisateur et les manipulations malveillantes, ce qui les rend particulièrement adaptés à des secteurs comme la finance, la santé et la défense. Selon ses tests internes, Granite Guardian a surpassé des modèles similaires, comme LLamaGuard de Meta, en matière de détection des risques.
Mixture-of-Experts : performances et rentabilité
La version 3.0 introduit les modèles “Mixture-of-Experts” (MoE), tels que Granite 3.0 3B-A800M Instruct et 1B-A400M Instruct, qui adoptent une approche modulable, où seuls certains experts (sous-modèles spécialisés) sont activés en fonction de la tâche demandée, ce qui les rend très intéressants pour les environnements où les ressources de calcul peuvent être limitées ou coûteuses.
Entraînés sur plus de 10 000 milliards de jetons de données, ces nouveaux modèles MoE Granite sont particulièrement adaptés pour des applications sur l’appareil, des serveurs CPU et des situations nécessitant une latence extrêmement faible.
IBM a également annoncé une mise à jour de ses modèles Granite Time Series pré-entraînés, dont les premières versions ont été publiées au début de l’année. Ces nouveaux modèles, entraînés sur 3 fois plus de données, offrent de solides performances selon les 3 principaux benchmarks de type série temporelle (Time Series), surpassant des modèles 10 fois plus grands de Google, Alibaba et d’autres. Ces modèles mis à jour offrent également une plus grande flexibilité de modélisation grâce à la prise en charge de variables externes et de prévisions glissantes.
Granite 3.0 dans l’écosystème d’IBM
L’introduction de Granite 3.0 s’intègre parfaitement à l’écosystème plus large d’IBM, avec des intégrations optimisées pour certaines de ses plateformes. Watsonx.ai, le produit phare d’IBM dédié à l’IA, s’appuie désormais sur Granite 3.0 pour offrir des solutions avancées aux entreprises cherchant à automatiser leurs processus tout en maintenant un haut niveau de sécurité et de transparence.
IBM a également mis en avant la compatibilité de Granite 3.0 avec ses outils de gestion des modèles et des données, permettant aux entreprises de surveiller et d’ajuster en continu leurs modèles pour améliorer la précision et la pertinence. L’intégration avec des outils comme Watsonx.data et Watsonx.governance garantit que les données sont gérées et utilisées de manière responsable tout au long du cycle de vie des modèles.
IBM continue d’améliorer Granite avec des extensions prévues pour la fin 2024, comme l’augmentation de la fenêtre de contexte à 128 000 jetons et l’ajout de capacités multimodales. Tous les modèles Granite 3.0 sont entraînés sur l’infrastructure Blue Vela d’IBM, qui fonctionne à 100 % grâce à des sources d’énergie renouvelable. Ce choix s’inscrit dans l’engagement croissant d’IBM à intégrer des pratiques durables dans ses processus de développement technologique.
Disponibilité des modèles Granite 3.0
Les modèles Granite 3.0 et les modèles Time Series mis à jour sont distribués sous la licence Apache 2.0 et peuvent être téléchargés sur HuggingFace, renforçant l’engagement d’IBM envers l’open source et la transparence.
Les variantes d’instruction des nouveaux modèles de langage Granite 3.0 8B et 2B et les modèles Granite Guardian 3.0 8B et 2B sont disponibles dès aujourd’hui pour une utilisation commerciale sur la plateforme watsonx d’IBM. Une sélection des modèles Granite 3.0 sera également disponible en tant que microservices NVIDIA NIM et via les intégrations Vertex AI Model Garden de Google Cloud avec HuggingFace.
Pour faciliter le choix et l’utilisation des développeurs et soutenir les déploiements locaux et à la périphérie (edge), un ensemble organisé de modèles Granite 3.0 est également disponible sur Ollama et Replicate.
Les modèles sont également disponibles sur les plateformes de partenaires d’IBM, tels qu’AWS, Docker, Domo, Qualcomm Technologies, Salesforce ou SAP.
Open source : IBM dévoile Granite 3.0, sa nouvelle génération de LLMs optimisés pour les entreprises
Une étude récente menée par Red Hat auprès de 609 responsables IT dans six pays, dont la France, met en lumière les priorités des entreprises en matière de stratégie cloud et les défis qu’elles rencontrent, notamment en termes de compétences. L’IA émerge comme un facteur clé, tant en matière d’innovation que de complexité technologique.
Adoption du cloud et priorité à l’IA
Pour 95 % des responsables IT français, les investissements dans les technologies cloud sont une priorité stratégique pour 2
Une étude récente menée par Red Hat auprès de 609 responsables IT dans six pays, dont la France, met en lumière les priorités des entreprises en matière de stratégie cloud et les défis qu’elles rencontrent, notamment en termes de compétences. L’IA émerge comme un facteur clé, tant en matière d’innovation que de complexité technologique.
Adoption du cloud et priorité à l’IA
Pour 95 % des responsables IT français, les investissements dans les technologies cloud sont une priorité stratégique pour 2025. Parmi eux, 84 % considèrent l’adoption de l’IA, qu’elle soit générative ou prédictive, comme un levier crucial pour cette transformation. Cette priorité s’inscrit dans un contexte où 59 % des entreprises cherchent à équilibrer innovation technologique et amélioration des infrastructures existantes. Plus de la moitié de ces dernières, (55 %), prévoient d’augmenter leurs investissements de 5 à 20 %.
Les impératifs de sécurité, de conformité réglementaire et de souveraineté des données sont, tout comme l’adoption de l’IA, identifiés comme des axes stratégiques majeurs.
Un manque de compétences qui freine l’adoption
L’enthousiasme pour l’IA est toutefois tempéré par une pénurie de compétences. En effet, 77 % des répondants français estiment que l’insuffisance de talents dans des domaines tels que la science des données, les modèles de langage (LLM) et l’IA générative constitue un défi majeur. Les lacunes de compétences en matière de cybersécurité, de développement d’applications cloud-natives et de gestion d’un environnement de cloud hybride ont également été identifiées par 69 % des responsables interrogés.
Cette pénurie souligne la nécessité d’une montée en compétences, d’autant plus que 40 % des entreprises interrogées déclarent disposer de plateformes informatiques flexibles et évolutives, mais manquent de l’expertise pour exploiter pleinement leur potentiel.
L’open source au service de la transparence
L’open source joue un rôle croissant dans la confiance que les responsables IT accordent aux technologies d’IA. Plus de la moitié des répondants (54 %) citent la transparence et la confiance comme des avantages clés des solutions d’IA open source.
Pour nombre de responsables IT, ces caractéristiques sont essentielles pour bâtir la confiance dans les solutions d’IA générative. Ils soulignent également l’importance de la fiabilité des modèles et de leur capacité à s’adapter à des usages spécifiques, loin des solutions génériques offertes par les grands modèles de langage. Le fait de pouvoir contribuer à ces solutions et les personnaliser est en effet un atout de l’open source selon 41 % d’entre eux, aux côtés de l’accélération de l’innovation (44 %).
L’enquête montre également que pour 94 % des responsables IT, s’il est crucial d’utiliser des modèles d’IA générative transparents et modifiables, ils doivent être associés à des sources explicables.
Vers une approche plus structurée du cloud
L’étude révèle aussi les défis opérationnels liés à l’adoption du cloud, notamment la gestion des équipes cloisonnées. Pour 96 % des responsables IT interrogés dans les six pays, les silos internes freinent l’adoption des technologies cloud, 53 % d’entre eux affirmant y être fréquemment confrontés, ce qui entraîne une incohérence en matière de sécurité et de conformité entre les différents fournisseurs (54 %), une hausse des coûts (47 %), et un manque de contrôle des ressources (42 %).
Pour répondre à ces défis, les entreprises doivent harmoniser leurs stratégies cloud tout en investissant dans le développement des compétences autour de l’IA et des technologies cloud-natives. Une approche structurée et cohérente du cloud, combinée à des solutions open source transparentes, pourrait ainsi aider à surmonter ces obstacles et à tirer pleinement parti de l’IA.
Pour Rémy Mandon, Country manager, France, Red Hat :
“Cette étude confirme que les priorités stratégiques des entreprises françaises s’articulent autour de trois points cardinaux : l’adoption de l’IA, l’objectif de sécurité, de conformité et de souveraineté, ainsi que le développement d’applications cloud-natives”.
Il conclut :
“Dans ce contexte, le rôle de Red Hat consiste à aider les entreprises à gérer leurs données et applications en s’appuyant sur un socle cloud hybride cohérent, à bien choisir les outils et les méthodologies qui conviennent à leur activité et, dans la mesure du possible, à combler le déficit de compétences dans ces domaines spécifiques. L’approche open source constitue une option flexible pour mettre les technologies cloud et l’IA au service des objectifs des entreprises, qui peuvent ainsi bénéficier des atouts d’une communauté de 70 millions de contributeurs”.
Alors que le e-commerce poursuit sa dynamique de croissance, améliorer l’expérience client en ligne est devenu une priorité pour les entreprises, afin de répondre aux attentes toujours plus élevées des consommateurs et de faire face à une concurrence toujours plus forte. Dydu, un leader français des plateformes d’IA conversationnelle, annonce la sortie d’une infographie sur l’impact des chatbots et de l’IA sur ce secteur.
Créé en 2009 par Jérôme Vérité, Cyril Texier et Mathieu Changeat, implanté
Alors que le e-commerce poursuit sa dynamique de croissance, améliorer l’expérience client en ligne est devenu une priorité pour les entreprises, afin de répondre aux attentes toujours plus élevées des consommateurs et de faire face à une concurrence toujours plus forte. Dydu, un leader français des plateformes d’IA conversationnelle, annonce la sortie d’une infographie sur l’impact des chatbots et de l’IA sur ce secteur.
Créé en 2009 par Jérôme Vérité, Cyril Texier et Mathieu Changeat, implanté à Bordeaux et Paris, Dydu, (Do You Dream Up), éditeur de logiciels spécialisé en traitement automatique du langage naturel, compte aujourd’hui une quarantaine de collaborateurs, dont 20 dédiés au développement de sa solution. Il propose une plateforme intuitive à destination des professionnels pour concevoir en toute autonomie des agents conversationnels intelligents : chatbot, voicebot, callbot, et travaille avec de nombreuses grandes entreprises (Orange, Total Energies, Safran…), PME et administrations publiques, dans des secteurs aussi variés que la santé, l’énergie, la finance, les assurances, le tourisme, les télécoms ou le e-commerce.
Il publie régulièrement des livres blancs et études sur les agents conversationnels, l’infographie “Chatbot x E-commerce : Optimiser l’expérience client” est la dernière en date.
La France, leader européen du e-commerce
Le secteur du e-commerce occupe une place croissante dans l’économie française : en 2023, le marché du e-commerce en France a atteint 160 milliards d’euros, marquant une hausse de 10,5 % par rapport à l’année précédente et consolidant la position de la France comme leader du e-commerce en Europe. Une augmentation due, en partie, à la généralisation des achats en ligne.
Plus de 42 millions de Français (soit 6 Français sur 10) ont effectué des transactions sur Internet, chacun dépensant en moyenne 4055 euros annuellement. Ce recours massif au commerce en ligne reflète une quête d’efficacité et de gain de temps : 92 % des acheteurs en ligne considèrent ce mode d’achat comme un moyen rapide et pratique de répondre à leurs besoins.
Chatbots et IA pour optimiser l’expérience client
L’amélioration de l’expérience client est devenue une priorité tant pour les entreprises que pour leurs clients. Selon l’infographie, 62 % des consommateurs sont ouverts à l’utilisation de l’IA pour améliorer leur expérience d’achat et 40 % se disent prêts à dépenser davantage lorsque le service est personnalisé et adapté à leurs besoins spécifiques. Par contre, 90% des consommateurs se tournent vers la concurrence suite à une mauvaise expérience.
Pour les acteurs du e-commerce, l’automatisation via des chatbots ne se résume plus à une simple réduction des coûts, mais représente une véritable réponse aux défis opérationnels liés à l’explosion des volumes de transactions. Selon les données de Dydu, environ 31 % des consommateurs utilisent des chatbots pour passer des commandes ou gérer leurs livraisons, tandis que 28 % s’en servent pour les retours et les échanges.
Cette adoption croissante des chatbots dans le parcours d’achat est motivée par plusieurs facteurs. Outre présenter l’avantage d’être disponibles 24 heures sur 24 et 7 jours sur 7, en permettant d’automatiser les réponses aux questions les plus fréquentes, ils libèrent du temps aux conseillers client ou aux équipes support, pour des tâches plus complexes ou à plus haute valeur ajoutée tout en améliorant la relation client, mais aussi les ventes.
Des attentes clients redéfinies par la technologie
Un autre enseignement de l’étude est l’évolution des attentes des consommateurs vis-à-vis des interactions en ligne. Environ 45 % des clients souhaitent que leurs demandes soient traitées et résolues immédiatement. Cette exigence de réactivité place les chatbots au cœur des stratégies d’amélioration de l’expérience client. En automatisant des réponses simples et en permettant un accompagnement personnalisé tout au long du parcours d’achat, les entreprises réduisent les frictions et améliorent les taux de satisfaction client jusqu’à 24 %.
Des gains mesurables pour les entreprises
Les avantages économiques pour les entreprises sont également tangibles. L’automatisation des réponses via des chatbots permet de réduire le délai de réponse pour les requêtes simples de 25 à 30 %. De plus, en fluidifiant le parcours client, les chatbots contribuent à une réduction du temps de finalisation d’un achat de près de 50 %. Ces améliorations ont un impact direct sur la satisfaction des clients et leur fidélité.
En optimisant les processus d’assistance et en simplifiant les interactions, les chatbots permettent de réduire les coûts opérationnels tout en améliorant l’efficacité des équipes. En 2023, les chatbots auraient ainsi permis aux entreprises d’économiser jusqu’à 2,5 milliards d’heures de travail dans les services de support client.
L’adoption de l’IA et des robots conversationnels sur les plateformes de e-commerce promet une transformation du secteur, redéfinissant les standards de satisfaction client, de personnalisation, et d’aide à la décision. D’ici 2025, l’IA devrait être à l’origine de 95 % des interactions client.
E-commerce et IA : l'impact des chatbots sur l'optimisation de l’expérience client selon Dydu
Avec notre partenaire dotAI, la conférence sur l’Intelligence Artificielle la plus pointue au monde.
Prêt à participer à l’événement IA le plus brillant de l’année ?
Dans un secteur où l’innovation évolue à une vitesse fulgurante, garder une longueur d’avance n’est pas seulement un avantage, c’est une nécessité.
Que vous soyez développeur, ingénieur, data scientist, spécialiste Machine Learning, CTO ou passionné de technologie, dotAI 2024 est l’occasion d’apprendre des meilleurs ingénieurs du m
Avec notre partenaire dotAI, la conférence sur l’Intelligence Artificielle la plus pointue au monde.
Prêt à participer à l’événement IA le plus brillant de l’année ?
Dans un secteur où l’innovation évolue à une vitesse fulgurante, garder une longueur d’avance n’est pas seulement un avantage, c’est une nécessité.
Que vous soyez développeur, ingénieur, data scientist, spécialiste Machine Learning, CTO ou passionné de technologie, dotAI 2024 est l’occasion d’apprendre des meilleurs ingénieurs du moment, non pas ceux qui ne font que parler du changement, mais de ceux qui le construisent réellement !
Préparez vous à deux jours d’annonces exclusives, la possibilité d’échanger avec les speakers et des rencontres avec la communauté IA dans un cadre somptueux.
La keynote de Romain Huet, Head of Developer Experience chez OpenAI. OpenAI a prévu 3 conférences pour les développeurs cette année: les Dev Day, qui auront lieu à San Francisco, Londres et Singapour. Pour Paris, ils ont choisi dotAI pour échanger avec la communauté.
L’annonce du Consultation Assistant de Doctolib, un projet mêlant IA et protection des données de santé. Une prouesse technique qui sera démontrée par un tech et un médecin ensemble sur scène.
La keynote de Pierre Stock, Research Scientist et le premier employé de Mistral AI. Retrouvez le sur le sujet pointu des Edge Agents, avec des annonces exclusives.
Les avancées du centre de recherche Kyutai – backé par Xavier Niel, Eric Schmidt et Rodolphe Saadé, qui ont annoncé Moshi, leur IA conversationnelle plus rapide que GPT4-o, Alexa et Siri.
La keynote d’Armand Joulin, Research Scientist chez Google Deepmind, ex-directeur Europe du centre de recherche FAIR de Meta.
dotAI 2024 propose une série d’intervenants de renommée mondiale qui mènent le changement dans le développement de l’IA.
Il ne s’agit pas seulement d’universitaires ou de théoriciens ; ce sont des experts en technologie qui appliquent et construisent autour de l’IA de manière révolutionnaire !
Qu’il s’agisse de deep learning, machine learning ou de LLMs, nos intervenants couvrent l’ensemble des possibilités actuelles et futures.
Plus besoin d’aller à plusieurs événements: celui d’OpenAI, celui de Mistral AI, celui de Google: nous regroupons les acteurs majeurs en 1 seul évènement.
Réseautez facilement
Chez dotAI, vous serez entouré de professionnels partageant votre passion pour la technologie et l’innovation.
C’est votre chance de vous connecter avec vos pairs, vos collaborateurs potentiels et l’écosystème de l’IA dans un cadre intime qui encourage les interactions qualitatives.
Nous savons que le réseautage n’est pas une compétence naturelle pour tout le monde, nous vous facilitons donc la tâche ! Un jeu de networking pour aider à briser la glace, un espace Speaker Lounge conçu spécifiquement pour les conversations avec les intervenants et, bien sûr, l’happy hour !
Profitez d’un contenu sans marketing
dotAI célèbre l’Open Source, ce qui signifie que le marketing est interdit dans la salle de théâtre. Nos conférences n’ont pas de publicité déguisée et les speakers ne sont pas censés vous vendre une technologie particulière.
Cependant, au-delà des conférences, vous pourrez échanger directement avec nos partenaires sur leurs stands. C’est là que le marketing est autorisé et que les relations commerciales prospèrent.
Vivez une expérience haut-de-gamme
Votre expérience d’apprentissage doit être aussi agréable que instructive.
C’est pourquoi nous avons choisi un lieu premium au cœur de Paris, équipé de tout ce dont vous avez besoin pour une expérience comme au théâtre.
Profitez de repas gastronomiques généreux, de pauses méticuleusement planifiées et de goodies exclusifs, car chez dotAI, nous pensons que les ingénieurs méritent le meilleur.
Faites le bon choix pour votre carrière et votre entreprise
Investir dans un billet pour dotAI 2024 n’est pas seulement un investissement dans votre développement professionnel ; c’est un investissement dans l’avenir de votre entreprise.
Le paysage de l’IA évolue rapidement, et les connaissances, les compétences et les relations que vous acquerrez lors de cette conférence vous positionneront comme un leader dans votre domaine.
En amenant votre équipe, vous pouvez également amplifier ces avantages, tout en profitant de nos remises de groupe.
Ne manquez pas ce moment clé!
Avec tant de valeur en deux jours, il n’est pas surprenant que la demande pour dotAI 2024 soit élevée. Cet événement a toujours été un des secrets les mieux gardés de la communauté tech européenne, mais la nouvelle se répand rapidement.
N’attendez pas qu’il soit trop tard : une fois que nous aurons vendu tous les billets, il n’y aura plus d’autre chance !
Ce 19 septembre, une trentaine d’entreprises, des chercheurs et des institutions européens ont publié une lettre ouverte adressée aux régulateurs de l’UE avec un message clair : l’Europe doit harmoniser ses approches réglementaires en matière d’IA si elle veut libérer pleinement le potentiel de l’IA générative, notamment open source. Parmi les signataires figurent Mark Zuckerberg (Meta), Daniel Ek (Spotify), Yann LeCun (Meta), Christian Klein (SAP), Maurice Lévy (Publicis Groupe), Börje Ekholm (
Ce 19 septembre, une trentaine d’entreprises, des chercheurs et des institutions européens ont publié une lettre ouverte adressée aux régulateurs de l’UE avec un message clair : l’Europe doit harmoniser ses approches réglementaires en matière d’IA si elle veut libérer pleinement le potentiel de l’IA générative, notamment open source. Parmi les signataires figurent Mark Zuckerberg (Meta), Daniel Ek (Spotify), Yann LeCun (Meta), Christian Klein (SAP), Maurice Lévy (Publicis Groupe), Börje Ekholm (Ericsson) qui soulignent l’urgence d’une prise de décision rapide et cohérente pour garantir que l’Europe reste compétitive.
Selon la lettre ouverte, “l’Europe est devenue moins compétitive et moins innovante par rapport à d’autres régions, et elle risque maintenant de prendre encore plus de retard à l’ère de l’IA en raison de décisions réglementaires incohérentes”.
L’environnement réglementaire européen, qui a pour but de protéger les consommateurs et de garantir une concurrence équitable, a été source de tensions entre des géants technologiques comme Meta ou OpenAI et les régulateurs européens.
La loi sur les Marchés Numériques (DMA), cherche à limiter le pouvoir des grandes plateformes en ligne, en imposant des règles pour empêcher les comportements anticoncurrentiels alors que la loi sur les Services Numériques (DSA) vise à créer un espace numérique plus sûr, exigeant des plateformes en ligne une modération rigoureuse des contenus. De son côté, le règlement Général sur la Protection des Données (RGPD) impose des règles strictes sur la collecte, le traitement et le stockage des données personnelles des citoyens européens.
L’AI Act, entré en vigueur le 1er août dernier, sera quant à lui appliqué progressivement. Il établit un cadre pour l’utilisation de l’IA, notamment pour les applications à haut risque, imposant des exigences strictes en matière de transparence et de sécurité, mais selon certains, manque de clarté et d’exemption à part entière pour les modèles de fondation open source.
L’Europe à un tournant décisif
L’un des points cruciaux soulevés dans la lettre est l’absence d’une réglementation unifiée en Europe sur l’utilisation des données pour l’IA, empêchant les entreprises de développer des solutions innovantes à l’échelle locale. Les interventions récentes des autorités européennes de protection des données ont semé le trouble quant aux types de données qui peuvent être utilisés pour entraîner des modèles d’IA, ce qui freine considérablement les efforts de recherche et développement.
Les signataires avertissent que sans règles harmonisées et cohérentes, l’Europe se privera des dernières avancées technologiques dont bénéficient les États-Unis, la Chine et l’Inde, comme celles des LLMs multimodaux qui pourraient radicalement transformer des secteurs comme la santé, la science ou encore la culture, tout en contribuant à une augmentation significative du PIB mondial estimée à 10 % au cours de la prochaine décennie. Elle va également se priver d’un second élément essentiel à l’innovation en IA : “le développement de modèles “ouverts”, disponibles gratuitement pour que tout le monde puisse les utiliser, les modifier et les améliorer, multipliant ainsi les bénéfices et diffusant des opportunités sociales et économiques”.
Pour Laurent Solly, vice-président de Meta Europe du Sud :
“Les entreprises qui travaillent sur l’IA générative ont besoin de décisions harmonisées, cohérentes, rapides et claires dans le cadre de la réglementation européenne sur les données. C’est l’avenir et la place de l’Europe qui se jouent ici”.
Ce que la lettre ouverte souligne :
“L’Europe fait face à un choix qui aura un impact sur la région pendant des décennies. Elle peut choisir de réaffirmer le principe d’harmonisation inscrit dans des cadres réglementaires comme le RGPD afin que l’innovation en matière d’IA se produise ici à la même échelle et à la même vitesse qu’ailleurs. Ou bien, elle peut continuer à rejeter le progrès, trahir les ambitions du marché unique et regarder le reste du monde développer des technologies auxquelles les Européens n’auront pas accès”.
Vous pouvez retrouver la lettre ouverte et rejoindre les signataires ici.
Le 12 septembre dernier, le Campus Cyber a accueilli le lancement du projet P16, un programme stratégique visant à renforcer la souveraineté technologique de la France et de l’Europe dans le domaine de l’IA et de la science des données. Ancré dans la Stratégie Nationale pour l’Intelligence Artificielle (SNIA) et soutenu par France 2030, P16 s’inscrit comme une initiative majeure pour le développement de technologies numériques open source, en réponse aux enjeux économiques et stratégiques mondia
Le 12 septembre dernier, le Campus Cyber a accueilli le lancement du projet P16, un programme stratégique visant à renforcer la souveraineté technologique de la France et de l’Europe dans le domaine de l’IA et de la science des données. Ancré dans la Stratégie Nationale pour l’Intelligence Artificielle (SNIA) et soutenu par France 2030, P16 s’inscrit comme une initiative majeure pour le développement de technologies numériques open source, en réponse aux enjeux économiques et stratégiques mondiaux.
La première phase de la SNIA a permis la création et le développement d’un réseau d’instituts interdisciplinaires d’intelligence artificielle (3IA), l’appui financier à des chaires d’excellence en IA, le financement de programmes doctoraux et le renforcement des capacités de calcul de la recherche publique avec notamment le supercalculateur Jean Zay. La seconde phase, lancée en novembre 2021, vise entre autres à renforcer et accélérer la formation à l’IA ainsi que le potentiel R&D dans les marchés émergents tels que l’IA embarquée, l’edge computing, les technologies de confiance pour l’explicabilité et la fiabilité des algorithmes.
C’est dans le cadre de cette seconde phase que le gouvernement a confié à l’Inria, l’institut national de recherche en sciences et technologies du numérique, la mission de concevoir et de pérenniser un ensemble de communs numériques souverains pour l’IA, à l’échelle nationale et européenne. Le projet P16, inscrit comme la mesure N°16 de la Stratégie d’Accélération pour l’IA, est né de cette mission.
Une ambition de souveraineté numérique
P16, financé à hauteur de 8 millions d’euros sur cinq ans, vise à développer une suite de bibliothèques logicielles open source, interopérables, couvrant l’intégralité du cycle de la donnée, qui compte trois phases principales :
L’interopérabilité des données : leur représentation, stockage et exploitation ;
La préparation des données : nettoyage, mesure de la qualité, enrichissement ;
Le développement de modèles d’apprentissage pour les applications d’IA.
L’Inria, fort de son expérience dans le développement de logiciels open source pour la gestion des données, s’appuie sur le succès de la bibliothèque open source en Python scikit-learn, un outil de référence dans l’apprentissage automatique depuis 2007, auquel il a contribué. Elle servira de base au projet P16 pour développer de nouveaux composants logiciels, tout en maintenant des standards élevés en termes de qualité et d’interopérabilité.
Une dynamique de collaboration public-privé
P16 se distingue par une structuration unique réunissant le monde académique et industriel. L’Inria supervisera la recherche exploratoire et la maturation des composants logiciels, en collaboration avec des partenaires académiques français et européens dans le cadre de l’Agence de Programmes du Numérique dont il a la responsabilité depuis janvier dernier. Parallèlement, la spin-off d’Inria, Probabl, entreprise à mission de souveraineté industrielle et numérique, prendra en charge l’industrialisation et la commercialisation des outils développés.
Les premières années du projet seront dédiées à la phase de recherche et de développement, afin d’identifier et de préparer les premiers composants logiciels pour qu’ils soient opérationnels dès la phase de production.
Un appel à manifestation d’intérêt (AMI), largement ouvert sur la communauté de recherche, sera bientôt publié pour sélectionner des propositions de méthodes, algorithmes et modules qui viendront enrichir l’offre du projet.
Bruno Sportisse, Président-directeur général d’Inria, soulignant l’importance de P16, conclut :
“Dans le cadre de la Stratégie nationale d’intelligence artificielle et avec le soutien de France 2030, le Projet P16 porte une ambition d’autonomie stratégique majeure pour la France et l’Europe, dans le domaine de l’IA et de la science des données. Il s’appuie notamment sur la réussite exceptionnelle de scikit-learn, qu’il doit amplifier. Avec la montée en puissance cohérente de Probabl, fondée sur le format innovant d’une entreprise à Mission de Souveraineté Industrielle et Numérique, nous faisons le pari de l’innovation ouverte et de la collaboration public-privé pour renforcer un écosystème dont l’impact doit être mondial”.
Probabl, l’opérateur officiel de la bibliothèque open source incontournable pour le ML, scikit-learn, annonce un tour de table de 5,5 millions d’euros, marqué par l’arrivée de nouveaux investisseurs. Cette levée de fonds intermédiaire, composée de bons de souscription convertibles, vise à préparer une future levée de fonds en actions afin de soutenir la croissance de l’entreprise tout en respectant sa mission phare : permettre à chacun de maîtriser sa science des données grâce à des outils fiabl
Probabl, l’opérateur officiel de la bibliothèque open source incontournable pour le ML, scikit-learn, annonce un tour de table de 5,5 millions d’euros, marqué par l’arrivée de nouveaux investisseurs. Cette levée de fonds intermédiaire, composée de bons de souscription convertibles, vise à préparer une future levée de fonds en actions afin de soutenir la croissance de l’entreprise tout en respectant sa mission phare : permettre à chacun de maîtriser sa science des données grâce à des outils fiables et innovants.
Créée en septembre 2023, Probabl, spin-off de l’Inria créée autour de scikit-learn, vise à développer des outils open source pour la science des données, l’IA et le ML, et d’étendre l’infrastructure logicielle de scikit-learn. L’objectif est d’assurer que scikit-learn continue d’évoluer et de répondre aux besoins des utilisateurs dans le monde entier, en restant un pilier de la data science open source.
Un modèle d’actionnariat équilibré
Probabl a mis en place un modèle d’actionnariat reflétant son engagement en faveur de la souveraineté industrielle et numérique. L’entreprise a structuré ses parts autour de trois collèges distincts :
Un collège public, représentant l’État français via le dispositif French Tech Souveraineté, un programme stratégique de soutien à l’innovation numérique lancé en juin 2020 dans le cadre du plan France 2030 ;
Un collège privé, incluant des investisseurs de renom tels que Costanoa Ventures, un fonds spécialisé dans les solutions open source et l’innovation technologique;
Un collège de contributeurs individuels, comprenant des membres clés de la communauté scikit-learn, notamment des développeurs et des experts en data science.
Des investisseurs stratégiques rejoignent l’aventure
La levée de fonds, qui inclut une participation du dispositif French Tech Souveraineté, a vu l’arrivée de nouveaux investisseurs et partenaires clé, parmi lesquels Apertu Capital et Mozilla Ventures dont le soutien s’aligne avec les valeurs de Probabl, en accord avec les principes du Manifeste de Mozilla.
Parmi les nouveaux investisseurs se trouvent également des figures respectées de la communauté scikit-learn : des contributeurs « core-dev », des data scientists, des ingénieurs de recherche renommés, ainsi que des technologues de premier plan.
Devant ce message fort de la communauté, Yann Lechelle, PDG de Probabl, souligne :
“La communauté Python est extrêmement soudée et reconnaissante envers scikit-learn, qui a redéfini les standards de la science des données. En élargissant notre cercle d’actionnaires, nous nous assurons d’être en phase avec l’écosystème pour poursuivre notre mission avec force. Nous sommes très touchés par l’enthousiasme qui a dépassé nos attentes”.
Plusieurs business angels, ainsi qu’un champion olympique, ont également participé à ce tour de table, soulignant l’attractivité de l’entreprise au-delà de la sphère technologique.
Renforcement des capacités avec l’acqui-hiring de Mnemotix
Grâce à ce financement, Probabl a pu sécuriser l’acqui-hiring (une stratégie d’acquisition d’entreprises où l’objectif principal n’est pas d’acheter les produits ou les services de l’entreprise cible, mais plutôt de recruter ses talents et son expertise) de Mnemotix, une société spécialisée dans la gestion des données complexes. Cette opération lui permet d’intégrer les talents de Mnemotix pour renforcer les compétences de Probabl en matière de ML et de traitement de données non structurées.
Nicolas Delaforge, cofondateur de Probabl et Mnemotix, déclare :
“Nous sommes ravis d’annoncer que toute l’équipe de Mnemotix rejoint Probabl. Ce faisant, nous croyons que nous aurons un impact plus fort, en atteignant un public plus large et en gagnant de nouvelles capacités de résolution de problèmes, en restant fidèles aux valeurs qui nous ont guidés depuis le début. Cela marque la prochaine étape du parcours que nous avons entamé il y a 12 ans”.
Lancement de la certification scikit-learn et nouveaux produits
Pour soutenir la communauté scikit-learn, Probabl prévoit de lancer son premier programme officiel de certification scikit-learn au quatrième trimestre 2024. Cette certification, développée par des membres clés de l’équipe scikit-learn, vise à promouvoir l’excellence en science des données et à offrir une reconnaissance des compétences dans ce domaine.
En parallèle, Probabl travaille sur un nouveau produit MVP (Produit Minimum Viable), qui verra le jour à la fin de l’année. Ce produit compagnon est conçu pour accompagner les data scientists dans la phase pré-MLOps, facilitant ainsi la préparation des données avant l’intégration des modèles de ML. Les entreprises intéressées peuvent dès maintenant rejoindre le programme de bêta-test pour explorer cette nouvelle solution.
Probabl annonce une levée de 5,5 millions d’euros pour accélérer sa mission autour de scikit-learn
Selon le rapport “Company Filings Analytics Trends & Signals – Q2 2024” de GlobalData, une entreprise leader dans le domaine des données et de l’analyse, la confiance des entreprises dans l’économie mondiale et leurs perspectives d’avenir a légèrement progressé, enregistrant une hausse de 0,2 % par rapport à la même période l’année précédente. L’étude révèle d’autre part que les secteurs de la technologie, des voyages et du tourisme, ainsi que de l’assurance ont particulièrement bénéficié de
Selon le rapport “Company Filings Analytics Trends & Signals – Q2 2024” de GlobalData, une entreprise leader dans le domaine des données et de l’analyse, la confiance des entreprises dans l’économie mondiale et leurs perspectives d’avenir a légèrement progressé, enregistrant une hausse de 0,2 % par rapport à la même période l’année précédente. L’étude révèle d’autre part que les secteurs de la technologie, des voyages et du tourisme, ainsi que de l’assurance ont particulièrement bénéficié de l’adoption de l’IA et des améliorations en cybersécurité.
La base de données analytique des dépôts de GlobalData avait permis de constater en 2023 que l’IA occupait une place centrale dans les discussions des entreprises explorant des stratégies d’innovation, une tendance confirmée et renforcée au cours des deux premiers trimestres de 2024.
Ce dernier rapport de GlobalData met ainsi en lumière l’augmentation des mentions de l’IA mais également de la cybersécurité qui sont devenus les thèmes principaux dans les discussions d’entreprise. La protection contre les violations de données et la conformité aux réglementations deviennent des priorités absolues, avec de plus en plus d’entreprises investissant dans des technologies de cybersécurité avancées pour atténuer ces risques.
Les secteurs en pleine croissance : technologie, voyages, et assurance
Les entreprises de technologie ont intensifié leurs efforts pour intégrer des innovations numériques. Elles ont investi dans des solutions de cloud hybride, dans des technologies et des pratiques pour renforcer la sécurité de leurs systèmes et protéger leurs données contre les cybermenaces, et dans l’IA générative. Cette dernière, en particulier, a joué un rôle crucial dans l’amélioration de l’expérience client et dans la modélisation des risques, apportant ainsi des avantages compétitifs significatifs. Parallèlement, le secteur des voyages et du tourisme a commencé à exploiter l’IA pour offrir des recommandations de voyage personnalisées, renforçant ainsi la satisfaction des clients.
Le secteur de l’assurance suit également cette tendance, adoptant des solutions centrées sur le client qui utilisent l’IA pour mieux anticiper les besoins des assurés et améliorer les processus de gestion des risques.
Les défis du commerce de détail et de l’emballage
Cependant, tous les secteurs ne sont pas à la même enseigne. Les secteurs de l’emballage et du retail ont ainsi été confrontés à l’évolution des préférences des consommateurs, à la hausse des coûts des matières premières, et aux perturbations des chaînes d’approvisionnement. Pour rester compétitives, les entreprises de ces secteurs doivent innover, en se concentrant sur la personnalisation des offres et en ajustant leurs stratégies en réponse aux nouvelles attentes des consommateurs.
Un regard sur les marchés internationaux
Sur la scène mondiale, certains pays se distinguent par leur dynamisme économique et leur capacité à attirer des investissements. Aux États-Unis, les entreprises se tournent vers des technologies de pointe et prévoient des investissements substantiels dans les installations de fabrication et de recherche et développement (R&D). Israël, malgré ses défis géopolitiques, se positionne comme un leader dans l’innovation technologique. L’Indonésie, quant à elle, émerge comme un hub attractif pour la fabrication à faible coût, suscitant l’intérêt des entreprises cherchant à diversifier leurs chaînes d’approvisionnement.
Misa Singh, analyste chez GlobalData, conclut :
“L’évolution de l’accent mis sur l’IA et la cybersécurité souligne une reconnaissance croissante du fait que la compétitivité future dépend de l’adoption de la technologie. Alors que les entreprises naviguent dans ces priorités, des secteurs comme la vente au détail et l’emballage doivent innover pour s’aligner sur les changements des consommateurs et les défis opérationnels. Cette trajectoire suggère qu’une transformation numérique plus large est impérative pour soutenir la croissance”.
Rapport GlobalData T2 2024 comment l'IA et la cybersécurité redéfinissent les stratégies d'entreprise
Alors que le e-commerce poursuit sa dynamique de croissance, fortement boostée par la pandémie de Covid-19 qui a solidifié des comportements d’achat continuant de stimuler le secteur aujourd’hui, la personnalisation des expériences d’achat est devenue un atout majeur pour attirer et fidéliser les clients. Cependant, cette tendance vers des recommandations de plus en plus personnalisées soulève d’importantes préoccupations en matière de confidentialité et de protection des données.
Une récente é
Alors que le e-commerce poursuit sa dynamique de croissance, fortement boostée par la pandémie de Covid-19 qui a solidifié des comportements d’achat continuant de stimuler le secteur aujourd’hui, la personnalisation des expériences d’achat est devenue un atout majeur pour attirer et fidéliser les clients. Cependant, cette tendance vers des recommandations de plus en plus personnalisées soulève d’importantes préoccupations en matière de confidentialité et de protection des données.
Une récente étude sur les préférences des consommateurs concernant leurs achats en ligne dévoilée par Packlink, plateforme logistique pour particuliers et entreprises, révèle que 59 % des consommateurs européens souhaitent que les plateformes d’e-commerce renforcent leurs mesures de sécurité pour protéger leurs informations personnelles.
L’équilibre délicat entre personnalisation et confidentialité
L’étude, qui a sondé 2 000 consommateurs à travers quatre marchés clé en Europe (France, Allemagne, Italie, Espagne), met en lumière l’importance croissante de la personnalisation dans l’expérience d’achat. En effet, 27,9 % des répondants expriment un intérêt pour des recommandations personnalisées, fondées sur leurs achats précédents, afin d’améliorer et d’optimiser leurs futures expériences d’achat.
Cependant, ce désir de personnalisation n’est pas sans réserves. Près de 35 % des consommateurs apprécient les suggestions ciblées qui facilitent leurs achats, mais ils souhaitent également avoir un contrôle accru sur la manière dont leurs données personnelles sont utilisées. Ce besoin de transparence et de contrôle souligne une tension croissante entre la quête d’une expérience d’achat sur mesure et la nécessité de protéger la vie privée des utilisateurs.
Les inquiétudes des consommateurs face à la personnalisation
Si les recommandations personnalisées peuvent transformer l’expérience d’achat en ligne, elles soulèvent aussi diverses inquiétudes. Plus de la moitié des sondés (52,9 %) se disent ainsi préoccupés pour la sécurité de leurs informations personnelles, notamment leurs détails de paiement, lors de transactions en ligne. Cette crainte de voir leurs données exploitées à des fins malveillantes pousse les consommateurs à demander des garanties plus solides de la part des plateformes e-commerce.
Par ailleurs, 26,6 % des participants à l’enquête redoutent que ces suggestions personnalisées n’encouragent des dépenses excessives ou des achats impulsifs. En effet, la facilité avec laquelle les achats sont désormais réalisés, couplée à des recommandations pertinentes, pourrait pousser certains consommateurs à dépasser leur budget initial.
D’autres inquiétudes émergent également : 21,7 % craignent que la personnalisation ne limite la diversité des produits proposés, restreignant ainsi leur choix et leur possibilité de découvrir de nouveaux articles ou marques. De plus, 19,5 % des répondants expriment la crainte de perdre le contrôle sur leurs achats, redoutant que des transactions soient effectuées automatiquement par les prédictions algorithmiques sans leur consentement explicite.
Des mesures de sécurité essentielles
Face à ces préoccupations, il devient impératif pour les acteurs du e-commerce de renforcer les mesures de sécurité. Packlink recommande plusieurs actions clé pour protéger les données des utilisateurs :
Chiffrement des données : assurer un chiffrement de bout en bout des données lors de leur transmission et stockage ;
Double authentification (2FA) : ajouter une couche de sécurité supplémentaire lors des connexions et des transactions sensibles ;
Surveillance en temps réel : implémenter des systèmes capables de détecter et de répondre rapidement à toute activité suspecte ;
Education des consommateurs : sensibiliser les utilisateurs aux bonnes pratiques de sécurité, telles que la reconnaissance des tentatives de phishing et l’importance de mots de passe robustes.
Axelle Fossier, Responsable des ventes pour l’UE chez Auctane, maison mère de Packlink, conclut :
“La protection des données est une priorité absolue dans l’e-commerce, un secteur où les transactions en ligne impliquent l’échange d’informations personnelles et financières sensibles. Assurer leur sécurité est essentiel pour maintenir la confiance des consommateurs tout en respectant les réglementations”.
E-commerce et confidentialité : les consommateurs souhaitent une meilleure protection des données
Snowflake annonce qu’il héberge et optimise la collection de LLM Llama 3.1 dans sa plateforme Snowflake Cortex AI, offrant aux entreprises un accès sécurisé et sans serveur au modèle open source le plus avancé de Meta, Llama 3.1 405B. Parallèlement, la société rend open source sa pile d’optimisation d’inférence et de fine-tuning pour les grands modèles de langage, démocratisant ainsi l’accès aux IA génératives pour les entreprises et la communauté open source.
Lancée en novembre dernier, Snowfla
Snowflake annonce qu’il héberge et optimise la collection de LLM Llama 3.1 dans sa plateforme Snowflake Cortex AI, offrant aux entreprises un accès sécurisé et sans serveur au modèle open source le plus avancé de Meta, Llama 3.1 405B. Parallèlement, la société rend open source sa pile d’optimisation d’inférence et de fine-tuning pour les grands modèles de langage, démocratisant ainsi l’accès aux IA génératives pour les entreprises et la communauté open source.
Lancée en novembre dernier, Snowflake Cortex AI est une suite de fonctionnalités d’IA entièrement gérées, conçues pour permettre aux entreprises de créer et de déployer des applications d’IA génératives de manière sécurisée et sans serveur. Le service propose une interface de développement sans code, accessible aux utilisateurs de tous niveaux techniques. Il donne accès à des LLM de pointe, notamment ceux de Mistral AI, de Google et AI21 Labs, mais également à Snowflake Arctic, à Llama 3 (8B et 70B), aux LLM Reka-Core et désormais à la famille Llama 3.1.
Une collaboration stratégique pour l’innovation
Développée en collaboration avec des acteurs clés de l’IA, dont DeepSpeed, Hugging Face et vLLM, la pile d’optimisation de Snowflake offre des outils et des technologies pour optimiser l’inférence et le fine-tuning des LLMs de manière efficace et rentable. Cette initiative s’inscrit dans le cadre de l’engagement de Snowflake à fournir des solutions de pointe en matière d’intelligence artificielle tout en favorisant l’innovation ouverte.
Caractéristiques techniques et avantages
Optimisation de l’Inférence
Réduction de la latence : La pile permet de réduire la latence d’inférence jusqu’à trois fois par rapport aux solutions open source existantes, offrant ainsi une performance en temps réel indispensable pour les applications critiques ;
Augmentation du débit : Avec une amélioration du débit de 1,4 fois, les utilisateurs peuvent traiter un volume plus important de requêtes en moins de temps, optimisant ainsi l’efficacité opérationnelle.
Fine-tuning efficace
Utilisation minimale de ressources : Le fine-tuning des modèles massifs peut désormais être réalisé en utilisant un seul nœud GPU, réduisant considérablement les coûts et la complexité.
Support de fenêtres de contexte étendu : Avec une prise en charge des fenêtres de contexte allant jusqu’à 128K, les modèles peuvent gérer des contextes plus larges et produire des résultats plus cohérents et pertinents.
Llama 3.1 405B a ainsi été optimisé pour l’inférence en temps réel et à haut débit avec une fenêtre de contexte massive de 128K à l’aide d’un seul nœud GPU au sein de Cortex AI.
Vivek Raghunathan, VP of AI Engineering chez Snowflake, commente :
“Nous ne nous contentons pas de fournir les modèles de pointe de Meta à nos clients via Snowflake Cortex AI. Nous armons les entreprises et la communauté de l’IA avec de nouvelles recherches et un code open source supportant des fenêtres de contexte de 128K, l’inférence multi-nœuds, le parallélisme de pipeline, la quantization en virgule flottante de 8 bits, et bien plus, afin de faire progresser l’intelligence artificielle pour l’écosystème global.”
Engagement en matière de sécurité et de confiance
Snowflake a également intégré des mécanismes de sécurité avancés dans sa pile open source avec Snowflake Cortex Guard. Pour développer cette nouvelle fonctionnalité, l’entreprise a utilisé Llama Guard 2 de Meta, qui recourt à des algorithmes avancés pour détecter et filtrer automatiquement les contenus potentiellement nuisibles, offensants ou inappropriés dans les sorties des modèles de langage. Les applications d’IA construites sur cette pile sont ainsi protégées contre les contenus nuisibles.
Ryan Klapper, leader IA chez Hakkoda, assure :
“La sécurité et la confiance sont des impératifs business lorsqu’il s’agit d’exploiter l’intelligence artificielle générative, et Snowflake nous offre les garanties nécessaires pour innover et utiliser à grande échelle des grands modèles de langage de pointe. La combinaison des modèles Llama de Meta au sein de Snowflake Cortex AI nous ouvre encore plus de possibilités pour des applications internes basées sur les RAG, permettant à nos parties prenantes d’accéder à des informations précises et pertinentes”.
Snowflake annonce l'intégration de Llama 3.1 et l'open source de sa pile d'optimisation d'inférence
L’an passé, Meta dévoilait Segment Anything (SAM), un modèle de vision par ordinateur conçu pour la segmentation d’objets dans les images. SAM 2, qui étend les capacités de son prédécesseur aux vidéos, est lui aussi publié sous une licence Apache 2.0, permettant à chacun de l’utiliser pour créer ses propres expériences. Meta partage également le dataset SA-V sous une licence CC BY 4.0 et publie une démo en ligne permettant de tester le modèle en action.
La segmentation d’objets, une tâche fondam
L’an passé, Meta dévoilait Segment Anything (SAM), un modèle de vision par ordinateur conçu pour la segmentation d’objets dans les images. SAM 2, qui étend les capacités de son prédécesseur aux vidéos, est lui aussi publié sous une licence Apache 2.0, permettant à chacun de l’utiliser pour créer ses propres expériences. Meta partage également le dataset SA-V sous une licence CC BY 4.0 et publie une démo en ligne permettant de tester le modèle en action.
La segmentation d’objets, une tâche fondamentale en vision par ordinateur consistant à identifier les pixels d’une image correspondant à un objet d’intérêt, est utilisée dans de nombreuses applications, de la retouche de photos à l’analyse de l’imagerie scientifique. SAM, publié l’année dernière, a établi un modèle de référence pour les images, SAM 2 permet désormais des expériences de segmentation en temps réel et une utilisation fluide dans les applications d’image et de vidéo.
Capacités et applications de SAM 2
SAM 2 dépasse les capacités des modèles précédents en termes de précision et de rapidité, tout en permettant la généralisation zero-shot, c’est-à-dire qu’il peut segmenter des objets dans des contenus visuels inédits sans adaptation personnalisée. Avant SAM, la création de modèles de segmentation précis pour des tâches spécifiques nécessitait généralement un travail hautement spécialisé de la part d’experts techniques ayant accès à une infrastructure d’entraînement à l’IA et à de grands volumes de données soigneusement annotées dans le domaine. Le modèle, en réduisant ces besoins, a transformé ce domaine, et SAM 2 promet d’ouvrir encore plus de possibilités.
Depuis son lancement, SAM a eu un impact significatif dans diverses disciplines, de l’application dans les sciences marines à l’analyse d’images satellites pour les secours en cas de catastrophe, en passant par la segmentation d’images médicales pour aider à détecter le cancer de la peau. SAM 2 peut être immédiatement appliqué à une large gamme de cas d’utilisation, tels que le suivi d’objets pour créer des effets vidéo ou la segmentation de cellules en mouvement dans des vidéos scientifiques.
Conformément à la vision de Mark Zuckerberg sur l’IA open source, SAM 2 pourrait considérablement augmenter la productivité, la créativité et la qualité de vie, tout en accélérant la croissance économique et les avancées scientifiques.
Développement et architecture de SAM 2
Méthodologie
Pour réussir la segmentation d’objets dans les vidéos, il est nécessaire de comprendre où se trouvent les entités dans l’espace et dans le temps. Les vidéos présentent des défis tels que le mouvement, la déformation, l’occlusion et les changements d’éclairage. SAM 2 relève ces défis en utilisant une architecture unifiée pour les images et les vidéos, ce qui introduit un mécanisme de mémoire pour rappeler les informations traitées précédemment et générer des prédictions de masques précises.
Tâche de segmentation visuelle incitative
SAM 2 prend en charge la sélection et l’affinage d’objets dans n’importe quelle image vidéo. Il est entraîné à utiliser des invites d’entrée pour définir le masque spatio-temporel (ou “masquelet”) à prédire. SAM 2 fait une prédiction immédiate du masque et le propage temporellement sur toutes les images vidéo. Ce processus peut être affiné itérativement avec des invites supplémentaires jusqu’à obtention du masquelet souhaité.
L’architecture de SAM 2 est une généralisation de SAM du domaine de l’image au domaine vidéo. Un mécanisme de mémoire composé d’un encodeur de mémoire, d’une banque de mémoire et d’un module d’attention de mémoire permet à SAM 2 de stocker des informations sur les objets segmentés et de générer des prédictions de masques tout au long de la vidéo.
Dataset SA-V
Collecte et annotations
Pour surmonter la disponibilité limitée des données annotées pour la segmentation vidéo, Meta a construit un moteur de données exploitant une configuration interactive de modèle en boucle avec des annotateurs humains. Ces derniers ont utilisé SAM 2 pour annoter des masques dans les vidéos, améliorant ainsi itérativement le modèle et l’ensemble de données.
Points forts de l’ensemble de données SA-V
Plus de 600 000 annotations de masques sur environ 51 000 vidéos ;
Vidéos couvrant des scénarios réels et géographiquement divers, collectées dans 47 pays ;
Annotations incluant des objets entiers, des parties d’objets et des cas d’occlusion.
Résultats et performances
SAM 2 surpasse les approches précédentes en matière de segmentation vidéo interactive, nécessitant environ trois fois moins d’interactions humaines et offrant une précision de segmentation supérieure. Il excelle également dans les tests de segmentation d’objets vidéo existants et permet une annotation de segmentation vidéo 8,4 fois plus rapide que l’annotation manuelle par image.
Limites et perspectives
Bien que SAM 2 démontre des performances solides, des améliorations peuvent encore être apportées, il lui arrive parfois de perdre la trace d’objets ou de les confondre avec des objets similaires. Même s’il est capable de segmenter plusieurs objets individuels simultanément, son efficacité dans ce cas de figure diminue alors considérablement. Le modèle est conçu pour être interactif, permettant des interventions manuelles pour récupérer des objets cibles en cas de perte de suivi.
Pour tester le modèle, retrouver la démonstration en ligne ici.
Segment Anything Model 2 le dernier modèle de vision par ordinateur de Meta étend les capacités de segmentation de SAM aux vidéos
Mistral AI ne chôme pas : après avoir dévoilé lundi dernier deux nouveaux LLM open source Codestral Mamba 7B et Mathstral 7B, il a annoncé, le vendredi suivant, Mistral NeMo 12 B, développé avec NVIDIA. Combinant l’expertise de Mistral AI en matière de données d’entraînement avec l’écosystème matériel et logiciel optimisé de NVIDIA, le modèle, également sous licence Apache 2.0, offre des performances élevées pour diverses applications, grâce à sa flexibilité.
Publié le lendemain de GPT-4o mini d
Mistral AI ne chôme pas : après avoir dévoilé lundi dernier deux nouveaux LLM open source Codestral Mamba 7B et Mathstral 7B, il a annoncé, le vendredi suivant, Mistral NeMo 12 B, développé avec NVIDIA. Combinant l’expertise de Mistral AI en matière de données d’entraînement avec l’écosystème matériel et logiciel optimisé de NVIDIA, le modèle, également sous licence Apache 2.0, offre des performances élevées pour diverses applications, grâce à sa flexibilité.
Publié le lendemain de GPT-4o mini d’Open AI, Mistral NeMo 12B dispose lui aussi d’une fenêtre contextuelle allant jusqu’à 128 000 jetons et est également adapté pour les entreprises qui cherchent à implémenter des solutions d’IA sans avoir besoin de ressources cloud étendues.
Une collaboration Mistral AI – NVIDIA
NVIDIA a participé à la dernière levée de fonds de 600 millions d’euros de Mistral AI, ouvrant la voie à cette collaboration pour le développement de ce nouveau modèle.
S’appuyant sur une architecture transformateur standard, Mistral NeMo a été entraîné sur la plateforme d’IA NVIDIA DGX Cloud, qui offre un accès dédié et évolutif à la dernière architecture NVIDIA. NVIDIA NeMo, un framework cloud-native permettant aux développeurs de construire, personnaliser et déployer des modèles d’IA générative a été utilisé pour faire progresser et optimiser le processus ainsi que NVIDIA TensorRT-LLM, un conteneur NVIDIA NIM prédéfini qui permet aux développeurs de réduire les temps de déploiement de plusieurs semaines à quelques minutes.
Le modèle utilise le format de données FP8 pour l’inférence du modèle, ce qui réduit la taille de la mémoire et accélère le déploiement sans aucune dégradation de la précision.
S’il est publié sous licence Apache 2.0, facilitant l’adoption par la communauté de recherche et permettant aux entreprises d’intégrer Mistral NeMo dans des applications commerciales de manière transparente, il est fourni par NVIDIA sous la forme d’un microservice d’inférence NIM de la plateforme NVIDIA AI Enterprise 5.0 introduite en mars dernier lors de la GTC 2024.
Guillaume Lample, cofondateur et scientifique en chef de Mistral AI, commente :
“Nous avons la chance de collaborer avec l’équipe NVIDIA, en tirant parti de leur matériel et de leurs logiciels de premier plan. Ensemble, nous avons développé un modèle offrant une précision, une flexibilité, une efficacité élevées ainsi qu’un support et une sécurité de niveau entreprise sans précédent grâce au déploiement de NVIDIA AI Enterprise”.
Performances de pointe dans sa catégorie
Mistral NeMo se distingue par son raisonnement avancé, sa connaissance approfondie du monde et sa précision en codage. Grâce à son architecture standard, il est facile à intégrer et peut remplacer directement les systèmes utilisant le modèle Mistral 7B, assurant ainsi une transition en douceur pour les utilisateurs existants.
Il est conçu pour des applications telles que les chatbots, les tâches multilingues, le codage et la synthèse de document.
Selon les tests comparatifs de Mistral AI, il surpasse les performances de deux modèles open-source récents, Gemma 2 9B et Llama 3 8B.
Tekken : un tokenizer révolutionnaire
Mistral NeMo excelle particulièrement en anglais, français, allemand, espagnol, italien, portugais, chinois, japonais, coréen, arabe et hindi. Il utilise un nouveau tokenizer appelé Tekken, basé sur Tiktoken, qui a été entraîné sur plus de 100 langues. Tekken surpasse le tokenizer SentencePiece utilisé dans les précédents modèles Mistral en compressant le texte en langage naturel et le code source de manière plus efficace. Il est ainsi environ 30 % plus efficace pour compresser le code source et plusieurs langues majeures, et jusqu’à trois fois plus efficace pour le coréen et l’arabe.
Accès et disponibilité
Les poids de Mistral-Nemo-Base-2407 et du modèle ajusté pour les instructions Mistral-NeMo-12B-Instruct sont disponibles sur HuggingFace. Les utilisateurs peuvent essayer Mistral NeMo avec mistral-inference et l’adapter avec mistral-finetune. Le modèle est également accessible sur la Plateforme de Mistral AI sous le nom open-mistral-nemo-2407 et est empaqueté dans un conteneur NVIDIA NIM, disponible sur ai.nvidia.com.
Collaboration de pointe Mistral AI et NVIDIA lancent Mistral NeMO 12 B
Mistral AI a annoncé ce 16 juillet dernier deux nouveaux LLM publiés sous licence Apache 2.0 : Codestral Mamba 7B et Mathstral 7B. Le premier utilise la nouvelle architecture Mamba introduite fin 2023 par les chercheurs de renom Albert Gu et Tri Dao, et est destiné à la génération de code comme son prédécesseur Codestral. Mathstral, basé sur Mistral 7B, est un modèle spécialisé dans les tâches mathématiques et scientifiques, développé dans le cadre de la collaboration de Mistral AI avec le Proje
Mistral AI a annoncé ce 16 juillet dernier deux nouveaux LLM publiés sous licence Apache 2.0 : Codestral Mamba 7B et Mathstral 7B. Le premier utilise la nouvelle architecture Mamba introduite fin 2023 par les chercheurs de renom Albert Gu et Tri Dao, et est destiné à la génération de code comme son prédécesseur Codestral. Mathstral, basé sur Mistral 7B, est un modèle spécialisé dans les tâches mathématiques et scientifiques, développé dans le cadre de la collaboration de Mistral AI avec le Projet Numina.
Codestral Mamba 7B : une architecture innovante
Codestral Mamba se distingue par une approche radicalement différente de celle des modèles Transformer traditionnels. Mistral AI explique :
“Contrairement aux modèles Transformer, les modèles Mamba offrent l’avantage de l’inférence temporelle linéaire et la capacité théorique de modéliser des séquences de longueur infinie. Ils permettent aux utilisateurs d’interagir de manière approfondie avec le modèle avec des réponses rapides, quelle que soit la longueur d’entrée. Cette efficacité est particulièrement pertinente pour les cas d’utilisation de la productivité du code. C’est pourquoi nous avons formé ce modèle avec des capacités avancées de code et de raisonnement, lui permettant d’être aussi performant que les modèles basés sur les transformateurs SOTA”.
Performances du modèle
Codestral Mamba a été soumis à des benchmarks détaillés, testant sa capacité de récupération contextuelle jusqu’à 256 000 jetons. Les résultats confirment son potentiel en tant qu’assistant de code local et sa capacité à gérer des tâches complexes.
Le modèle a démontré des performances supérieures aux modèles open source concurrents CodeLlama 7B, CodeGemma-1.17B et DeepSeek dans les tests HumanEval.
Disponibilité
Codestral Mamba a été publié sous la licence Apache 2.0, offrant une liberté complète d’utilisation et de modification. Il est disponible à des fins de tests sur la plateforme de Mistral AI et sur Hugging Face, où il peut être déployé en utilisant le SDK mistral-inférence, qui s’appuie sur les implémentations de référence du dépôt GitHub de Mamba. Il peut également l’être sur TensorRT-LLM pour ceux qui préfèrent cette option de déploiement et bientôt sur llama.cpp pour l’inférence locale.
Mathstral 7B : une avancée dans les problèmes mathématiques complexes
Mathstral est une contribution significative de Mistral AI à la communauté scientifique, destinée à résoudre des problèmes mathématiques avancés nécessitant un raisonnement logique complexe et multi-étapes.
Basé sur Mistral 7B, disposant d’une fenêtre contextuelle de 32 000 jetons, Mathstral excelle dans les matières STEM, atteignant des performances de pointe dans sa catégorie. Il a obtenu 56,6 % sur MATH et 63,47 % sur MMLU.
Avec un calcul plus intensif au moment de l’inférence, le modèle peut atteindre des scores encore plus élevés : MATH avec vote majoritaire: 68,37%, MATH avec un modèle de récompense fort parmi 64 candidats: 74,59%.
Mathstral illustre les excellents compromis performance/vitesse obtenus en construisant des modèles pour des objectifs spécifiques, une philosophie que Mistral AI promeut activement. Les poids de Mathstral sont disponibles sur HuggingFace, et le modèle peut être utilisé tel quel ou affiné avec mistral-inference et mistral-finetune.
Mistral AI annonce deux nouveaux modèles open source Codestral Mamba 7B et Mathstral 7B
L’été est déjà là et la nouvelle édition du magazine ActuIA est dans les starting-blocks pour vous accompagner. En version numérique ou papier, ce sera la lecture idéale pour les professionnels et passionnés de l’IA, en vacances ou au bureau !
Ce nouveau numéro, disponible dès le 16 juillet, sera l’occasion pour vous de profiter de nos traditionnelles rubriques, comme le condensé d’actus du trimestre, les levées de fonds, notre sélection culturelle, mais aussi des dossiers d’analyse sur l’open s
L’été est déjà là et la nouvelle édition du magazine ActuIA est dans les starting-blocks pour vous accompagner. En version numérique ou papier, ce sera la lecture idéale pour les professionnels et passionnés de l’IA, en vacances ou au bureau !
Ce nouveau numéro, disponible dès le 16 juillet, sera l’occasion pour vous de profiter de nos traditionnelles rubriques, comme le condensé d’actus du trimestre, les levées de fonds, notre sélection culturelle, mais aussi des dossiers d’analyse sur l’open source, l’impact de l’IA dans le tourisme, secteur en plein bouleversement et sur la sécurité de l’IA, sujet on ne peut plus central.
Actualités
Une revue de toutes les actualités de ces derniers mois : droit, éthique, santé, projets de recherche, business… Retrouvez toutes les informations qu’il ne fallait pas louper ce dernier trimestre en France comme à l’étranger.
Levées de fonds
Une sélection de levées de fonds récentes dont bien évidemment celle de Mistral AI, agrémentée d’une analyse de Chadi Hantouche, Partner chez Wavestone.
Comment faire entrer l’IA dans mon entreprise ?
Virginie Desbordes, Responsable du pôle Confiance numérique du groupe AFNOR, nous apporte son regard sur le déploiement de l’IA dans les entreprises et comment en profiter.
Sélection du comité scientifique
Zoom sur deux publications scientifiques qui ont retenu l’attention de notre comité scientifique au cours des derniers mois.
IA & open source : ce qu’il faut savoir
Nous savons ce qu’est l’open source, comment cela fonctionne, mais que cache-t-elle ?
La fonction RH du futur : comment l’IA aide les collaborateurs dans le développement de leur carrière
Emmanuelle Blons, vice-présidente associée chez Infosys France et spécialiste de la transformation digitale et des RH, ainsi que Belkacem Laïmouche, pilote du groupe « Ressources humaines » du Hub France IA, explorent les aspects de la transformation des RH par l’IA.
SCAI : un institut interdisciplinaire en IA au cœur de Paris
Zoom sur le SCAI, Sorbonne Center for Artificial Intelligence, dirigé par Gérard Biau. Nous vous proposons de découvrir les activités et plusieurs des projets phares de ce centre qui est l’une des références françaises en IA.
Big Data et AI Paris 2024 : l’événement de référence de l’innovation data & IA revient pour accélérer le futur des entreprises
Nous nous penchons sur la 13e édition de l’événement français de référence du big data et de l’intelligence artificielle qui se tiendra cet automne. Avec l’intervention de Yassine El Manouar, directeur de Big Data & AI Paris.
AI Index de Stanford : les principaux enseignements
Quelques chiffres clés sur, entre autres, la recherche IA, la production de modèles IA ou encore les investissements en IA générative.
Phil’IA : sommes-nous tous des Narcisse suspendus à nos selfies et à nos amis virtuels ?
Laurence Vanin, philosophe et essayiste, met notre réflexion philosophique à l’épreuve avec ce texte dans lequel elle nous compare, nous et nos écrans, à Narcisse. Ne manquez pas la publication de son nouveau livre qui offre une réflexion pointue autour de cette thématique.
Redéfinir le tourisme : l’IA comme pilier de la transformation du secteur
Dans ce dossier, nous abordons l’IA dans le tourisme. Entre des entretiens avec Edouard Gerondeau, responsable conseil secteur Tourisme chez Bpifrance, et Sébastien, créateur d’une IA influenceuse de Bretagne, l’utilisation de l’IA dans le tourisme n’aura plus de secret pour vous ! Steve Bellart et Nicolas de Bufala, ingénieurs R&D chez Talan, viennent compléter le dossier.
Portrait de Margaret Masterman Braithwaite
C’est la linguiste et philosophe britannique Margaret Masterman Brathwaite qui sera mise à l’honneur dans cette édition de notre rubrique pop culture.
LENS : lueurs d’Explicabilité pour les modèles de Vision artificielle
Focus sur le projet de recherche de Thomas Fel, candidat au doctorat en intelligence artificielle, à l’ANITI.
Comment l’IA transforme-t-elle les entreprises : insights de Stéphane Roder
Entretien avec Stéphane Roder, ingénieur Télécom Paris-Tech 92 et professeur à l’ESSEC. Il accompagne les directions générales, métiers et Data dans cette nouvelle transformation.
Sécurité de l’IA : l’IA peut-elle se défendre contre des attaques générées par l’IA ?
Françoise Soulié-Fogelman, conseillère scientifique chez Hub France IA, s’interroge sur la capacité de défense des systèmes d’IA face à des attaques d’un nouveau type.
Sécurité de l’IA : Les agents LLM piratent des sites internet en toute autonomie
Alexandra Benamar, ingénieure en R&D chez Talan, soulève une question très importante à l’heure actuelle, alors que les piratages se multiplient : en renforçant nos défenses, les IA contribuent-elles involontairement à affiner les stratégies offensives des hackers ?
Parole d’experts
Ce numéro met en lumière quatre experts en intelligence artificielle. Découvrez les expertises d’Iana Iatsun, spécialiste en intelligence artificielle à la Banque de France, Simone Vannuccini, titulaire de la Chaire de professeur junior en économie de l’intelligence artificielle et de l’innovation à l’Université Côte d’Azur (UCA), Nadia Guerouaou, docteure en neurosciences cognitives et Arnaud Muller, co-fondateur de Cleyrop.
Transformer la microbiologie en simplifiant l’analyse d’échantillons
Focus sur la start-up NeuralTeks, fondée par Mehdi Nasreddine et Souheil Hanoune. NeuralTeks mélange l’intelligence artificielle aux biotechnologies, avec comme objectif de transformer le paysage des laboratoires de microbiologie.
L’IA au Brésil : Stratégies, défis et opportunités dans un marché émergent
Alors que l’IA occupe une place de plus en plus importante au Brésil, découvrez comment le géant de l’Amérique latine aborde les premières étapes de cette transformation et les défis que le pays rencontre. Ce dossier est assemblé par Jean-Pierre Briot, directeur de recherche émérite CNRS au LIP6 et Giordano Cabral, professeur à l’UFPE. Cet article est complété par un entretien avec Fabio Cozman et Giordano Cabral disponible sur ActuIA et qui vous permettra d’aller plus loin sur le sujet. Le Brésil rencontre des défis très intéressants et intéressera également les entrepreneurs à la recherche de nouveaux prospects à l’international.
Sélection culturelle
Notre sélection de livres consacrés à l’intelligence artificielle avec différents axes : éthique, développement durable de la technologie, business, recherche, etc. Je m’abonne !
ActuIA n 16 ce que vous réserve le nouveau numéro du magazine de l’intelligence artificielle
Le nouveau numéro du magazine ActuIA va sortir ! Pour beaucoup le mois de juillet est synonyme de début de l’été et de vacances; cette nouvelle édition saura vous accompagner au bureau comme en congés pour être certain de rattraper tout ce que vous avez pu manquer dans l’actualité de l’intelligence artificielle. Disponible en kiosques dès le 16 juillet prochain , et sur sur abonnement dès à présent.
L’IA, transformatrice des métiers
Avec ce n° 16 d’ActuIA, vous explorerez de nombreuses facettes
Le nouveau numéro du magazine ActuIA va sortir ! Pour beaucoup le mois de juillet est synonyme de début de l’été et de vacances; cette nouvelle édition saura vous accompagner au bureau comme en congés pour être certain de rattraper tout ce que vous avez pu manquer dans l’actualité de l’intelligence artificielle. Disponible en kiosques dès le 16 juillet prochain , et sur sur abonnement dès à présent.
L’IA, transformatrice des métiers
Avec ce n° 16 d’ActuIA, vous explorerez de nombreuses facettes de l’IA. Exemple avec Virginie Desbordes, responsable du pôle confiance numérique du groupe AFNOR, qui explique comment l’IA est entrée au sein des entreprises et pourquoi il est nécessaire de prendre le temps de l’encadrer afin de profiter pleinement de cette transformation.
Ce qui change aussi, c’est la fonction de RH et c’est de cette évolution qu’Emmanuelle Blons, vice-présidente associée chez Infosys France et spécialiste de la transformation digitale et des RH, ainsi que Belkacem Laïmouche, pilote du groupe « Ressources humaines » du Hub France IA vous parleront. Ils ont étudié pour cela les différents aspects de ce développement ainsi que les opportunités que l’IA présente pour cette fonction.
L’IA comme invitation au voyage
Ce numéro vous emmènera au Brésil où nous ne parlerons ni de samba ni de carnaval, mais bien de la transformation numérique du pays. Jean-Pierre Briot, directeur de recherche émérite CNRS au LIP6 et Giordano Cabral, professeur à l’UFPE, ont analysé pour vous l’ascension de l’IA dans ce pays ainsi que les défis rencontrés sur place. Pour aller plus loin dans la découverte de ce géant du continent américain, nous vous proposerons une interview à découvrir grâce à un QRcode. Dans le précédent numéro, c’était en Inde que nous avions posé nos valises pour en savoir plus sur la place de l’IA, si vous ne l’avez pas encore lu, ne perdez plus de temps et abonnez-vous dès maintenant pour le recevoir en même temps qu’ActuIA n° 16 (ou rendez-vous en kiosque).
Cet été, nombre de personnes ont réservé des séjours, des visites et autres en utilisant, peut-être sans le savoir l’IA. Du côté prestataire, les choses changent également. Alors pour mieux rester dans la thématique estivale, quoi de mieux qu’un panorama sur les usages de l’IA pour le tourisme !
Pas de plages certes près du SCAI, basé à Paris, mais un dynamisme qui séduit l’écosystème depuis ses débuts. Ce nouveau numéro est aussi l’occasion de se rendre donc dans la capitale, non pas pour les Jeux olympiques, mais pour en apprendre plus sur cet institut en IA de Sorbonne Université, ses projets et vous inviter, si vous ne les suivez pas encore, à vous pencher sur leurs activités et événements, dont NeurIPS@Paris 2024 bien sûr !
Au cœur de l’open source
Pour cette seizième édition d’ActuIA, nous avons également souhaité nous plonger dans un milieu central pour notre secteur, l’open source. Nous le faisons à travers une enquête, rédigée par Stéphane Nachez, directeur de la publication d’ActuIA. Il vous transportera au cœur de ce qu’est réellement l’open source dont on entend parler sous tous les angles. Que cache-t-elle ? Quelles sont ses réelles motivations ? Avec cette enquête, l’open source et ses dessous n’auront plus aucun secret pour vous. Une lecture qui promet d’être passionnante et riche en découvertes.
Big Data & AI Paris : Un événement à ne pas rater
Beaucoup d’entre nous pensent déjà à l’automne et organisent la rentrée. Dans notre cas, nous sommes encore en train de sélectionner les événements immanquables et Big Data & AI Paris fait figure de référence. Si vous n’avez pas encore noté l’édition 2024 dans votre agenda, il n’est pas trop tard !
Vous retrouvez bien entendu notre sélection d’actualités du trimestre, de papiers, mais aussi les portraits de quatre experts qui ont accepté de répondre chacun à deux questions sur leur parcours, leur travail et/ou l’écosystème IA. Nous sommes également partis à la rencontre de NeuralTek, une jeune pousse qui s’impose dans le secteur d’analyse d’images basée sur l’IA. À la fin de chaque numéro, nous recommandons également plusieurs ouvrages disponibles en librairie et pour la plupart au format ePub.
Pour être sûr de ne pas rater ces dossiers et bien d’autres articles captivants au sommaire de cette édition, abonnez-vous sans attendre !
Ne manquez pas l'actualité de l'intelligence artificielle grâce au nouveau numéro d’ActuIA
C’est à l’IRCAM (Institut de Recherche et Coordination Acoustique/Musique) que Kyutai a présenté ce mercredi 3 juillet, un peu moins de huit mois après son lancement, le prototype expérimental de son premier modèle d’IA générative doté de capacités vocales, à l’instar de GPT-4o : Moshi (Moshi-moshi signifie allo en japonais), qui a été entraîné à partir d’enregistrements d’appels passés entre 1994 et 2002 aux Etats-Unis.
C’est à Station F, lors de la conférence AI Pulse, organisée par Scaleway,
C’est à l’IRCAM (Institut de Recherche et Coordination Acoustique/Musique) que Kyutai a présenté ce mercredi 3 juillet, un peu moins de huit mois après son lancement, le prototype expérimental de son premier modèle d’IA générative doté de capacités vocales, à l’instar de GPT-4o : Moshi (Moshi-moshi signifie allo en japonais), qui a été entraîné à partir d’enregistrements d’appels passés entre 1994 et 2002 aux Etats-Unis.
C’est à Station F, lors de la conférence AI Pulse, organisée par Scaleway, filiale de l’entreprise Iliad fondée par Xavier Niel, que Kyutaia été lancé le 17 novembre dernier en présence de son équipe scientifique et de ses trois co-fondateurs : Xavier Niel, Rodolphe Saadé, fils du fondateur du groupe CMA CGM dont il assure la direction, et Eric Schmidt. Financé à hauteur de 300 millions d’euros, 100 millions d’euros d’Iliad, 100 du groupe CMA CGM et les 100 derniers restants via Schmidt Futures, l’entreprise philanthropique cofondée par Eric Schmidt et sa femme Wendy.
Ce laboratoire d’initiative privée à but non-lucratif, entièrement dédié à la recherche ouverte en IA, s’est donné pour objectif de développer des LLM pour s’attaquer “aux défis de l’IA moderne” en s’appuyant sur la puissance de calcul superpod Nabu 23 de Scaleway.
Moshi, la 1ère IA vocale accessible à tous
Il est désormais possible de communiquer de manière fluide, naturelle et expressive avec une IA. En seulement 6 mois, avec une équipe de 8 personnes, Kyutai a développé un modèle d’IA multimodal doté de capacités avancées de synthèse vocale et de reconnaissance des émotions.
Moshi a tout d’abord été entraîné avec le LLM Helium 7B puis avec un mix de données textuelles et audio. Pour lui apprendre à tenir une conversation, les chercheurs l’ont affiné avec des données synthétiques de dialogues. Ils ont travaillé avec une artiste nommée Alice pour la voix, les monologues ou dialogues ont permis d’entraîner le modèle text-to-speech à reconnaître 70 émotions. Moshi est donc capable d’adapter son ton, chuchoter, hésiter, faire des plaisanteries, prendre un accent. Son temps de latence est de seulement 160 millisecondes (contre 232 ms au minimum pour GPT-4o), ce qui donne vraiment l’impression de converser en temps réel.
Compact, Moshi peut également être installé localement et fonctionner en toute sécurité sur un appareil non connecté.
Pendant la présentation, l’équipe de Kyutai a interagi avec Moshi pour illustrer son potentiel en tant que coach ou compagnon, par exemple, et sa créativité à travers l’incarnation de personnages dans des jeux de rôle.
À la fin de la présentation, les participants – chercheurs, développeurs, entrepreneurs, investisseurs et journalistes – ont eux-mêmes pu interagir avec Moshi. Si vous désirez le faire vous aussi, il suffit pour vous inscrire sur la liste d’attente de remplir votre adresse mail, les conversations sont toutefois limitées à 5 mns.
Avec Moshi, Kyutai vise à soutenir la recherche ouverte en IA et à favoriser le développement de l’ensemble de l’écosystème. Le code et les poids des modèles seront bientôt accessibles librement, une première pour ce type de technologie. Ils seront utiles tant aux chercheurs qu’aux développeurs travaillant sur des produits et services basés sur la voix. Cette technologie pourra être examinée en détail, modifiée, étendue ou spécialisée selon les besoins. La communauté pourra enrichir la base de connaissances et la factualité de Moshi, actuellement délibérément restreintes dans un modèle aussi léger, tout en exploitant ses capacités d’interaction vocale exceptionnelles.
Kyutai présente Moshi la première IA vocale générative open source
Intelligence artificielle, machine learning… Ces “buzzwords” sont devenus des incontournables du vocabulaire technologique, mais combien de personnes comprennent réellement leur signification profonde ? Avant de nous aventurer plus loin dans cet article pour comprendre comment ces technologies peuvent être mises au service du e-commerce, prenons le temps de dissiper le mystère qui les entoure.
L’intelligence artificielle (IA) se caractérise par la création d’algorithmes informatiques capables d’
Intelligence artificielle, machine learning… Ces “buzzwords” sont devenus des incontournables du vocabulaire technologique, mais combien de personnes comprennent réellement leur signification profonde ? Avant de nous aventurer plus loin dans cet article pour comprendre comment ces technologies peuvent être mises au service du e-commerce, prenons le temps de dissiper le mystère qui les entoure.
L’intelligence artificielle (IA) se caractérise par la création d’algorithmes informatiques capables d’accomplir des tâches avec une “certaine” intelligence. Ce domaine est très vaste et regroupe des dizaines de champs d’études comme par exemple les systèmes distribués (systèmes multi-agents), la résolution de problèmes d’optimisation (métaheuristique), la construction de systèmes experts, la satisfaction de contraintes ou encore la planification.
Le machine learning est l’un de ces champs d’étude de l’IA. Les algorithmes de machine learning ont la capacité d’apprendre de la donnée et d’en extraire de l’information pertinente grâce à l’application de règles statistiques qui définissent un modèle d’apprentissage. Avec le machine learning, le développeur ne code plus directement le moyen de résoudre un problème mais le moyen d’apprendre à résoudre le problème sur la base de données.
L’apprentissage automatique se décompose généralement en deux phases fondamentales : l’apprentissage et la prédiction. Durant la phase d’entraînement, l’algorithme ajuste ses paramètres en utilisant un ensemble de données, apprenant ainsi les modèles et relations sous-jacents présents dans les données. Une fois le modèle entraîné, il peut être déployé pour effectuer des prédictions ou prendre des décisions sur de nouvelles données au cours de la phase d’inférence.
Lorsque l’on sait qu’un site e-commerce gère une large gamme de produits, attire de nombreux utilisateurs effectuant diverses actions (navigation, expression d’un intérêt pour les produits, achats) et que tout cela génère une quantité considérable de données… On réalise immédiatement le potentiel significatif des algorithmes de machine learning dans la compréhension du comportement du visiteur et, par conséquent, dans l’amélioration directe de l’expérience client et l’optimisation des ventes.
Pour garantir l’efficacité de ces algorithmes, deux ingrédients sont nécessaires : des données de qualité et des contextes d’utilisation spécifiques. En voici quelques exemples concrets.
Le machine learning pour optimiser la recherche de produits
En matière de search, le machine learning peut être employé de différentes manières :
– Pour optimiser la compréhension automatique du sens sémantique d’une requête. Illustrons cela avec une recherche vocale. Lorsqu’un visiteur exprime “Je voudrais un canapé gris s’il te plaît”, le moteur de recherche, basé sur le machine learning, peut discerner que les termes importants sont “canapé gris” et que “gris” correspond à une couleur, en mettant de côté le reste de la phrase. Grâce à des technologies issues du NLP (Natural Language Processing) ou plus récemment grâce aux LLMs (Large Language Models), le moteur de recherche a la capacité de comprendre sémantiquement l’utilisateur, même si la phrase est formulée en langage naturel, de manière complexe.
– Pour proposer des produits en cas d’expression de recherche inconnue. En cas d’expression de recherche inconnue, il est envisageable d’utiliser un algorithme de réouverture. Celui-ci permet de présenter des articles pertinents même s’ils sont désignés avec des termes différents. Par exemple, si un visiteur saisit “sombrero”, le site marchand pourra proposer des bonnets en hiver ou des chapeaux de paille en été. Cette capacité résulte du fait que le machine learning comprend sémantiquement que “sombrero” est proche de “bonnet” ou de “chapeau”.
Un autre aspect de l’application de ces algorithmes consiste à personnaliser le parcours client.
Les algorithmes de machine learning ouvrent des perspectives en matière de personnalisation
Celle-ci peut se faire notamment au niveau du ranking de produits et se manifeste dans divers contextes :
– la saisonnalité : le ranking peut varier en accord avec les saisons. Par exemple, si les visiteurs cherchent des pulls en été, le système privilégiera des articles plus légers, tandis qu’en hiver, il mettra en avant des pulls plus épais et chauds.
– l’appétence utilisateur : lorsque ce dernier effectue des recherches de produits pour hommes puis saisit le terme “chaussures”, les résultats de recherche pourront être orientés vers les chaussures destinées aux hommes.
– le profil utilisateur : il est possible d’apprendre à classifier les clients et définir des profils types qui serviront ensuite à personnaliser les réponses du moteur de recherche ou des algorithmes de recommandation, voire à créer des listings de produits personnalisés sur la page d’accueil par exemple.
– les mots clés tapés : lorsque l’utilisateur saisit “jean”, le moteur de recherche comprend qu’il cherche principalement des pantalons plutôt que des vestes en jean, une déduction tirée de son apprentissage des attentes des utilisateurs. En ajustant le ranking en fonction des mots clés, le machine learning organise les produits de manière pertinente, en intégrant par exemple des notions de best-sellers.
La personnalisation peut également s’étendre à d’autres aspects, comme par exemple dans:
– les fiches produits : des suggestions peuvent être faites pour des produits populaires qui se marient bien avec celui que l’utilisateur visualise. Cette fonctionnalité repose sur des algorithmes de type cross-sell, identifiant les produits fréquemment achetés ensemble. De plus, il est possible d’afficher les choix d’autres clients qui ont acheté le même produit, offrant ainsi des suggestions complémentaires pour un panier. Une autre possibilité serait de suggérer des articles similaires, mais dans une gamme de prix supérieure (up sell).
– la page d’accueil : des produits personnalisés peuvent être proposés à l’utilisateur en fonction de son historique. Cela peut se faire de différentes manières : en ouverture pour lui faire découvrir des articles qu’il ne connaît pas encore mais qui pourraient l’intéresser, ou en fermeture pour lui suggérer des produits qu’il a déjà achetés ou qu’il acquiert fréquemment. Cette approche est particulièrement pertinente dans l’alimentaire, où la recommandation de produits réguliers facilite l’expérience d’achat.
Les scénarios d’utilisation mentionnés se concentrent sur des améliorations directes de l’expérience client. Parallèlement, le machine learning peut également contribuer à fournir aux personnes qui gèrent le site marchand des pistes d’amélioration de leurs tâches professionnelles.
Les algorithmes de machine learning : des alliés puissants pour les e-merchandiseurs
Considérons une situation où un groupe de produits semble mal ventilé au sein d’une catégorie. Les algorithmes de machine learning ont la capacité de détecter cette situation et de la signaler. Une intervention humaine serait ensuite nécessaire pour évaluer et qualifier la catégorie. De plus, les algorithmes peuvent également repérer des catégories qui manquent de pertinence, regroupant une variété de produits sans lien significatif et suggérer de la diviser en sous-catégories plus spécifiques.
Ces algorithmes offrent également aux e-merchandiseurs des suggestions de synonymes pertinents à intégrer dans le Back Office. Cette fonctionnalité repose sur l’analyse des zéro résultats des utilisateurs, permettant ainsi une optimisation fine des résultats de recherche. Par exemple, la proposition de synonymes tels que ‘applique murale’ pour ‘luminaire’, ou encore ‘chemise de nuit’ pour ‘nuisette’, démontre la capacité de ces technologies à anticiper et répondre aux attentes des clients.
En conclusion
L’expertise des algorithmes de machine learning réside dans leur aptitude à assimiler finement les comportements des utilisateurs, à identifier des tendances, à classifier et à révéler des corrélations significatives entre les produits. Cette capacité en fait des outils incontournables pour optimiser l’expérience globale des utilisateurs, en particulier dans les domaines de la recherche et de la recommandation. Ils ouvrent ainsi la voie à une expérience utilisateur plus immersive et personnalisée, contribuant de manière conséquente à maximiser le taux de conversion sur le site marchand.
À quoi ressemblera le futur de la recherche en ligne ? Il est certain qu’il ne se limitera plus aux requêtes par mots-clés telles que nous les connaissons aujourd’hui. Les évolutions récentes de l’intelligence artificielle, notamment dans le domaine de l’IA générative ; comme par exemple les LLMs (modèles de langage naturel capables de comprendre et générer du texte humain) utilisés par ChatGPT ; ouvrent la voie à de nouvelles perspectives.
Ces avancées technologiques offrent des opportunités de réinventer la manière dont nous utilisons les moteurs de recherche et pourraient évoluer vers une interaction plus directe, où la discussion avec les moteurs de recherche deviendrait aussi naturelle que celle avec un vendeur physique en magasin.
Demain, l’expérience utilisateur sur les sites web pourrait subir une transformation majeure, marquant une évolution significative par rapport à nos habitudes actuelles.
“Permettre aux entreprises de concilier innovation et respect des droits des personnes” : tel est l’objectif que la CNIL (Commission Nationale de l’Informatique et des Libertés) poursuit avec ses recommandations. Après avoir soumis une première série de fiches pratiques à consultation publique en 2023, à l’issue de laquelle elle a publié le 8 avril dernier ses premières recommandations sur l’application du RGPD au développement des systèmes d’IA, elle lance une nouvelle consultation publique por
“Permettre aux entreprises de concilier innovation et respect des droits des personnes” : tel est l’objectif que la CNIL (Commission Nationale de l’Informatique et des Libertés) poursuit avec ses recommandations. Après avoir soumis une première série de fiches pratiques à consultation publique en 2023, à l’issue de laquelle elle a publié le 8 avril dernier ses premières recommandations sur l’application du RGPD au développement des systèmes d’IA, elle lance une nouvelle consultation publique portant sur une deuxième série de fiches pratiques et un questionnaire consacré à l’encadrement du développement des systèmes d’IA.
Pour la CNIL, le RGPD a vocation à s’appliquer à l’ensemble des traitements de données personnelles, à la fois dans le secteur public et le secteur privé, à l’exception toutefois des traitements relevant du régime spécifique aux secteurs “police-justice” ou du régime intéressant la défense nationale ou la sûreté de l’État.
Les principaux acteurs français de l’IA, qu’il s’agisse d’entreprises, de laboratoires ou encore des pouvoirs publics, rencontrés par la CNIL, ont fait remonter un fort besoin de sécurité juridique mais aussi des inquiétudes liées au RGPD : selon certains, ses principes de finalité, de minimisation, de conservation limitée et de réutilisation restreinte freineraient voire empêcheraient certaines recherches ou applications de l’intelligence artificielle. Les 7 premières fiches ont donc abordé ces problèmes et ont également clarifié certaines règles applicables à la recherche scientifique, à la réutilisation de bases de données ou à la réalisation d’analyse d’impact sur la protection des données (AIPD).
Dans la continuité de ces travaux et afin d’apporter des réponses complémentaires aux interrogations partagées par les professionnels, les 7 fiches de cette seconde consultation traitent plusieurs questions majeures d’innovation et de protection :
L’encadrement du web scraping : le développement des systèmes d’IA nécessite souvent l’accès à des bases de données volumineuses, collectées en ligne. Le web scraping, largement utilisé pour cette collecte, doit être rigoureusement encadré pour respecter les droits des personnes dont les données sont utilisées. La CNIL propose de centraliser un registre volontaire pour améliorer l’information des personnes concernées et faciliter l’exercice de leurs droits ;
Open source, transparence et collaboration : la publication de modèles d’IA en open source est bénéfique pour la transparence et la collaboration au sein de l’écosystème IA. Elle permet la vérification par les pairs et l’amélioration continue des modèles. Toutefois, cette pratique doit être accompagnée de garanties pour prévenir les utilisations malveillantes et assurer la sécurité des données. La CNIL insiste sur la nécessité de suivre les modèles et leurs évolutions pour permettre une information et un exercice des droits effectifs ;
Base légale d’intérêt légitime : l’intérêt légitime est souvent mobilisé comme base légale pour le traitement des données personnelles dans le développement de l’IA. Cette base exige une évaluation rigoureuse des risques pour les personnes et la mise en œuvre de conditions spécifiques pour protéger leurs données. La CNIL fournit des éléments concrets pour aider les responsables de traitement à respecter ces exigences, notamment lors de l’utilisation de techniques de web scraping ou de la publication de modèles en open source ;
Information et exercice du droit des personnes : la CNIL souligne l’importance de placer l’information et l’exercice des droits des individus au cœur des systèmes d’IA qui utilisent des données personnelles. Pour être en conformité, les développeurs doivent informer clairement les personnes concernées sur l’utilisation de leurs données et permettre l’exercice effectif de leurs droits, comme le droit à l’information, à la rectification et à la suppression. La CNIL fournit des directives pour aider à respecter ces obligations et précise les situations où des dérogations sont possibles. Elle aborde aussi les défis posés par les droits individuels face à la nature statistique des IA, en offrant des solutions pour le droit de rectification et de suppression.
Applicabilité du RGPD aux modèles d’IA
La question de l’application du RGPD aux modèles d’IA eux-mêmes se pose, notamment en ce qui concerne la sécurisation des modèles et la protection contre la mémorisation et l’extraction des informations issues de l’entraînement. La CNIL sollicite les avis des professionnels via un questionnaire dédié de cette consultation publique.
Pour la CNIL :
“Le développement de systèmes d’IA est conciliable avec les enjeux de protection de la vie privée. Plus encore, la prise en compte de cet impératif permettra de faire émerger des dispositifs, outils et applications éthiques respectueux des droits et libertés fondamentaux. C’est à cette condition que les citoyens feront confiance à ces technologies”.
Si vous désirez contribuer à ses travaux, la consultation publique est ouverte jusqu’au 1er septembre prochain. Vous pouvez retrouver les 7 fiches soumises à consultation ici et retrouver le formulaire de participation via ce lien.
En février dernier, Stability AI annonçait ses deux derniers modèles text-to-image : Stable Cascade et Stable Diffusion 3 ainsi que l’ouverture de la liste d’attente pour une prévisualisation anticipée de cette dernière itération de son modèle phare. La start-up a récemment publié Stable Diffusion 3 (SD3) Medium, un modèle open source de 2 milliards de paramètres qu’elle présente comme son modèle de génération d’images le plus sophistiqué à ce jour.
La famille SD3 comprend des modèles allant de
En février dernier, Stability AI annonçait ses deux derniers modèles text-to-image : Stable Cascade et Stable Diffusion 3 ainsi que l’ouverture de la liste d’attente pour une prévisualisation anticipée de cette dernière itération de son modèle phare. La start-up a récemment publié Stable Diffusion 3 (SD3) Medium, un modèle open source de 2 milliards de paramètres qu’elle présente comme son modèle de génération d’images le plus sophistiqué à ce jour.
La famille SD3 comprend des modèles allant de 800 millions à 8 milliards de paramètres, offrant aux utilisateurs un éventail d’options adaptées à leurs besoins créatifs spécifiques.
Les modèles de petite taille comme SD3 Medium offrent une combinaison équilibrée de performance, accessibilité et efficacité. Ils sont plus faciles à recycler et à affiner pour des cas d’utilisation spécifiques et accessibles à un plus large éventail d’utilisateurs, puisque compatibles avec le matériel grand public.
SD3 Medium
Selon Stability AI, “la petite taille de SD3 medium le rend parfait pour fonctionner sur des PC et des ordinateurs portables grand public ainsi que sur des GPU de niveau entreprise”.
Le minimum requis pour exécuter Stable Diffusion Medium n’est en effet que de 5 Go de VRAM (mémoire vidéo). Stability AI recommande néanmoins 16 Go de VRAM pour une utilisation vraiment confortable et optimale.
SD3 est un modèle de diffusion latente qui se compose de trois encodeurs de texte différents (CLIP L/14, OpenCLIP bigG/14 et T5-v1.1-XXL), d’un nouveau modèle de transformateur de diffusion multimodale (MMDiT) et d’un modèle d’auto-encodeur (VAE ou Variational Autoencoder) à 16 canaux similaire à celui utilisé pour Stable Diffusion XL
Les performances du modèle
Selon Stability AI, SD3 Medium se distingue par son photoréalisme, le respect des prompts, sa capacité à générer des textes et les possibilités de fine-tuning.
Il présente plusieurs améliorations significatives :
Qualité Globale et Photoréalisme : Stable Diffusion 3 Medium produit des images d’une qualité exceptionnelle, avec des détails précis, des couleurs vives et un éclairage réaliste. Grâce à l’intégration d’un VAE à 16 canaux, il parvient à surmonter les défis typiques des modèles IA, notamment le réalisme des mains et des visages ;
Compréhension Rapide : SD3 Medium peut traiter des invites longues et complexes, il excellerait dans la gestion du raisonnement spatial, des éléments de composition, des actions et des styles. Les utilisateurs peuvent optimiser les performances et l’efficacité grâce aux trois encodeurs de texte intégrés ;
Typographie : l’architecture Diffusion Transformer permet d’atteindre une qualité de texte inégalée, réduisant les erreurs d’orthographe, de crénage, de formation des lettres et d’espacement.
Économe en Ressources : Stable Diffusion 3 Medium fonctionne parfaitement sur des GPU grand public standards, sans dégradation des performances, grâce à son faible encombrement VRAM ;
Réglage Fin : Ce modèle est conçu pour absorber des détails nuancés à partir de petits ensembles de données, le rendant idéal pour la personnalisation et les applications spécifiques ;
Voici quelques images générées par le modèle et leurs prompts partagées par Stability AI :
Collaboration avec NVIDIA et AMD
Stability AI a collaboré avec NVIDIA pour optimiser les performances de ses modèles, y compris Stable Diffusion 3 Medium, en utilisant les GPU NVIDIA® RTX™ et TensorRT™. Les versions optimisées pour TensorRT offrent une augmentation de 50 % des performances, garantissant une efficacité inégalée.
De plus, AMD a optimisé l’inférence pour Stable Diffusion 3 Medium sur divers appareils, y compris les derniers APU d’AMD, les GPU grand public et les GPU MI-300X Enterprise, assurant une compatibilité et des performances de pointe sur une large gamme de matériels.
Accessibilité et Licences
Stable Diffusion 3 Medium est un modèle open source publié sous la licence Stability Non-Commercial Research Community, réaffirmant l’engagement de Stability AI envers une IA générative ouverte. Pour un usage commercial, les artistes, designers et développeurs peuvent se tourner vers une nouvelle licence de créateur pour 20$ par mois. Quant aux entreprises souhaitant une utilisation commerciale à grande échelle, Stability AI propose des licences adaptées et invite à les contacter pour plus de détails.
Essayer Stable Diffusion 3
Stable Diffusion 3 Medium est désormais disponible via l’API alimentée par Fireworks AI. Les utilisateurs peuvent également essayer d’autres versions de la série Stable Diffusion 3, telles que le modèle SD3 Large et SD3 Ultra, grâce à un essai gratuit de trois jours sur le chatbot Stable Assistant et sur Discord via Stable Artisan.
Fort du succès de la première édition de son appel à projets “Défi Innovation” consacré aux innovations durables, le Groupement Les Mousquetaires renouvelle l’expérience avec une deuxième édition, cette fois centrée sur l’IA. Cet AAP, orchestré autour de trois thématiques clés, vise à accélérer la transformation du Groupement et à affirmer ses ambitions en matière d’innovation.
Si pour nombre d’entre nous, les Mousquetaires évoquent Intermarché, le Groupement réunit sept enseignes autour de l’al
Fort du succès de la première édition de son appel à projets “Défi Innovation” consacré aux innovations durables, le Groupement Les Mousquetaires renouvelle l’expérience avec une deuxième édition, cette fois centrée sur l’IA. Cet AAP, orchestré autour de trois thématiques clés, vise à accélérer la transformation du Groupement et à affirmer ses ambitions en matière d’innovation.
Si pour nombre d’entre nous, les Mousquetaires évoquent Intermarché, le Groupement réunit sept enseignes autour de l’alimentaire, l’équipement de la maison et la mobilité. Créé en 1969, il rassemble aujourd’hui plus de 3 000 chefs d’entreprise indépendants et 150 000 salariés dans plus de 4 100 points de vente de proximité en France, Belgique, Pologne et au Portugal.
En 2016, pour accélérer la transformation digitale du Groupe, il a créé son propre laboratoire d’innovation : la Direction de l’Innovation. En 2019, un partenariat a été établi entre Intermarché, la STIME, la Direction des Systèmes d’Information (DSI) du Groupement et Microsoft France pour la création d’une Data Factory afin d’exploiter le potentiel de la donnée au service d’Intermarché, avant de l’être aux autres enseignes des Mousquetaires. En 2021, l’équipe Data Factory lançait son propre challenge pour l’élaboration d’un modèle prédictif des ventes journalières.
L’appel à projets de la seconde édition du Défi innovation
Ouvert à tous, cet AAP a pour objectif de repérer et d’accompagner des solutions innovantes capables de répondre aux nouveaux modes de consommation ainsi qu’aux défis opérationnels, sociétaux et environnementaux du secteur de la distribution. Piloté par la Direction de l’innovation avec le soutien de Schoolab, incubateur de start-ups, il se focalise sur trois thématiques spécifiques :
L’IA au service de l’expérience client : les participants devront proposer des solutions pour personnaliser les offres, les communications et les conseils, à la fois en magasin et sur les plateformes numériques ;
L’IA au service de l’efficience des points de vente : les projets devront viser l’optimisation des stocks, la prévention des ruptures, l’automatisation de l’assortiment et de la stratégie de prix, ainsi que la gestion de la fraude et l’amélioration des processus de recrutement et de formation ;
L’IA au service d’un commerce responsable : les solutions proposées devront améliorer la gestion des ressources telles que l’énergie, l’eau, les déchets et le gaspillage alimentaire, tout en favorisant une économie circulaire performante.
Conditions de participation et récompenses
Les candidats devront soumettre des projets innovants en lien avec l’une des trois thématiques, trois seront retenus pour chacune d’elles. Ils peuvent être à l’étape de l’idée, de prototype ou de produit avancé.
Le projet gagnant bénéficiera d’une étude de faisabilité approfondie avec un budget de 10 000 €, d’un espace dédié au sein du Showroom des innovations des Mousquetaires pendant un an, d’une place dans l’espace de coworking et d’une visibilité auprès de plus de 3 000 chefs d’entreprise via les canaux internes du Groupement.
Les deuxièmes et troisièmes lauréats seront encadrés par le studio d’innovation Schoolab pendant six mois, auront accès à l’un de ses incubateurs, à des contenus pédagogiques de son programme “Starter”, à des ateliers et des événements mensuels ainsi qu’à un réseau d’entrepreneurs.
Les inscriptions sont ouvertes et ce, jusqu’au 19 juillet prochain, sur le site www.defi-mousquetaires.com. Les projets lauréats seront annoncés le 10 septembre suivant, l’accompagnement débutera la semaine suivante.
Thierry Cotillard, président du Groupement Les Mousquetaires, conclut :
“L’IA peut véritablement révolutionner le secteur de la grande distribution. Elle permet de réinventer notre façon de faire du commerce, de renforcer l’attractivité commerciale de nos concepts et de transformer de façon optimale l’expérience client au cœur de notre stratégie. Elle représente pour Les Mousquetaires un enjeu décisif pour demain. J’ai hâte de découvrir les propositions qui découleront de cet appel à projet, et de pouvoir les concrétiser ensemble”.
En juin 2022, la licorne canadienne Cohere lançait “Cohere For AI”, un laboratoire de recherche à but non lucratif et une communauté dédiée à contribuer à la recherche fondamentale en apprentissage automatique open-source. Cohere For AI a récemment dévoilé Aya 23, une nouvelle famille de grands modèles de langage multilingues. Les poids des deux versions d’Aya 23, comptant 8 milliards et 35 milliards de paramètres, sont disponibles sur Hugging Face.
Le développement des modèles Aya 23 s’appuie s
En juin 2022, la licorne canadienne Cohere lançait “Cohere For AI”, un laboratoire de recherche à but non lucratif et une communauté dédiée à contribuer à la recherche fondamentale en apprentissage automatique open-source. Cohere For AI a récemment dévoilé Aya 23, une nouvelle famille de grands modèles de langage multilingues. Les poids des deux versions d’Aya 23, comptant 8 milliards et 35 milliards de paramètres, sont disponibles sur Hugging Face.
Le développement des modèles Aya 23 s’appuie sur le jeu de de données Aya, une collection pour le réglage d’instructions open source comprenant 513 millions d’invites et de réponses LLM en 114 langues. Ce projet lancé par Cohere pour “aider à la prise en charge des langues sous-représentées” a rassemblé 3 000 contributeurs du monde entier, permettant de créer le plus grand ensemble de données multilingues à ce jour et de développer le modèle Aya 101, publié en open source en février dernier.
Alors qu’Aya 101 couvrait 101 langues, Cohere passe de l’étendue à la profondeur avec Aya 23 qui associe un modèle pré-entraîné très performant à la collection Aya pour offrir des performances robustes dans 23 langues (Arabe, chinois (simplifié et traditionnel), tchèque, néerlandais, anglais, français, allemand, grec, hébreu, hindi, indonésien, italien, japonais, coréen, persan, polonais, portugais, roumain, russe, espagnol, turc, ukrainien et vietnamien), atteignant ainsi près de la moitié de la population mondiale.
La famille de modèles Aya 23 repose sur une architecture Transformer uniquement décodeur et est basée sur les modèles phares Command de Cohere, Aya-23-35B sur une version affinée de Command R.
Tandis qu’Aya 23-8B est conçu pour offrir un équilibre optimal entre performance et efficacité des ressources, Aya 23-35B est destiné à des cas d’utilisation plus complexes et à des besoins de performance plus élevés.
Performances des modèles Aya 23
Cohere for AI a comparé les performances d’Aya 23 à celles de modèles open source massivement multilingues tels que Aya-101 et de modèles à poids ouvert largement utilisés. Il surpasse des modèles largement utilisés comme Gemma, Mistral 7B Intstruct et Mixtral sur une vaste gamme de tâches discriminatives et génératives.
35B Aya 23 a obtenu les résultats les plus élevés sur tous les benchmarks pour les langues couvertes, tandis que 8B Aya 23 a démontré les meilleures performances multilingues de sa catégorie.
Si l’an passé, la NASA a déclaré 2023 “l’année de l’open source”, elle a toujours fait de l’accès à ses recherches une priorité. Pour faciliter le partage de ses données, la Direction des missions scientifiques (SMD) de la NASA a lancé la version bêta du moteur Science Discovery Engine, optimisée par la plateforme de Sinequa, un leader du marché de la recherche et de l’analyse de données basées sur l’IA.
Cofondé en 2005 par Jean Ferré et Alexandre Bilger, Sinequa permet aux entreprises de tirer
Si l’an passé, la NASA a déclaré 2023 “l’année de l’open source”, elle a toujours fait de l’accès à ses recherches une priorité. Pour faciliter le partage de ses données, la Direction des missions scientifiques (SMD) de la NASA a lancé la version bêta du moteur Science Discovery Engine, optimisée par la plateforme de Sinequa, un leader du marché de la recherche et de l’analyse de données basées sur l’IA.
Cofondé en 2005 par Jean Ferré et Alexandre Bilger, Sinequa permet aux entreprises de tirer de la valeur de la masse de données dont elles disposent. Sa solution, combinant un moteur de recherche puissant (Enterprise Search) avec des fonctionnalités avancées de traitement du Langage Naturel (NLP) et des algorithmes d’apprentissage automatique, permet d’extraire des informations métiers à partir de données structurées, mais également non structurées. La société a été l’une des premières à inclure les grands modèles de langage (LLM) dans la recherche.
Le Science Discovery Engine de la NASA
Le SDE est un élément clé du programme Open Source Science Initiative (OSSI) de la NASA qui vise à rendre la recherche scientifique financée par des fonds publics transparente, inclusive, accessible et reproductible et de son initiative “Transform to Open Science” (TOPS) dont l’objectif est de créer une culture inclusive de la science ouverte capable de relever les défis du 21e siècle.
En 2019, la communauté scientifique recommandait à la NASA de développer un portail de recherche qui donnerait, à partir d’une seule interface, accès au contenu des cinq domaines scientifiques de la SMD : astrophysique, sciences biologiques et physiques, sciences de la Terre, héliophysique et sciences planétaires.
En 2020, la solution Enterprise Search de Sinequa a été sélectionnée pour aider la NASA à accéder à des informations accumulées depuis plusieurs décennies, ainsi qu’à les exploiter de façon optimale. La collaboration étroite amorcée alors entre l’équipe de Sinequa et les développeurs, chercheurs et data scientists de la NASA a abouti à la création du SDE.
Un ensemble de données hétérogènes
Pour mettre en œuvre ce moteur de recherche, les partenaires ont du relever un défi de taille, outre la quantité des données : leur hétérogénéité et leur complexité, chacun ses 5 domaines opérant avec ses propres normes et terminologies.
Aujourd’hui, les utilisateurs du SDE peuvent extraire des informations enregistrées de plus de 84 000 ensembles de données et plus de 715 000 documents, répartis dans 128 sources d’information différentes, sites internet, référentiels de données et archives documentaires. Egalement intégrée à plus de 44 500 logiciels, modèles et outils scientifiques, la solution de Sequina reconnait plus de 8 900 termes scientifiques différents, un nombre qui devrait augmenter prochainement.
La nouvelle interface utilisateur
La version bêta du SDE a été lancée en décembre 2022. Depuis lors, l’interface n’a cessé d’être améliorée afin d’offrir des résultats de recherche plus pertinents, une nouvelle version a ainsi été mise en ligne en janvier dernier.
Kaylin Bugbee, chef de projet SDE, explique :
“Les scientifiques et les chercheurs passent beaucoup de temps à rechercher et à démêler des données et des informations scientifiques. Les nouvelles mises à jour de l’interface utilisateur de SDE font gagner du temps aux chercheurs en les aidant à rechercher rapidement des données et de la documentation par sujet scientifique ou dans l’ensemble de la collection d’informations. Cette amélioration de l’efficacité de la recherche permet aux scientifiques d’accéder plus rapidement à une science ouverte et exploitable”.
Désormais, des fonctionnalités de filtrage supplémentaires offrent aux utilisateurs la possibilité d’effectuer des recherches spécifiques dans un domaine scientifique donné, tel que la science planétaire ou l’héliophysique, simplifiant ainsi leurs processus de recherche. Parmi les mises à jour figure également un nouvel outil de recherche par acronyme, permettant une meilleure compréhension du contexte des résultats de recherche et du contenu des documents.
La NASA prévoit d’intégrer davantage de données et de contenus au cours des mois à venir, notamment en enrichissant les fonctionnalités de l’interface utilisateur et en poursuivant le développement de l’API du moteur. L’équipe du SDE prévoit de son côté un déploiement complet de l’outil à l’automne 2024.
Jean Ferré, CEO de Sinequa, conclut :
“Le Science Discovery Engine est une infrastructure fantastique qui aide les scientifiques de la NASA, ainsi que les utilisateurs du monde entier, à trouver les informations dont ils ont besoin en quelques secondes seulement, au lieu de plusieurs minutes, voire de longues heures. Nous sommes fiers d’aider la NASA à transformer et à améliorer la productivité dans l’ensemble de son organisation et serons à ses côtés pour associer de nouveaux ensembles de données et de nouvelles sources d’informations qui alimenteront son moteur de connaissances. Pour la science, la technologie et l’innovation, le partage de données scientifiques et ouvertes constitue le seul moyen de prospérer. À cet égard, Sinequa se réjouit de jouer un rôle actif dans cette initiative”.
Ce sont les maisons France Services qui ont expérimenté les premières le LLM Albert. Gabriel Attal, en visite dans l’une d’elles à Sceaux, a annoncé ce mardi 23 avril 2024 le prochain déploiement au sein des services publics de ce modèle d’IA souverain, puisque développé par et pour des agents publics français.
Il y a un an, en mai 2023, le gouvernement annonçait une expérimentation visant à mettre l’IA générative au service des agents et usagers du service public, officialisée en octobre suivan
Ce sont les maisons France Services qui ont expérimenté les premières le LLM Albert. Gabriel Attal, en visite dans l’une d’elles à Sceaux, a annoncé ce mardi 23 avril 2024 le prochain déploiement au sein des services publics de ce modèle d’IA souverain, puisque développé par et pour des agents publics français.
Il y a un an, en mai 2023, le gouvernement annonçait une expérimentation visant à mettre l’IA générative au service des agents et usagers du service public, officialisée en octobre suivant par Stanislas GUERINI, Ministre de la Transformation et de la Fonction publiques.
L’expérimentation de l’IA générative au sein des services publics : un temps de réponse divisé par 2
Le mois de septembre précédent, mille agents de la CNAV (Caisse Nationale d’Assurance Vieillesse), Pôle Emploi ou l’Assurance Maladie ont testé un modèle adapté par la start-up française AlloBrain, du LLM Claude d’Anthropic, pour répondre aux commentaires laissés par les usagers sur le site Services-publics.fr.
Les premiers résultats de l’expérimentation, menée par la DITP et la Direction Interministérielle du Numérique (DINUM), se sont avérés très concluants :
Dans les services publics volontaires, 1 réponse sur 2 a été facilitée par l’IA ;
Le temps de réponse moyen est passé de 7 jours à 3 jours ;
Au bout de 2 mois, 70% des agents ont un ressenti positif de l’utilisation de l’outil et 74% des usagers se sont dits satisfaits de la réponse apportée.
Albert, un modèle souverain open source spécialisé en interne
La DINUM travaille depuis juin 2023 au développement d’Albert, un modèle interne. En octobre dernier, Ulrich Tan, ingénieur polytechnicien, Chef du pôle Datalab du département Etalab de la Direction interministérielle précisait que ce modèle allait reposer sur “des briques technologiques, des intelligences artificielles pré-entraînées et disponibles en open source”, comme Llama ou Falcon, optimisées grâce au fine-tuning pour les besoins des agents du service public. Les modèles open source de Mistral AI lancés à partir de fin septembre auraient également contribué au développement d’Albert.
Créé par et pour des agents publics, cet outil d’IA générative souverain, libre et ouvert, devait être déployé auprès de conseillers volontaires du réseau France services avant de l’être dans d’autres services publics, ce que vient de confirmer Gabriel Attal :
“Je vous annonce que nous avons développé une intelligence artificielle souveraine, française, qui va révolutionner nos services publics et que nous mettons désormais au service des Français”.
Mentionnant les travaux d’Ulrich Tan et ses collaborateurs au sein du Datalab, il a ajouté :
“Grâce à eux, la France est le premier pays européen à inaugurer une IA 100% souveraine et à la mettre au service de ses services publics”.
Le 7 février dernier, la DINUM a reçu le prix “innovation” lors des Victoires des Acteurs publics, un événement organisé par le média Acteurs Publics sous le haut patronage de la présidence de l’Assemblée nationale, pour le lancement d’Albert.
Albert France Services
Chaque mois, les conseillers des 2700 guichets uniques du réseau France Services doivent répondre à près de 800 000 démarches des Français, parfois très complexes.
La version spécifique du réseau “Albert France services”, grâce à un moteur de réponse en langage naturel, leur facilite l’accès aux informations en leur générant une réponse adaptée à la situation de l’usager qu’il accompagne.
Albert fournit au conseiller une réponse rédigée spécifique à la question posée, mais également :
Les sources sur lesquelles il s’est appuyé pour produire la réponse ;
Une liste d’autres questions fréquemment posées en lien avec la réponse ;
Des liens pratiques (téléservices, simulateurs …) ;
Des fiches pratiques issues de service-public.fr.
Le conseiller a ensuite la liberté d’utiliser ou non les réponses suggérées ou de les adapter. Comme le souligne le Premier ministre, le but n’est pas de remplacer les agents publics mais de leur permettre de dégager plus de temps pour les relations humaines :
“A l’IA les tâches rébarbatives, et aux agents publics, le lien avec nos concitoyens”.
Comme attendu, Meta a partagé hier deux premiers modèles de la famille Llama 3 : Llama 3 7B et Llama 3 70B, qui seront suivis dans les prochains mois par des modèles allant jusqu’à 400 milliards de paramètres. Ces deux modèles open source, d’ores et déjà intégrés dans son assistant Meta AI disponible sur ses réseaux sociaux dans certains pays anglophones, sont présentés par Meta comme les meilleurs modèles existants à leur échelle.
Selon la société, les améliorations apportées par rapport à Lla
Comme attendu, Meta a partagé hier deux premiers modèles de la famille Llama 3 : Llama 3 7B et Llama 3 70B, qui seront suivis dans les prochains mois par des modèles allant jusqu’à 400 milliards de paramètres. Ces deux modèles open source, d’ores et déjà intégrés dans son assistant Meta AI disponible sur ses réseaux sociaux dans certains pays anglophones, sont présentés par Meta comme les meilleurs modèles existants à leur échelle.
Selon la société, les améliorations apportées par rapport à Llama 2 ont considérablement réduit les taux de faux refus, perfectionné l’alignement et accru la diversité des réponses. Llama 3 présente en outre des capacités de raisonnement et de génération de code améliorées.
Meta a comparé les performances de ces modèles dans les benchmarks de référence Llama 3 7B avec Gemma de Google, Mistral 7 B de Mistral AI, et Llama 3 70 B avec Gemini Pro 1,5 de Google et Claude 3 Sonnet d’Anthropic.
L’ensemble de données de pré-entrainement de Llama 3 totalise plus de 15 téraoctets de jetons de données publiques, soit 7 fois plus que celui de Llama 2 et comprend quatre fois plus de code. Pour anticiper les futurs cas d’utilisation multilingues, plus de 5 % de ces données ne sont pas anglaises, couvrant plus de 30 langues. Même si elles sont de haute qualité, Meta reconnaît que les performances dans ces langues peuvent varier par rapport à l’anglais.
Des améliorations ont également été apportées au niveau architecture. Llama 3 utilise un tokenizer avec un vocabulaire de 128 000 jetons qui encode le langage beaucoup plus efficacement. Pour optimiser le processus d’inférence des modèles Llama 3, l’approche d’attention des requêtes groupées (Group Query Attention ou GQA) a été mise en œuvre pour les versions de 8B et 70B. Les modèles ont été entraînés sur des séquences de 8192 tokens, avec l’application d’un masque spécifique assurant que l’attention accordée reste confinée aux frontières du document.
Les deux modèles seront bientôt disponibles sur AWS, Databricks, Google Cloud, Hugging Face, Kaggle, IBM WatsonX, Microsoft Azure, NVIDIA NIM et Snowflake.
Meta annonce pour les prochains mois plusieurs modèles multimodaux, avec une prise en charge de plusieurs langues, une fenêtre contextuelle plus longue, ainsi que des capacités globales plus robustes. Il donne un aperçu de Llama 3 400B, le plus grand modèle de la famille dont il poursuit l’entraînement.
Les poids de Llama 3 et le générateur de jetons sont téléchargeables sur GitHub.
Meta dévoile les deux premiers modèles de la famille Llama 3
C’est sur X que Mistral AI a choisi d’annoncer Mixtral 8x22B mercredi dernier à l’aide d’un lien magnet Torrent. La jeune licorne n’a pas publié de communiqué de presse ni consacré un blog sur son site à ce dernier modèle, donc on ne sait pour l’instant que peu de choses sur ce nouveau modèle open source mais de premiers benchmarks arrivent sur Hugging Face.
Mistral AI a publié Mixtral 8x7B en décembre dernier, on peut présumer que Mixtral 8x22B en est une version plus performante.
Ces 2 modèle
C’est sur X que Mistral AI a choisi d’annoncer Mixtral 8x22B mercredi dernier à l’aide d’un lien magnet Torrent. La jeune licorne n’a pas publié de communiqué de presse ni consacré un blog sur son site à ce dernier modèle, donc on ne sait pour l’instant que peu de choses sur ce nouveau modèle open source mais de premiers benchmarks arrivent sur Hugging Face.
Mistral AI a publié Mixtral 8x7B en décembre dernier, on peut présumer que Mixtral 8x22B en est une version plus performante.
Ces 2 modèles Mixtral 8x sont basés sur une architecture à mélange clairsemé d’experts (SMoE) publiés sous licence Apache 2.0.
En tant que modèle de décodeur exclusivement, Mixtral 8x7B utilise un bloc de rétroaction pour choisir parmi huit groupes distincts de paramètres. À chaque couche et pour chaque jeton, un réseau de routeurs sélectionne deux de ces groupes, appelés “experts”, pour traiter le jeton et combine leur sortie de manière additive.
Cette approche augmente le nombre total de paramètres du modèle tout en contrôlant le coût et la latence. Mixtral 8xB dispose de 46,7 milliards de paramètres au total, mais n’utilise que 12,9 milliards de paramètres par jeton, traitant ainsi les entrées et générant les sorties à la même vitesse et au même coût qu’un modèle 12,9B. Le modèle est pré-entraîné sur des données extraites du Web ouvert, permettant la formation simultanée d’experts et de routeurs.
L’approche a été la même pour Mixtral 8x22B dont le nombre de paramètres peut monter jusqu’à 176 milliards et la fenêtre contextuelle de 65 000 jetons.
Alors que certains voyaient dans le partenariat de distribution que Mistral AI a signé avec Microsoft un abandon de l’open source, la start-up leur prouve qu’il n’en est rien, comme elle l’avait assuré face aux critiques.
Elon Musk avait annoncé la semaine dernière que Grok, le chatbot IA développé par sa startup xAI, serait désormais open source. C’est chose faite : les poids du modèle de fondation qui l’alimente, Grok-1, ainsi que son architecture ont été publiés hier sur GitHub. Il est également possible de retrouver les poids du modèle depuis ce matin via un fichier torrent sur X.
En juillet dernier, Elon Musk annonçait le lancement de xAI, qui avait été enregistrée au Nevada le mois de mars précédent. Onze e
Elon Musk avait annoncé la semaine dernière que Grok, le chatbot IA développé par sa startup xAI, serait désormais open source. C’est chose faite : les poids du modèle de fondation qui l’alimente, Grok-1, ainsi que son architecture ont été publiés hier sur GitHub. Il est également possible de retrouver les poids du modèle depuis ce matin via un fichier torrent sur X.
En juillet dernier, Elon Musk annonçait le lancement de xAI, qui avait été enregistrée au Nevada le mois de mars précédent. Onze experts en IA, travaillant auparavant chez DeepMind, OpenAI, Google Research, Microsoft Research, Tesla et l’Université de Toronto, étaient venus complétés son équipe, basée en Californie.
Elon Musk affirmait que Grok était la meilleure IA générative existant alors, soulignant que “Grok a accès en temps réel aux infos via X, ce qui lui donne un avantage majeur sur les autres modèles”. Le chatbot est disponible depuis fin 2023 pour les abonnés X Premium+, sensé leur répondre avec humour et sans filtre.
Sur son blog, XAI explique que la version de Grok publiée en open-source, est un modèle de mélange d’experts (MoE) de 314 milliards de paramètres formé à partir de zéro. Il s’agit du point de contrôle du modèle de fondation brut de la phase de pré-formation Grok-1, qui s’est terminée en octobre 2023, ce qui signifie que le modèle n’est pas affiné pour une application spécifique, telle que le dialogue.
Il a été publié sous licence Apache 2.0, les développeurs peuvent donc le modifier et le redistribuer à leur gré.
Pourquoi le choix de l’open source ?
Lorsqu’Elon Musk a cofondé OpenAI en 2015 avec notamment Sam Altman, c’était en tant qu’organisation à but non lucratif visant à développer des intelligences artificielles générales bénéfiques à l’humanité. Sa charte stipule : “Nous tenterons de construire directement des AGI sûres et bénéfiques, mais considérerons également notre mission comme remplie si notre travail aide les autres à atteindre ce résultat”.
Elon Musk, qui l’a quitté en 2018, a déposé plainte début mars contre OpenAI et Sam Altman pour non-respect de l’accord initial à l’origine de la création de l’association, GPT-4 étant un modèle fermé. Elon Musk s’est alors vu reprocher une certaine ambivalence et hypocrisie du fait que Grok l’était aussi. Le 11 mars dernier, il a donc annoncé l’ouverture du modèle.
xAI publie son IA générative Grok-1 en open source
Le 7 mars dernier, lors du Confiance.ai Day 2024, le collectif a annoncé l’ouverture aux communautés scientifiques et industrielles de la méthodologie mise au point ainsi que des composants open source associés. Alors que le programme doit s’achever cette année, les partenaires ont décidé de se concentrer sur l’approfondissement, la pérennisation et l’industrialisation des résultats obtenus. Ils ont également l’intention de créer une fondation afin de fédérer un ensemble d’acteurs à l’échelle i
Le 7 mars dernier, lors du Confiance.ai Day 2024, le collectif a annoncé l’ouverture aux communautés scientifiques et industrielles de la méthodologie mise au point ainsi que des composants open source associés. Alors que le programme doit s’achever cette année, les partenaires ont décidé de se concentrer sur l’approfondissement, la pérennisation et l’industrialisation des résultats obtenus. Ils ont également l’intention de créer une fondation afin de fédérer un ensemble d’acteurs à l’échelle internationale autour d’une feuille de route commune.
Confiance.ai, le plus gros programme de recherche technologique du plan #AIforHumanity, est une initiative majeure qui vise à renforcer le leadership technologique des entreprises françaises dans le domaine de l’IA industrielle. Lancé en 2021 dans le cadre de la Stratégie nationale pour l’intelligence artificielle financée par France 2030, il s’est concentré sur le développement d’une méthodologie de bout en bout et d’une série de composants technologiques open source pour intégrer des IA de confiance dans des systèmes industriels critiques, accessibles sur https://bok.confiance.ai/.
La méthodologie développée offre un guide complet, permettant aux industriels de caractériser et de qualifier la confiance des systèmes intelligents dirigés par les données, et ce, dans n’importe quel secteur d’activité.
Ses 126 composants ont été regroupés en neuf ensembles fonctionnels correspondant à des processus d’ingénierie bien précis : ingénierie de bout en bout, gestion du cycle de vie de la donnée, gestion du cycle de vie des modèles et des composants, évaluation des composants d’IA, déploiement des composants IA, gestion des systèmes d’IA en opération, robustesse, explicabilité et quantification de l’incertitude.
Des secteurs clés tels que l’automobile, l’aéronautique, l’énergie et la défense ont déjà bénéficié des avancées de Confiance.ai. Des entreprises du collectif ont mis en œuvre ces nouvelles méthodologies : elles ont permis à Air Liquide d’améliorer la précision des modèles d’IA pour la gestion de l’inventaire, à Thales de valider et de monitorer les performances des algorithmes de détection d’objets, et à Renault Group de vérifier la qualité des soudures sur ses véhicules.
Confiance.ai, moteur du développement de l’écosystème mondial de l’IA de confiance
Précurseur dans le domaine de l’IA de confiance, en plus de son impact sur l’industrie française, Confiance.ai joue un rôle moteur dans la construction d’un écosystème mondial de l’IA de confiance, en établissant des partenariats avec des initiatives similaires à l’étranger. Il a notamment signé un MoU (Memorandum of Understanding) avec le programme Confiance IA au Québec et en Allemagne avec VDE, l’une des plus importantes organisations technologiques d’Europe.
Juliette Mattioli, Présidente du comité de pilotage de Confiance.ai et Expert sénior en Intelligence Artificielle chez Thales, commente :
“Nous nous sommes attaqués à une problématique particulièrement complexe et ambitieuse. Les résultats obtenus sont en ligne avec nos objectifs et remarquables à plusieurs égards. Tout d’abord, sur le plan humain, nous sommes parvenus à faire collaborer un écosystème hybride composé d’industriels, de scientifiques, de data scientists, d’ingénieurs, etc. Nous avons également relevé un grand nombre de défis scientifiques et technologiques – plus que nous l’avions imaginé – et nous avons été moteur dans de nombreuses d’initiatives au niveau international. Une véritable communauté mondiale autour de l’IA de confiance est en train d’émerger”.
De nouveaux projets en ligne de mire
Alors que le programme Confiance.ai se terminera fin 2024, les partenaires se projettent déjà vers l’avenir. Leurs ambitions se concentrent sur trois axes principaux : approfondir, pérenniser et industrialiser.
Fabien Mangeant, Président du comité de direction de Confiance.ai et Directeur Scientifique Digital d’Air Liquide, explique :
“Il reste encore de nombreux défis scientifiques et technologiques à relever pour que la France maintienne son avance dans le domaine et nous sommes en train de les répertorier. Les sujets du transfert et de la valorisation de nos travaux sont des chantiers prioritaires, tout comme la résolution de nouveaux verrous scientifiques et technologiques”.
Les partenaires du programme ont identifié plusieurs problématiques pour lesquelles il serait opportun de lancer de nouveaux projets de recherche et technologie (R&T), notamment l’IA hybride, les IA génératives telles que le LLM, et la cybersécurité des IA intégrées aux systèmes critiques. Ces nouveaux projets R&T enrichiront les méthodes existantes en les adaptant à de nouveaux domaines d’application.
Un autre objectif majeur est la pérennisation et la diffusion de la méthodologie développée. Cela passe par son ouverture et par le lancement d’une initiative de fondation visant à rassembler des acteurs du monde entier autour d’une feuille de route commune. Cette fondation contribuera à maintenir ce “bien commun numérique” opérationnel et à le faire évoluer grâce aux retours d’expérience et aux propositions d’amélioration. De plus, la formation, notamment à travers le Mastère Spécialisé sur l’IA de Confiance co-conçu avec CentraleSupélec, jouera un rôle essentiel dans l’élévation de la maturité de cette méthodologie.
Enfin, la troisième ambition est l’industrialisation des résultats du programme afin de les rendre utilisables à grande échelle par les ingénieries des entreprises. Cette démarche vise à créer et à mettre à disposition des outils de compétitivité adaptés aux spécificités de chaque entreprise en matière de typologie, de données et de cas d’usage.
Le marché des robots humanoïdes devrait atteindre 8 milliards de dollars d’ici 2030, ce qui explique l’intérêt dans ce secteur des grandes firmes ou de start-ups comme OpenAI qui s’est associé en mars 2023 avec 1X Technologies pour développer NEO, un robot humanoïde alimenté par l’IA. Selon un post de Remi Cadene sur X, Hugging Face se lancerait lui aussi dans un projet robotique, mais open source.
Passée au rang de licorne après une levée de fonds de 235 millions de dollars en août dernier, Hu
Le marché des robots humanoïdes devrait atteindre 8 milliards de dollars d’ici 2030, ce qui explique l’intérêt dans ce secteur des grandes firmes ou de start-ups comme OpenAI qui s’est associé en mars 2023 avec 1X Technologies pour développer NEO, un robot humanoïde alimenté par l’IA. Selon un post de Remi Cadene sur X, Hugging Face se lancerait lui aussi dans un projet robotique, mais open source.
Passée au rang de licorne après une levée de fonds de 235 millions de dollars en août dernier, Hugging Face, start-up créée à Paris en 2016 mais également basée à New York, se positionne comme une alternative open source à OpenAI. Elle a présenté HuggingChat, comme une alternative open source à ChatGPT et ses Hugging Face Assistants, gratuits et eux aussi open source, lancés il y a un mois, rivalisent avec les GPT du Store d’Open AI.
Ce qu’appuie Remi Cadene dans son post sur X :
“Après 3 ans @tesla et Optimus, je suis ravi d’annoncer que j’ai rejoint Hugging Face pour lancer un ambitieux projet de robotique ouverte ! (open comme dans open-source, pas comme dans Open AI) A la recherche d’ingénieurs pour construire de vrais robots à Paris.”
After 3 years @tesla and Optimus, I am thrilled to announce that I joined Hugging Face to start an ambitious open robotics project! (open as in open-source, not as in Open AI) Looking for engineers to build real robots in Paris 🇫🇷 https://t.co/cFuNL4PVI4 🤖🤗 pic.twitter.com/7IkunPXOpX
“Je construis des robots de nouvelle génération chez Hugging Face. Auparavant, j’étais chercheur scientifique chez Tesla sur Autopilot et Optimus. Sur le plan académique, j’ai fait des études postdoctorales à l’Université Brown et mon doctorat à la Sorbonne”.
Si Hugging Face n’a pas confirmé pour l’instant, le lien publié renvoie vers une offre d’emploi d’ingénieur en robotique incarnée à Paris. La start-up y stipule :
“Chez Hugging Face, nous pensons que le ML ne doit pas nécessairement se limiter aux ordinateurs et aux serveurs, et c’est pourquoi nous élargissons notre équipe avec une nouvelle opportunité pour un ingénieur en robotique axé sur l’apprentissage automatique/l’IA.
Dans ce rôle, vous serez responsable de la conception, de la construction et de la maintenance de systèmes robotiques open source et à faible coût qui intègrent les technologies d’IA, en particulier dans l’apprentissage profond et l’IA incarnée. Vous collaborerez en étroite collaboration avec les ingénieurs ML, les chercheurs et les équipes de produits pour développer des solutions innovantes qui repoussent les limites de ce qui est possible en robotique et en IA”.
Les équipes de recherche du laboratoire MICS de CentraleSupélec ont développé avec Illuin Technology un nouveau modèle de langage (LLM) appelé CroissantLLM. Totalement ouvert, comptant 1,3 milliard de paramètres, il fonctionne efficacement sur du matériel local grand public y compris sur les ordinateurs personnels et smartphones d’entrée de gamme. Le modèle, qui est disponible sur la plateforme Hugging Face, sera présenté ce 7 mars dans le cadre de l’événement “Les Ateliers de l’IA”, à Paris La
Les équipes de recherche du laboratoire MICS de CentraleSupélec ont développé avec Illuin Technology un nouveau modèle de langage (LLM) appelé CroissantLLM. Totalement ouvert, comptant 1,3 milliard de paramètres, il fonctionne efficacement sur du matériel local grand public y compris sur les ordinateurs personnels et smartphones d’entrée de gamme. Le modèle, qui est disponible sur la plateforme Hugging Face, sera présenté ce 7 mars dans le cadre de l’événement “Les Ateliers de l’IA”, à Paris La Défense et en distanciel.
CroissantLLM est présenté comme un modèle de langage souverain, ouvert, éthique, frugal, étant le fruit d’une collaboration entre académie et industrie, comme Céline Hudelot, professeure, Directrice du laboratoire MICS, l’explique :
“Ce travail est le fruit d’une collaboration étroite entre académie et industrie, illustrant l’importance de la synergie dans l’avancée de la recherche en IA. CroissantLLM résulte en effet des travaux menés par CentraleSupélec en collaboration avec plusieurs partenaires académiques de renom tels que Sorbonne Université, INESC-ID, Instituto Superior Técnico, Carnegie Mellon University et Institut DATAIA. Elle a aussi pu voir le jour grâce au soutien précieux de partenaires industriels : ILLUIN Technology ainsi que Unbabel, Diabolocom, et EqualAI”.
Le modèle a été développé par une équipe de recherche française qui s’est appuyée sur le supercalculateur Jean Zay au sein du GENCI. Plutôt que de l’entraîner sur des corpus à dominante anglaise comme l’ont été les modèles les plus récents, l’équipe a choisi de le faire sur une quantité égale de données en français et en anglais, ce qui lui permet d’intégrer et de maîtriser les spécificités de la langue et de la culture françaises.
Dans ce but, l’équipe a collecté plus de 303 milliards de tokens de données françaises ainsi que 36 milliards de tokens de données de traduction français-anglais, toutes publiques. L’ensemble d’entraînement compte 3 000 milliards de données de jetons après suréchantillonnage, soit plus que celui de Llama 2.
CroissantLLM, basé sur l’architecture Llama, compte 1,3 milliard de paramètres, une taille qui permet une exécution rapide sur des serveurs GPU bas de gamme et une vitesse décente sur des appareils mobiles ou des processeurs. Le modèle est ainsi accessible à un large éventail d’utilisateurs, que ce soit pour des applications industrielles spécifiques, des traductions ou le chat.
Les évaluations du modèle
Pour évaluer les performances du modèle en français, les chercheurs ont introduit FrenchBench, qui se compose de diverses tâches de classification et de génération. Ils l’ont par ailleurs également évalué sur des benchmarks anglais.
Les évaluations montrent que CroissantLLM offre des performances compétitives tant en anglais qu’en français. Sur les benchmarks de classification français, CroissantLLM surpasse largement les modèles de tailles similaires entraînés principalement sur des données monolingues anglais ou français, ainsi que les modèles multilingues. Il devance des modèles jusqu’à 3 fois plus grands sur la plupart des tâches (Bloom 3B).
Pour CroissantLLM Chat, les chercheurs ont affiné CroissantLLM sur des données de chat, notamment sur des interactions avec ChatGPT, afin de développer ses compétences de conversation dans les deux langues.
Un modèle transparent et éthique
L’équipe de recherche a veillé au respect des règles fixées par le récent AI Act afin de faire de CroissantLLM un modèle éthique.
Manuel Faysse, l’un des membres de l’équipe de recherche, explique dans un blog sur Hugging Face :
“L’initiative CroissantLLM a été conçue dès le départ dans un souci de transparence. Nous validons 81 % des critères de transparence du cadre FMTI, bien au-delà des scores des initiatives les plus ouvertes, en publiant les données, les modèles, la procédure de formation et tout le code utilisé pour conserver les données et entraîner le modèle”.
Les modèles, ensembles de données, codes de formation, critères d’évaluation et données sont entièrement open source :
En 2015, Elon Musk, Sam Altman et Greg Brockman lançaient OpenAI, une association à but non lucratif dont l’objectif était de promouvoir et développer une intelligence artificielle bénéficiant à l’humanité. Elon Musk, qui l’a quittée en 2018, a déposé plainte la semaine dernière contre OpenAI et ses cofondateurs pour non-respect de l’accord initial à l’origine de la création de l’association.
A l’origine, OpenAI était une organisation à but non lucratif qui s’était donné pour mission principale
En 2015, Elon Musk, Sam Altman et Greg Brockman lançaient OpenAI, une association à but non lucratif dont l’objectif était de promouvoir et développer une intelligence artificielle bénéficiant à l’humanité. Elon Musk, qui l’a quittée en 2018, a déposé plainte la semaine dernière contre OpenAI et ses cofondateurs pour non-respect de l’accord initial à l’origine de la création de l’association.
A l’origine, OpenAI était une organisation à but non lucratif qui s’était donné pour mission principale de veiller à ce que l’intelligence artificielle générale (AGI ou IAG) profite à tous. Il est écrit dans sa charte : “Nous tenterons de construire directement des AGI sûres et bénéfiques, mais considérerons également notre mission comme remplie si notre travail aide les autres à atteindre ce résultat”.
En 2019, peu après le départ d’Elon Musk et le développement de GPT-2, elle s’est restructurée et a créé OpenAI LP, pour pouvoir lever des fonds afin de poursuivre ses travaux et motiver les chercheurs. Les bénéfices d’OpenAI LP devaient être plafonnés et tout excédent versé à l’association non-lucrative OpenAI.
La même année, OpenAI a signé un partenariat exclusif avec Microsoft, qui lui a fourni un milliard de dollars et un accès à sa plateforme cloud Azure.
Les raisons exactes du départ d’Elon Musk n’ont pas été explicitement divulguées, mais il a été rapporté que sa décision était motivée par des conflits d’intérêts potentiels liés à ses autres entreprises, notamment Tesla et SpaceX, qui pouvaient avoir des projets ou des intérêts concurrents avec OpenAI. Des divergences d’opinion quant à la gestion de l’organisation ont également été évoquées.
Récemment, le très médiatique entrepreneur a annoncé la pose du 1er implant de sa société Neuralink sur un humain et le lancement de Grok, la première IA générative de sa start-up xAI. Elon Musk a déposé le nom de cette dernière société le 9 mars l’an passé, alors qu’il était l’un des principaux détracteurs de l’IA, la qualifiant de menace pour l’humanité, et a été l’un des signataires de la lettre ouverte “Pause Giant AI Experiments” publiée le 29 mars suivant. Celle-ci appelait tous les laboratoires d’IA à suspendre immédiatement et pendant au moins 6 mois l’entraînement de systèmes d’IA plus puissants que GPT-4.
Pourquoi une plainte aujourd’hui ?
OpenAI commercialise GPT-4 tout comme Elon Musk prévoit de le faire pour Grok qui sera disponible pour tous les abonnés X Premium+.
Selon ce dernier, GPT-4 se rapproche de l’IAG : l’investissement de Microsoft de l’an passé n’est donc pas compatible avec la mission initiale de l’association, le fait qu’il ne soit pas open source non plus. Il estime qu’OpenAI est devenue une machine à profit et détourne le bénéfice de l’IA au profit de Microsoft, et ce, au détriment de l’humanité.
Il a donc décidé de déposer plainte pour rupture de contrat, manquement à l’obligation fiduciaire et pratiques commerciales déloyales. Il y vise spécifiquement Sam Altman, mentionnant la signature d’une lettre d’intention en 2019, “pour acquérir pour 51 millions de dollars de puces à une start-up dans laquelle M. Altman a beaucoup investi”. Elon Musk fait ici référence à la société Rain AI, basée à San Francisco.
Les deux hommes qui ont pris l’habitude de communiquer via les médias et réseaux sociaux ne semblent pas près de se réconcilier. Selon OpenAI, sa collaboration avec Microsoft est avant tout un moyen de soutenir son objectif de créer une intelligence artificielle bénéfique pour l’humanité.
Que la plainte soit traitée ou non, quelles que soient les motivations réelles d’Elon Musk, elle met en lumière le risque de mainmise des grandes entreprises technologiques sur le marché de l’IA générative. D’ailleurs, Microsoft et OpenAI font partie des sociétés dont les partenariats sont examinés par la Federal Trade Commission (FTC) aux Etats-Unis, La Commission européenne et l‘Autorité de la concurrence en France.
NDLR : Cet article mentionne IA générative et IA générale. L’intelligence artificielle générative est de plus en plus mentionnée sous l’acronyme IAG, pouvant prêter à confusion avec l’intelligence artificielle générale, pour laquelle cet acronyme est traditionnellement employé. Il convient de rappeler que les deux sont distinctes. L’IA générative représente une classe d’IA destinée à générer du contenu (texte, image, vidéo..), par opposition à l’IA prédictive. Le concept d’IA générale désigne quant à lui une intelligence artificielle non spécialisée, multimodale, et dont le niveau pourrait être comparable à celui de l’intelligence humaine.
Elon Musk porte plainte contre OpenAI et son cofondateur Sam Altman
GitHub, la plateforme de développement collaboratif et de partage de code, a ouvert les candidatures pour sa deuxième cohorte du programme GitHub Accelerator, qui vise à aider les développeurs à travailler sur l’IA open source. Le programme, qui durera 10 semaines, offrira aux participants, notamment aux start-ups en phase d’amorçage, un financement de 40 000 $, un mentorat d’experts et de partenaires, ainsi qu’un accès à des ressources et des opportunités exclusives. Les candidats ont jusqu’au
GitHub, la plateforme de développement collaboratif et de partage de code, a ouvert les candidatures pour sa deuxième cohorte du programme GitHub Accelerator, qui vise à aider les développeurs à travailler sur l’IA open source. Le programme, qui durera 10 semaines, offrira aux participants, notamment aux start-ups en phase d’amorçage, un financement de 40 000 $, un mentorat d’experts et de partenaires, ainsi qu’un accès à des ressources et des opportunités exclusives. Les candidats ont jusqu’au 5 mars prochain pour déposer leur projet.
L’initiative GitHub Accelerator a pour objectif de créer des carrières et des entreprises viables dans l’open source, en reconnaissant la valeur et l’impact des projets qui innovent et résolvent des problèmes réels. Après une première cohorte réussie, qui a couvert divers domaines tels que le web, le mobile, le design, la mode, l’éducation, la biologie…, la seconde se concentrera sur les nouvelles frontières et technologies de l’IA.
Stormy Peters, vice-présidente des communautés chez GitHub, déclare :
“La création d’une entreprise d’IA prospère à l’air libre comporte son lot de défis. En plus des obstacles liés au temps et au financement que nous connaissons déjà dans l’open source, les dépenses accrues et les considérations éthiques, sécuritaires et juridiques sont décourageantes. Nous considérons ces défis comme un risque pour l’innovation mondiale et nous espérons y contribuer.
Cette cohorte d’accélérateurs se concentrera sur le financement des personnes et des projets qui construisent des solutions basées sur l’IA sous une licence open source pour améliorer le monde qui les entoure”.
Dix projets seront sélectionnés, évalués sur la base de critères tels que la qualité, la pertinence, la diversité et la viabilité, qu’ils soient ou non hébergés sur GitHub. Un nombre croissant d’utilisateurs actifs sera un plus.
Les détails du programme
Le programme GitHub Accelerator débutera le 22 avril et comprendra un mélange de sessions individuelles, de sessions de groupe, de travaux de projet et de mentorat. Les participants recevront également :
40 000 $ par projet en financement non dilutif.
5 à 10 heures par semaine d’instruction en direct, d’ateliers et de devoirs.
Des heures de bureau avec l’équipe GitHub pour des revues de sécurité.
Des séances de questions-réponses avec des sponsors d’entreprise GitHub, des membres de la communauté et des leaders de GitHub.
Une introduction et au moins une heure de bureau avec M12, le fonds de capital-risque de Microsoft.
Un accès gratuit aux produits GitHub pertinents, y compris une année complète de GitHub Copilot.
Les projets éligibles recevront des crédits gratuits d’infrastructure Azure AI, y compris un accès privilégié à des clusters de machines virtuelles GPU haut de gamme et un support personnalisé de mise sur le marché.
Un canal Slack partagé avec la cohorte pour collaborer et se soutenir mutuellement.
Les projets sélectionnés seront présentés lors d’un événement virtuel organisé par GitHub à la fin du programme, où ils pourront montrer leurs progrès, leurs défis et leurs ambitions. Le programme GitHub Accelerator espère ainsi contribuer à faire avancer l’IA open source, en mettant en lumière les talents et les idées qui la font vivre.
GitHub Accelerator Lancement de l'appel à candidatures pour la Cohorte 2024
Esther Mac Namara, Déléguée à la transformation numérique de la DGFIP, a annoncé récemment la publication de LlaMandement, un LLM développé par la DGIFP pour générer des résumés neutres des amendements parlementaires, soulageant ainsi les agents publics qui doivent analyser et traiter un nombre croissant d’amendements.
Les LLMs, grâce à leur capacité à effectuer des tâches complexes de traitement du langage, ont ouvert de nouveaux horizons pour l’innovation au sein de l’administration française.
Esther Mac Namara, Déléguée à la transformation numérique de la DGFIP, a annoncé récemment la publication de LlaMandement, un LLM développé par la DGIFP pour générer des résumés neutres des amendements parlementaires, soulageant ainsi les agents publics qui doivent analyser et traiter un nombre croissant d’amendements.
Les LLMs, grâce à leur capacité à effectuer des tâches complexes de traitement du langage, ont ouvert de nouveaux horizons pour l’innovation au sein de l’administration française. Celle-ci s’en est rapidement emparée et 1000 agents de la CNAV (Caisse Nationale d’Assurance Vieillesse), Pôle Emploi ou l’Assurance Maladie ont testé avec succès l’an passé un modèle adapté par la start-up française AlloBrain, du LLM Claude, d’Anthropic. En novembre dernier, le département Etalab de la direction interministérielle du numérique (DINUM), en charge de la coordination de la stratégie de l’État en matière de données, présentait son outil d’IA générative Albert.
La Délégation à la Transformation Numérique (DTNUM), qui joue un rôle essentiel dans la modernisation des services publics en France, a ciblé le traitement des amendements pour un projet impliquant des LLMs. LLaMandement vise ainsi à automatiser la distribution des amendements entre différentes expertises ministérielles, à rechercher des réponses précédentes à des situations similaires et à formuler une synthèse claire, précise et neutre d’un amendement.
L’examen d’un projet de loi implique un débat et un vote sur les amendements (modifications du texte proposées par le Parlement ou le Gouvernement), un processus dans lequel les agents administratifs jouent un rôle central. Ils doivent analyser et traiter un nombre croissant d’amendements, jusqu’à des milliers pour un projet de loi, ce qui limite la durée maximale de leur gestion, affectant ainsi l’efficacité, la précision et la fiabilité des analyses nécessaires à l’élaboration des lois.
Depuis 2020, les agents administratifs peuvent travailler de manière plus efficace grâce au Système de Gestion Digitale Interministérielle des Amendements Législatifs (SIGNALE) qui facilite la rédaction de notes de synthèse et la création de tableaux pour la préparation des réunions interministérielles concernant les textes législatifs.
Le LLM LLaMandement
Le modèle LLaMandement est le fruit des travaux des datascientists et des spécialistes de la loi de la DGFIP, la DILA (Direction de l’Information Légale et Administrative) et la DINUM.
Basé sur le modèle open source LLaMA 2 de Meta, il a été adapté au domaine législatif grâce à la technique de l’adaptation de rang faible (LORA) et été entraîné sur un ensemble de données composé de plus de 15 000 paires d’amendements et de résumés issus de la plateforme SIGNALE.
Les qualités éthiques des résumés automatiques ont été évaluées sur le jeu de données Bias in Open-ended Language Generation, le modèle LLaMandementa obtenu des scores très satisfaisants.
Il a également atteint un niveau de performance proche de celui des rédacteurs humains, tout en étant plus rapide et plus économe en ressources. Il a démontré sa capacité à traiter et à synthétiser des textes législatifs complexes et variés, provenant de différents ministères, à améliorer l’efficacité opérationnelle des agents tout en garantissant des résumés neutres et précis, essentiels pour le processus législatif.
Pour que d’autres s’appuient sur ses travaux, les chercheurs publient :
Auteurs : Joseph Gesnouin 1, Yannis Tannier 1, Christophe Gomes Da Silva 1, Hatim Tapory 1, Camille Brier 1, Hugo Simon 1, Raphaël Rozenberg 1, Hermann Woehrel 1, Mehdi El Yakaabi 1, Thomas Binder 1, Guillaume Marie 1, Emilie Caron1, Mathile Nogueira 1, Thomas Fontas 1, Laure Puydebois 1, Marie Theophile 1, Stéphane Morandi 1, Maël Petit 1, David Creissac 1, Pauline Ennouchy 1, Elise Valetoux 1, Céline Visade 2, Severine Balloux 2, Emmanuel Cortes 2, Pierre-Etienne Devineau 3, Ulrich Tan 3, Esther Mac Namara 1, Su Yang 1
1 : French Ministry of Economics and Finance – Directorate General of Public Finances
2 : General Secretariat of the French Government – Legal and Administrative Information Directorate
3 : French Interministerial Digital Department
LLaMandement, le LLM open source du gouvernement français
Hugging Face ne cesse d’innover : fin janvier, l’entreprise a non seulement annoncé de nouveaux LLM open-source en tant qu’agents LangChain, un partenariat stratégique avec Google Cloud, l’optimisation de StarCoder mais également Hugging Chat Assistants, une boutique de chatbots personnalisés sur Hugging Chat à l’instar de GPT Store, mais contrairement à ce dernier, ceux de Hugging Face sont gratuits et open source.
Passée au rang de licorne après une levée de fonds de 235 millions de dollars e
Hugging Face ne cesse d’innover : fin janvier, l’entreprise a non seulement annoncé de nouveaux LLM open-source en tant qu’agents LangChain, un partenariat stratégique avec Google Cloud, l’optimisation de StarCoder mais également Hugging Chat Assistants, une boutique de chatbots personnalisés sur Hugging Chat à l’instar de GPT Store, mais contrairement à ce dernier, ceux de Hugging Face sont gratuits et open source.
Passée au rang de licorne après une levée de fonds de 235 millions de dollars en août dernier, Hugging Face, start-up créée à Paris en 2016, continue de jouer un rôle fondamental dans l’accélération de la recherche en IA grâce à son approche open source.
Dans son article de blog le 24 janvier dernier, Hugging Face expliquait comment construire et évaluer des agents de raisonnement à usage général basés sur les grands modèles de langage (LLM) open source comme Mixtral-8x7B , en utilisant la classe ChatModel de LangChain et l’approche ReAct.
L’article du 30 janvier suivant présentait les résultats de l’optimisation de son modèle de génération de code développé en collaboration avec Service Now, StarCoder (15B) sur Intel Xeon de 4e génération, en utilisant la quantification 8 bits et 4 bits et la génération assistée. En combinant la quantification 8 bits et la génération assistée, le modèle StarCoder atteint une accélération d’inférence de plus de 7 fois par rapport au modèle de référence, sans perte de qualité.
Entre temps, Hugging Face annonçait un partenariat stratégique avec Google Cloud, afin de rendre l’IA plus accessible et plus performante pour les entreprises, en s’appuyant sur les modèles ouverts et les technologies open source.
Le partenariat vise à combiner les avantages de la plateforme ouverte de Hugging Face, qui permet aux scientifiques des données, aux ingénieurs en ML et aux développeurs d’accéder aux derniers modèles de la communauté, et de les utiliser sur la plateforme de leur choix à ceux de la plateforme Vertex AI de Google Cloud qui permet de déployer des modèles d’IA ainsi que d’assurer leur maintenance.
Il facilite ainsi l’intégration des modèles ouverts de Hugging Face dans Vertex AI et GKE (Google Kubernetes Engine) et permet aux clients de Google Cloud d’exploiter les modèles de Hugging Face et les fonctionnalités avancées de Google Cloud, comme Vertex AI et les TPU, pour développer et déployer des applications d’IA plus efficacement.
Les deux entreprises ont également annoncé qu’elles allaient collaborer sur les plans de la science ouverte, de l’open source, du cloud et du matériel, pour rendre les dernières innovations en intelligence artificielle plus accessibles à la communauté.
Hugging Face Assistants, l’alternative open source et gratuite à GPT Store
Le 2 février dernier, Hugging Face présentait Hugging Chat Assistants, qui permet de créer des chatbots après avoir créé un compte Hugging Face (gratuit), sa boutique fonctionne comme le GPT Store déployé en janvier dernier par Open AI.
Alors que celui-ci permet aux abonnés de ChatGPT Plus, Enterprise et de la nouvelle offre ChatGPT Team de créer leurs assistants à partir de ChatGPT, ceux de Hugging Face le seront à partir du chatbot open source Hugging Chat.
Pour le personnaliser, les utilisateurs peuvent s’appuyer sur les modèles open source Mixtral 8x7B et mistral 7B Instruct de Mistral AI, Llama-2 70B et CodeLlama 70B Instruct de Meta, Hermes 2 – Mixtral 8x7B – DPO , formé par Nous Research sur le LLM Mixtral 8x7B MoE et OpenChat 3.5.
Selon Julien Chaumond, cofondateur et CTO de Hugging Face, en à peine 3 jours, 4 000 assistants avaient été créés et 1 500 utilisateurs avaient discuté avec son propre clone “Clone of HF CTO”.
Il ajoute que suite aux premiers retours de la communauté, Hugging Face envisage d’introduire les éléments suivants :
Possibilité de modifier vos assistants via l’API, permettant ainsi d’envoyer des informations actualisées à vos assistants à tout moment.
Intégration de RAG (et de la fonctionnalité de recherche sur le Web) à l’Assistant, enrichissant ainsi ses capacités de recherche et de réponse.
Fonctionnalité pour générer votre assistant de vignettes via l’IA, offrant une manière intuitive et automatisée de créer des représentations visuelles pour vos assistants.
Proposition de modifications sur les assistants d’autres utilisateurs, favorisant ainsi la collaboration et l’amélioration collective des assistants.
Ajout régulier de nouveaux modèles à HuggingChat et aux Assistants, garantissant une variété et une qualité constantes des modèles disponibles pour les utilisateurs.
L’Allen Institute for Artificial Intelligence (Ai2), organisation à but non lucratif, a été créé en 2014 par Paul Allen, co-fondateur de Microsoft dans le but de participer activement au développement de l’intelligence artificielle pour le bien commun. Il franchit un pas décisif dans cette direction avec la publication du LLM OLMo. Alors que certains modèles open source incluent les codes et les poids, Ai2 rend le modèle OLMo véritablement ouvert en fournissant non seulement les codes et les poi
L’Allen Institute for Artificial Intelligence (Ai2), organisation à but non lucratif, a été créé en 2014 par Paul Allen, co-fondateur de Microsoft dans le but de participer activement au développement de l’intelligence artificielle pour le bien commun. Il franchit un pas décisif dans cette direction avec la publication du LLM OLMo. Alors que certains modèles open source incluent les codes et les poids, Ai2 rend le modèle OLMo véritablement ouvert en fournissant non seulement les codes et les poids, mais aussi le code d’entraînement, les données d’entraînement et les boîtes à outils associées, le tout sous licence Apache 2.0.
Avec la publication du modèle de pointe OLMo et du cadre qui l’accompagne, l’objectif d’Ai2 est de favoriser l’innovation et la collaboration sur les modèles de langage, tout en sensibilisant aux enjeux éthiques et sociétaux qu’ils soulèvent.
Hanna Hajishirzi, Cheffe de projet OLMo, Directrice principale de la recherche en NLP à AI2 et professeure à l’Allen School de l’UW, explique:
“De nombreux modèles de langage sont aujourd’hui publiés avec une transparence limitée. Sans avoir accès aux données d’entraînement, les chercheurs ne peuvent pas comprendre scientifiquement le fonctionnement d’un modèle. C’est l’équivalent de la découverte de médicaments sans essais cliniques ou de l’étude du système solaire sans télescope. Grâce à notre nouveau cadre, les chercheurs seront enfin en mesure d’étudier la science des LLM, ce qui est essentiel pour construire la prochaine génération d’IA sûre et digne de confiance”.
OLMo est le fruit d’une collaboration avec le Kempner Institute for the Study of Natural and Artificial Intelligence de l’Université Harvard et des partenaires tels qu’AMD, CSC, la Paul G. Allen School of Computer Science & Engineering de l’Université de Washington et Databricks.
Les modèles OLMo 7B et 1B ont été développés sur le supercalculateur LUMI du CSC (Centre de technologie de l’information pour la science), alimenté par des processeurs AMD EPYC™ et des accélérateurs AMD Instinct™ et ont été entraînés grâce à la plateforme MosaicML de Datbricks.
Le cadre comprend une suite d’outils de développement d’IA entièrement ouverts, notamment :
Données de pré-entraînement complètes : le modèle est construit sur l’ensemble Dolma d’AI2 qui comprend un corpus ouvert de trois billions de jetons pour le pré-entraînement du modèle de langage, y compris le code qui produit les données d’apprentissage.
Le cadre OLMo comprend des pondérations de modèle complètes pour quatre variantes de modèle à l’échelle 7B, chacune entraînée à au moins 2T tokens. Le code d’inférence, les métriques d’entraînement et les journaux d’entraînement sont tous fournis.
Evaluation : Ai2 a publié la suite d’évaluation utilisée dans le développement, avec plus de 500 points de contrôle par modèle, toutes les 1000 étapes du processus de formation et le code d’évaluation sous l’égide du projet Catwalk.
Eric Horvitz, directeur scientifique de Microsoft et membre fondateur du conseil consultatif scientifique d’AI2, déclare :
“Je suis enthousiaste à l’idée de mettre OLMo entre les mains des chercheurs en IA. La nouvelle offre s’inscrit dans la tradition d’Allen AI de fournir des modèles, des outils et des données ouverts de valeur, qui ont stimulé de nombreuses avancées dans le domaine de l’IA dans la communauté mondiale”.
Avec OLMo, les chercheurs et développeurs en IA feront l’expérience de :
Plus de précision : Grâce à une connaissance complète des données d’entraînement qui sous-tendent le modèle, les chercheurs seront en mesure de travailler plus rapidement et n’auront plus besoin de dépendre d’hypothèses qualitatives sur la façon dont le modèle fonctionne, mais pourront le tester scientifiquement.
Moins de carbone : À l’heure actuelle, une séance d’entraînement équivaut aux émissions de neuf foyers américains pendant un an, selon l’EPA, l’agence américaine de protection de l’environnement. En offrant un accès complet à l’écosystème de formation et d’évaluation, Ai2 diminue considérablement les répétitions dans le processus de développement, ce qui est crucial pour la réduction des émissions de carbone dans le domaine de l’intelligence artificielle.
Des résultats durables : Le fait de garder les modèles et leurs ensembles de données ouverts et non derrière les API permet aux chercheurs d’apprendre et de s’appuyer sur des modèles et des travaux antérieurs.
Ai2 prévoit d’ajouter prochainement différentes tailles de modèles, modalités, ensembles de données et capacités à la famille OLMo.
Noah Smith, chef de projet OLMo, directeur principal de la recherche en NLP à AI2 et professeur à l’Allen School de l’UW, conclut :
“Avec OLMo, ouvert signifie en fait « ouvert » et tous les membres de la communauté de recherche en IA auront accès à tous les aspects de la création de modèles, y compris le code d’entraînement, les méthodes d’évaluation, les données, etc…L’IA était autrefois un domaine ouvert centré sur une communauté de recherche active, mais à mesure que les modèles se sont développés, sont devenus plus chers et ont commencé à se transformer en produits commerciaux, le travail sur l’IA a commencé à se dérouler derrière des portes closes. Avec OLMo, nous espérons aller à l’encontre de cette tendance et donner à la communauté des chercheurs les moyens de se réunir pour mieux comprendre et s’engager avec les modèles de langage de manière scientifique, ce qui conduira à une technologie d’IA plus responsable qui profite à tous”.
Le modèle OLMo et son framework sont accessibles en téléchargement direct sur Hugging Face et GitHub.
Amazon, comme toutes les entreprises de l’e-commerce, accorde une grande importance à la qualité de l’expérience client en ligne de ses clients, source de fidélité. C’est dans ce cadre que la société a récemment annoncé le lancement de Rufus, “un assistant d’achat expert” basé sur l’IA générative, conçu pour aider les clients à trouver les produits qui correspondent le mieux à leurs besoins.
Rufus est intégré à l’application mobile d’Amazon, offrant une expérience transparente aux clients lors d
Amazon, comme toutes les entreprises de l’e-commerce, accorde une grande importance à la qualité de l’expérience client en ligne de ses clients, source de fidélité. C’est dans ce cadre que la société a récemment annoncé le lancement de Rufus, “un assistant d’achat expert” basé sur l’IA générative, conçu pour aider les clients à trouver les produits qui correspondent le mieux à leurs besoins.
Rufus est intégré à l’application mobile d’Amazon, offrant une expérience transparente aux clients lors de leurs achats. Les utilisateurs peuvent poser une question dans la barre de recherche de l’application et ensuite interagir avec Rufus via une boîte de dialogue.
Actuellement en version bêta auprès d’un nombre restreints de clients américains utilisant l’application mobile, il sera déployé progressivement aux Etats-Unis dans les semaines à venir. Amazon n’annonce pas de date pour son déploiement en France.
Le modèle qui alimente le chatbot a été entraîné sur le catalogue de produits d’Amazon, les avis des clients, les questions-réponses de la communauté et des informations provenant du Web pour répondre aux différentes questions des clients qu’elles soient générales ou concernent un produit particulier, fournir des comparaisons et faire des recommandations basées sur le contexte conversationnel.
Amazon donne l’exemple d’une recherche générale au début d’un parcours d’achat, telle que « que faut-il prendre en compte lors de l’achat de chaussures de course ? », de comparaisons telles que « quelles sont les différences entre les chaussures de trail et de course sur route ? », en passant par des questions plus spécifiques telles que « sont-elles durables ? »
Les clients peuvent ainsi demander à l’IA des recommandations de produits basées sur des activités spécifiques ou des objectifs, tels que jouer au golf par temps froid ou commencer un jardin intérieur, mais également pour des besoins particuliers, comme des cadeaux pour la Saint-Valentin ou des jouets pour un enfant de 5 ans.
Outre la comparaison de différents types de produits, Rufus peut fournir des réponses à des questions détaillées sur des produits spécifiques, telles que la facilité de tenue d’une perceuse sans fil ou la possibilité ou non de laver un vêtement en machine.
Amazon, qui continue à travailler à l’amélioration des réponses de Rufus, encourage ses premiers utilisateurs à fournir des commentaires pour l’y aider.
Fondée en septembre 2023, issue d’un projet confié à Inria par le secrétariat général pour l’investissement dans le cadre de France 2030, la start-up Probabl propose des solutions et des services basés sur la bibliothèque open-source d’apprentissage statistique en Python “scikit-learn”, l’une des plus utilisées dans le monde avec PyTorch et TensorFlow,“afin de pérenniser son existence et d’assurer son rayonnement”.
La mission P16 confiée à Inria et soutenue par de nombreux industriels dont Airbu
Fondée en septembre 2023, issue d’un projet confié à Inria par le secrétariat général pour l’investissement dans le cadre de France 2030, la start-up Probabl propose des solutions et des services basés sur la bibliothèque open-source d’apprentissage statistique en Python “scikit-learn”, l’une des plus utilisées dans le monde avec PyTorch et TensorFlow,“afin de pérenniser son existence et d’assurer son rayonnement”.
La mission P16 confiée à Inria et soutenue par de nombreux industriels dont Airbus, Axa, Berger-Levrault, Criteo, Dassault Systèmes, Docaposte, Hugging Face, Naval Group, OpenValue et Valeo, vise à développer et pérenniser des outils open source pour la science des données, l’IA et le ML, en étendant l’infrastructure logicielle de scikit-learn. Elle se concrétise à travers deux initiatives : l’une dirigée par Inria pour les aspects de R&D, et l’autre menée par sa spin-off Probabl pour la dimension industrielle.
La start-up est dirigée par Yann Lechelle, un entrepreneur chevronné de la French Tech et ancien directeur général de Scaleway. Il est entouré d’une équipe d’experts comprenant notamment Camille Troillard, Gaël Varoquaux (Directeur de Recherche à Inria) et Olivier Grisel, l’un des porteurs du projet scikit-learn avec Loïc Estève, Alexandre Gramfort, Bertrand Thirion, Gaël Varoquaux, de membres du consortium scikit-learn tels que François Goupil, Guillaume Lemaitre et Jérémie Du Boisberranger, ainsi que par Fabien Gandon, Directeur de Recherche à Inria.
Une gouvernance et un actionnariat adaptés à sa raison d’être
Pour assurer sa mission ambitieuse, Probabl a mis en place un modèle d’actionnariat équilibré, reflétant son engagement en faveur de la souveraineté industrielle et numérique. Trois collèges d’actionnaires se partagent les parts de l’entreprise : un collège public représentant l’Etat via le dispositif French Tech Souveraineté, un collège privé comprenant des investisseurs tels que le fonds Costanoa Ventures spécialisé dans les solutions open source, et enfin un collège de collaborateurs individuels. Cette structure garantit une représentation équitable de chaque partie prenante mais également une gouvernance équilibrée avec deux sièges par collège et un siège pour un membre indépendant, occupé par la chercheuse et entrepreneuse Stéphan-Eloïse Gras.
Une vision orientée vers l’innovation et la durabilité
Probabl s’est donné pour mission de renforcer la résilience de la France et de l’Europe tout en réduisant leur dépendance technologique “grâce à une technologie open source qu’elles ont vu naître”. Ciblant le marché global de la science des données au delà de scikit-learn, estimé à près de 700 milliards d’euros d’ici 2030, l’entreprise entend jouer un rôle clé dans la transformation numérique de la société et dans l’adoption d’un IA industrielle efficiente et conforme à l’AI Act européen, dans le respect des normes éthiques et juridiques les plus strictes.
Parmi ses projets, des offres liées à la formation, au support, la certification, l’hébergement et la fourniture de services gérés, aux services professionnels…
Datacook, start-up française spécialisée dans l’intelligence artificielle appliquée au marketing, annonce la finalisation d’une levée de fonds de 1 million d’euros auprès des investisseurs SIDE Capital, NEO FOUNDERS et Bpifrance. Ce financement lui permettra non seulement d’accélérer le déploiement de sa solution d’IA générative de segmentation client prédictive mais de continuer à investir dans la R&D pour lui apporter de nouvelles fonctionnalités.
Le marché des logiciels CRM est en forte c
Datacook, start-up française spécialisée dans l’intelligence artificielle appliquée au marketing, annonce la finalisation d’une levée de fonds de 1 million d’euros auprès des investisseurs SIDE Capital, NEO FOUNDERS et Bpifrance. Ce financement lui permettra non seulement d’accélérer le déploiement de sa solution d’IA générative de segmentation client prédictive mais de continuer à investir dans la R&D pour lui apporter de nouvelles fonctionnalités.
Le marché des logiciels CRM est en forte croissance. Ceux-ci sont devenus indispensables aux entreprises qui veulent offrir à leurs clients des expériences personnalisées, renforcer leur fidélité et stimuler leur croissance. Datacook compte parmi ses clients des entreprises des secteurs du e-commerce, de la finance, du retail, de l’immobilier, du luxe, du tourisme mais aussi de la santé.
Créée en 2018 par Élodie Vaillant, experte en marketing et spécialiste des stratégies CRM, et Baptiste Pigaux, expert en data science et multi-médaillé en compétition, élue meilleure entreprise innovante par BPI France en 2020, Datacook a développé une méthodologie unique de data science marketing prédictive entièrement robotisée : H.I.T (High Innovation Targeting), alliant intelligences artificielle et humaine. Son équipe d’experts en data reçoit régulièrement des formations pluridisciplinaires portant sur le marketing opérationnel, le marketing stratégique, la méthode Agile, le big data, l’IA, le dataviz et le développement personnel. Elle est d’ailleurs classée parmi les 4 000 meilleurs datascientists au niveau mondial.
La majorité des solutions CRM sont déjà dotées de segments prédéfinis, basés sur des critères fixes ne permettant pas de prédire les changements de comportement de la clientèle. L’IA de scoring et de segmentation prédictive de Datacook se différencie en cartographiant en permanence la clientèle pour dresser un portrait précis, en temps réel, de chacun des clients afin d’anticiper son comportement et ainsi, de pouvoir lui offrir une expérience personnalisée unique.
Outre les segments classiques liés au profil client (critères sociodémographiques, socioéconomiques…), la solution prend également en compte la valeur future des clients, leur possible attrition, leurs préférences produits, les habitudes d’achat, leurs canaux de prédilection et leurs moments de vie (naissance d’enfants, déménagement…).
Les segments sont réactualisés et directement injectés dans les outils de campagne et de CRM. Les départements marketing et commerciaux sont ainsi informés en temps réel sur les segments qui nécessitent une action de communication ou une action commerciale.
Disponible en mode SaaS sous licence annuelle, la solution Datacook s’intègre aux outils CRM existants, elle est notamment compatible avec les solutions CRM les plus répandues en entreprise, telles qu’Adobe, Eloqua, Selligent, Splio, Efficity, Actito ou Salesforce.
Selon la start-up, en plus de la propulser sur le marché européen, cette levée de fonds lui permettra également d’investir dans la recherche et le développement de nouvelles fonctionnalités produit, qui, adossées à l’IA, permettront de pousser encore plus loin le degré d’ultra-personnalisation marketing.
Élodie Vaillant, CEO et co-fondatrice de Datacook, commente :
“La confiance de nos investisseurs dans notre vision et notre capacité à fournir des solutions prédictives de pointe se manifeste à travers cette levée de fonds”.
En novembre dernier, Meta s’associait à la plateforme collaborative open-source Hugging Face et à Scaleway, un leader du cloud européen pour les infrastructures IA, pour lancer “AI Startup Program”, une initiative visant à accélérer l’adoption de solutions d’IA open-source au sein de l’écosystème entrepreneurial français. Meta et ses partenaires ont dévoilé hier le nom des cinq lauréats de ce programme d’accompagnement.
AI Start-up Program vise à accompagner jusqu’en juin 2024 cinq jeunes pousse
En novembre dernier, Meta s’associait à la plateforme collaborative open-source Hugging Face et à Scaleway, un leader du cloud européen pour les infrastructures IA, pour lancer “AI Startup Program”, une initiative visant à accélérer l’adoption de solutions d’IA open-source au sein de l’écosystème entrepreneurial français. Meta et ses partenaires ont dévoilé hier le nom des cinq lauréats de ce programme d’accompagnement.
AI Start-up Program vise à accompagner jusqu’en juin 2024 cinq jeunes pousses en phase d’accélération. Lancé au campus Station F tout comme celui de Microsoft, le “Microsoft Generative AI Startup Program” qui se concentre sur l’IA générative, celui de Meta vise avant tout à favoriser l’open source. Les projets présentés devaient s’appuyer sur des modèles de fondation ouverts et/ou démontrer leur volonté d’intégrer ces modèles à leurs produits et services.
Les startups retenues vont bénéficier d’un mentorat technique de la part de chercheurs, ingénieurs ou doctorants de FAIR, le laboratoire de recherche en intelligence artificielle de Meta dirigé par Yann Le Cun, d’un accès à la plateforme et aux outils d’Hugging Face, de la puissance de calcul de Scaleway et du soutien de l’incubateur HEC.
Laurent Solly, Vice-Président Europe du Sud de Meta, souligne :
“Nous sommes très fiers d’accompagner ces cinq projets innovants au sein de l’AI Startup Program. Meta participe depuis plus de 10 ans au développement de l’écosystème d’IA français selon une approche ouverte et collaborative. Ce programme vient renforcer notre contribution et je me réjouis d’ailleurs que la plupart des startups intègrent des modèles open source tels que Llama2 et DinoV2, qui ont été conçus au sein de notre laboratoire de recherche fondamentale FAIR, basé à Paris”.
Les 5 start-ups qui ont rejoint le programme
A l’issue d’une sélection par un jury d’experts parmi les 103 candidatures reçues, les 5 lauréats sont les suivants :
Jimini AI
Jimini AI, start-up créée en mars 2023 par Raphaël Arroche et Stéphane Béreux, a levé 1,9 million d’euros en novembre dernier pour accélérer le développement de son IA juridique. Son copilote IA, utilise la GenAI pour assister les professionnels du droit (juristes d’entreprise et avocats) dans leurs tâches de recherche, d’analyse et de rédaction de documents juridiques.
Pollen Robotics
Pollen Robotics, créée en 2016 par Matthieu Lapeyre et Pierre Rouanet, deux anciens chercheurs d’un laboratoire de robotique d’INRIA, propose une plateforme humanoïde open source qui combine l’IA et la robotique pour adresser les besoins de la recherche et de l’industrie.
Fringuant
Fringuant, cofondée par Jacques Allibert, Lancelot Convertir, Clément Poiret et Zoé Tournant, a développé une solution de scan corporel permettant de limiter les retours lors de commandes en ligne. La captation de la morphologie du client, comparée aux dimensions et caractéristiques des vêtements, permet de fournir des recommandations précises non seulement sur la taille, mais aussi sur la coupe du vêtement sélectionné.
Qevlar AI
La solution de Qevlar AI, co-fondée en mars 2023 par Ahmed Achchak et Hamza Sayah vise à transformer les opérations de cybersécurité en automatisant intelligemment le processus d’investigation, un élément critique mais souvent chronophage dans ce domaine. Elle révolutionne les opérations de cybersécurité en introduisant des agents autonomes capables de mener des investigations avancées de manière autonome, ce qui permet aux SOCs (Centres des Opérations de Sécurité) de se concentrer davantage sur des stratégies de réponse rapide.
Kartoon
Kartoon, développe une application mobile qui permet aux amateurs de raconter des histoires sous forme de webtoons de façon collaborative et sans avoir à dessiner.
Meta, Hugging Face et Scaleway dévoilent les 5 lauréats de l’AI Startup Program