Meta réchauffe la course aux armements de l’IA de Big Tech avec un nouveau modèle de langage

24 février (Reuters) – Meta Platforms Inc (META.O) a annoncé vendredi qu’elle publiait un grand nouveau modèle de langage, le logiciel sous-jacent d’un nouveau système d’IA, pour les chercheurs, alimentant une course aux armements en matière d’intelligence artificielle alors que les grandes entreprises de technologie se bousculent pour intégrer la technologie dans leurs produits et impressionner les investisseurs.

La bataille publique pour dominer l’espace technologique de l’IA a commencé à la fin de l’année dernière avec le lancement d’OpenAI ChatGPT soutenu par Microsoft et a poussé les poids lourds de la technologie d’Alphabet Inc (GOOGL.O) au chinois Baidu Inc (9888. HK), pour tromper leur des offres.

Le LLaMA de Meta, abréviation de Large Language Model Meta AI, sera disponible sous une licence non commerciale pour les chercheurs et les entités affiliées au gouvernement, à la société civile et au milieu universitaire, a-t-il déclaré dans un blog.

Les grands modèles de langage extraient de grandes quantités de texte pour résumer les informations et générer du contenu. Ils peuvent répondre à des questions, par exemple, avec des phrases qui peuvent être lues comme si elles avaient été écrites par des humains.

Dernières mises à jour

Voir 2 autres histoires

Le modèle, qui, selon Meta, nécessite « beaucoup moins » de puissance de calcul que les offres précédentes, est formé sur 20 langues en mettant l’accent sur celles avec des alphabets latin et cyrillique.

« L’annonce de Meta aujourd’hui semble être un pas en avant dans le test de leurs capacités d’IA générative afin qu’ils puissent les implémenter dans leurs produits à l’avenir », a déclaré Gil Luria, analyste logiciel senior chez DA Davidson.

READ  Le distributeur français Auchan n'envisage pas de modifier sa stratégie pour la Russie

« L’IA générative est une nouvelle application de l’IA avec laquelle Meta a moins d’expérience, mais elle est clairement importante pour l’avenir de leur entreprise. »

L’intelligence artificielle est apparue comme un point positif pour les investissements dans le secteur de la technologie, dont la croissance plus lente a entraîné des licenciements généralisés et une réduction des paris expérimentaux.

Meta a déclaré que LLaMA pourrait surpasser les concurrents qui examinent plus de paramètres ou de variables que l’algorithme ne prend en compte.

Plus précisément, il a déclaré qu’une version de LLaMA avec 13 milliards de paramètres peut surpasser GPT-3, un prédécesseur récent du modèle sur lequel ChatGPT est construit.

Il a décrit son modèle LLaMA de 65 milliards de paramètres comme « compétitif » avec les Chinchilla70B et PaLM-540B de Google, qui sont encore plus grands que le modèle que Google utilise pour présenter sa recherche basée sur le chat Bard.

Une porte-parole de Meta a attribué la performance à des données plus « propres » et à des « améliorations architecturales » dans le modèle qui ont amélioré la stabilité de l’entraînement.

Meta en mai de l’année dernière a publié le grand modèle de langage OPT-175B, également destiné aux chercheurs, qui a constitué la base d’une nouvelle itération de son chatbot BlenderBot.

Il a ensuite introduit un modèle appelé Galactica, capable d’écrire des articles scientifiques et de résoudre des problèmes mathématiques, mais a rapidement arrêté la démo après avoir généré de fausses réponses faisant autorité.

Reportage de Yuvraj Malik et Eva Mathews à Bangalore et Katie Paul à New York; Edité par Shailesh Kuber et Grant McCool

READ  Vinay Mohan Kwatra, ambassadeur de l'Inde au Népal, succèdera à Shringla au poste de ministre des Affaires étrangères

Nos normes : Les principes de confiance de Thomson Reuters.

LEAVE A REPLY

Please enter your comment!
Please enter your name here