Une nouvelle start-up d'IA vocale issue du laboratoire français Kyutai

Une nouvelle start-up française d'intelligence artificielle vocale, fruit des recherches du laboratoire Kyutai et baptisée Gradium, a officialisé mardi son lancement, après avoir levé des fonds et commencé la commercialisation de ses modèles d'IA.

L'entreprise "entraîne des modèles d'intelligence artificielle pour transcrire de la voix, synthétiser de la voix, transformer de la voix, et améliorer sa qualité", a expliqué à l'AFP Neil Zeghidour, dirigeant et co-fondateur de Gradium.

Les technologies produites doivent permettre à des entreprises de créer des applications concrètes, comme des "agents de service client, des personnages dans des jeux vidéo, des tuteurs personnalisés, des coachs", a précisé le chercheur.

Actuellement, Gradium propose ses solutions en anglais, français, allemand, espagnol et portugais, et d'autres langues sont en développement.

Dans un communiqué officialisant sa création, l'entreprise indique avoir déjà commencé à commercialiser ses modèles, et avoir à son actif plusieurs clients, sans mentionner le montant de ses revenus ni le nombre de ses clients.

Elle précise qu'elle s'appuie "sur plus d'une décennie de recherches de pointe menées par les fondateurs de Kyutai", le laboratoire à but non-lucratif créé en 2023 notamment par Xavier Niel, propriétaire du groupe Iliad, et Rodolphe Saadé, PDG du transporteur maritime CMA CGM.

Cette filiation a alimenté la première levée de fonds de Gradium, d'un montant de 60 millions d'euros. Xavier Niel et Rodolphe Saadé ont ainsi investi aux côtés de plusieurs fonds, DST Global, Amplify Partners, Korelya Capital, et de l'ancien PDG de Google Eric Schmidt.

Le laboratoire Kyutai avait présenté "Moshi" à l'été 2024 un premier modèle d'IA générative principalement vocale. En février, il avait dévoilé un second modèle expérimental dédié à la traduction simultanée, baptisé "Hibiki".

En juin, la start-up française d'IA Mistral a lancé son premier modèle centré sur la reconnaissance vocale et la transcription dans plusieurs langues, baptisé Voxtral.

mng/jlo/vk