LUCIE

L’IA générative Open Source française.

LUCIE n’est pas seulement ouverte, elle est également transparente et fiable. Depuis sa création, chaque décision a été guidée par des principes de responsabilité, d’équité et de fiabilité. Que ce soit pour l’éducation, le gouvernement ou la recherche, LUCIE est conçue pour être un modèle sur lequel vous pouvez compter.
Lancée à l’été 2023, l’initiative OpenLLM-France regroupe plus de 800 acteurs publics et privés : chercheurs, startups et entreprises en France et en Europe. Son ambition ? Créer des communs numériques pour l’IA générative, avec un accent particulier sur l’éducation, tout en garantissant la souveraineté des données.
Origines du projet
Le voyage de LUCIE a commencé en juin 2023 lorsque LINAGORA a décidé de lancer la communauté OpenLLM France, réunissant des contributeurs (>900 membres en janvier 2025) autour de l’objectif de construire une IA générative ouverte alignée sur les valeurs européennes communes.
En février 2024, cette communauté s’est transformée en OpenLLM Europe, visant à connecter et renforcer les initiatives européennes pour des modèles génératifs d’IA ouverts et éthiques.
Pour aller plus loin dans cette vision, LINAGORA a dirigé le consortium OpenLLM France**, formé avec 11 partenaires de la communauté, pour répondre à l’appel à projets « Communs Numériques dans le domaine de l’IA Générative ».
Désormais lauréat France 2030, le consortium s’engage dans une mission de deux ans débutant fin 2024 pour créer des communs d’IA générative ouverts, avec un accent particulier sur l’éducation et le secteur EdTech.
L’étape suivante est survenue fin 2023, lorsque LINAGORA a initié l’entraînement de LUCIE avec le soutien de la communauté et particulièrement du GENCI (Grand Équipement National de Calcul Intensif) pour l’accès au supercalculateur Jean Zay.
Aujourd’hui, en janvier 2025, la sortie de LUCIE marque une étape importante dans la livraison d’un modèle d’IA véritablement open source, éthique et efficace pour l’Europe et au-delà.
Origines du nom du modèle LUCIE
Le prénom LUCIE porte une double symbolique :
  1. Il fait écho à « Lucy », l’ancêtre commun de toute l’humanité, un symbole universel d’origine et de connexion.
  2. Il renvoie également au personnage principal du film « Lucy » de Luc Besson, qui réussit à maîtriser l’intégralité du savoir humain.
Son visage s’inspire de la Marianne républicaine, symbole de la France, tout en évoquant également celui de Scarlett Johansson, l’héroïne du film « Lucy ». Drapée d’un châle tricolore, LUCIE incarne la souveraineté et les valeurs françaises.
Qu’est-ce qui fait de LUCIE un vrai modèle open source ?
    • Données ouvertes: Tous les jeux de données d’entraînement sont librement accessibles et sous licence pour un usage public. Ils garantissent la transparence tout au long des étapes de traitement des données, de leur collecte à leur préparation pour l’entraînement du modèle.
    • Algorithmes publics: Les méthodes d’entraînement, les processus de fine-tuning et la  » sauce secrète  » sont soigneusement documentés et librement accessibles à toute personne souhaitant les étudier, les utiliser et les améliorer.
    • Une chaîne de production intégralement en libre accès: Les poids, les checkpoints, le code source de l’ensemble des outils et scripts utilisés, et les binaires du modèle LUCIE sont disponibles sous la licence Apache 2.0. Cette licence permissive et illimitée permet à quiconque, partout dans le monde, d’utiliser, d’adapter et de déployer le modèle dans n’importe quel but, garantissant ainsi une véritable accessibilité et une innovation à l’échelle mondiale.
Conçue pour la souveraineté et la durabilité
LUCIE a été conçue pour relever les défis uniques que pose le développement d’une IA éthique, efficace et accessible.
  • Souveraineté européenne: LUCIE incarne un engagement vis-à-vis des valeurs européennes en respectant la diversité culturelle, en promouvant un développement éthique de l’IA et en veillant au respect de la loi sur l’IA.
  • Compact et efficace: Sobre et optimisée pour les environnements à faibles ressources, l’architecture de LUCIE permet un déploiement sur des infrastructures « pauvres en GPU » et même sur des appareils mobiles.
  • Éco-responsabilité: En privilégiant la qualité plutôt que la quantité des données d’entraînement, nous garantissons une empreinte environnementale plus légère sans compromettre les performances.
L’entraînement de LUCIE
Déployé sur le supercalculateur Jean Zay (GENCI), l’entraînement vise à traiter 3 000 milliards de tokens.
  1. Composition du dataset : un mélange multilingue comprenant 33 % d’anglais, 32,4 % de français, 15 % de code/mathématiques, et 20 % d’autres langues comme l’allemand, l’espagnol et l’italien.
  2. Filtrage des données : un tri rigoureux garantit des informations de haute qualité, tout en excluant les contenus redondants, erronés ou offensants.
  3. Parallélisme avancé : la méthode de parallélisme « 3D » optimise les ressources tout en actualisant les données en fin d’entraînement.
  4. Extension de la fenêtre contextuelle : capable de traiter jusqu’à 128 000 tokens, LUCIE est particulièrement adaptée aux cas d’usage comme le RAG (Retrieval-Augmented Generation).
  5. Instruction et alignement : une phase en deux étapes (fine-tuning et apprentissage par renforcement) affine les performances du modèle.
Logo CDCP rond

Créateur de valeur par le Digital Learning.

Centre pour le Développement des Compétences Professionnelles (CDCP Digital Learning), créé depuis 2006, agence de Digital Learning sur-mesure. Nous accompagnons les institutions (entreprises, PME, universités, centres de formation, …) dans la conception et la digitalisation de leurs contenus de formation.

Poursuivez votre lecture.

Vous avez un projet?

Vous voulez faire évoluer votre stratégie d’apprentissage digitale,
vos espaces pédagogiques numériques, vos contenus ?
Informez-vous, formez-vous, nos experts sont là pour vous accompagner.
Retour en haut

Ne manquez rien,
abonnez-vous à notre

Newsletter

Pour ne rien rater de nos actualités,
restez informés de toutes nos nouveautés grâce à notre Newsletter.

Woman tablette
Ouvrir WhatsApp
Besoin d'aide?
Bonjour ! des questions ou avoir plus d'informations, contactez-nous!