Apertus : l’IA suisse qui allie ouverture, traçabilité et souveraineté

Déc 21, 2025

L’EPFL, l’ETH Zurich et le Centre suisse de calcul scientifique ont annoncé la mise à disposition d’Apertus, un modèle de langage multilingue publié en open source sous licence Apache 2.0, avec divulgation des poids, de la documentation et d’éléments de traçabilité liés à l’entraînement. Le dispositif vise des usages organisationnels, avec un positionnement d’infrastructure scientifique plutôt que de produit grand public, dans un contexte de dépendance des acteurs suisses aux plateformes propriétaires américaines.

Le périmètre technique repose sur deux variantes, 8 milliards et 70 milliards de paramètres, entraînées sur près de 15 000 milliards de tokens issus de plus de 1 000 langues. Une part significative de contenus non anglophones a été intégrée, avec un objectif explicite de couverture linguistique incluant le suisse allemand et le romanche, rarement traités avec un niveau de priorité comparable dans les modèles ouverts. La publication des recettes de formation et de la chaîne documentaire vise une auditabilité opérationnelle, au-delà d’une simple diffusion de poids.

Apertus, modèle de langage open source suisse pour la souveraineté numérique

La logique institutionnelle d’Apertus s’inscrit dans les attentes de souveraineté numérique portées par des organisations publiques et privées confrontées à des contraintes de localisation des données, de gestion des risques fournisseurs et de conformité. En Suisse, la protection des données et les exigences contractuelles sur le traitement transfrontalier structurent les achats IT, en particulier dans la santé, la finance, l’assurance et l’administration. Une base ouverte permet des déploiements sur infrastructure contrôlée, avec des mécanismes de revue interne et de sécurité alignés sur les pratiques d’audit.

Ce choix rapproche aussi le projet des dynamiques européennes autour de l’AI Act, qui formalise des obligations de transparence et de documentation pour certains systèmes et, selon les cas d’usage, des exigences de traçabilité. Pour une PME romande fictive, un intégrateur déployant un assistant de support en français, allemand et italien, la disponibilité d’une chaîne documentaire et d’artefacts de formation réduit le coût de conformité et facilite la due diligence côté clients, notamment dans les appels d’offres publics. Le centre de gravité se déplace vers la gouvernance des données et la gestion des versions, et moins vers le simple accès à une API.

La publication sous licence Apache 2.0 cadre les conditions de réutilisation, y compris commerciale, et clarifie les droits d’intégration dans des produits internes. Le point d’attention opérationnel reste la responsabilité des acteurs qui affinent le modèle pour un secteur donné, en particulier sur la qualité des corpus, la gestion du droit d’auteur et la documentation des adaptations. Le débat ne porte plus uniquement sur la performance, mais sur la capacité à démontrer un contrôle.

Transparence et traçabilité, un levier pour les acteurs publics et les secteurs régulés

Le différenciateur revendiqué tient à l’exposition d’éléments méthodologiques qui manquent souvent dans les publications dites ouvertes, limitées à des poids sans contexte complet. Pour des administrations cantonales, la question devient pragmatique. Comment justifier un traitement automatisé multilingue dans la relation usagers, et documenter les sources, les limites et les contrôles, sans dépendre d’un prestataire opaque.

Dans un scénario type, un hôpital universitaire souhaitant automatiser la rédaction de comptes rendus ou la traduction de documents patients doit démontrer un contrôle strict des données et des flux. Un modèle déployé on premise, avec des procédures d’audit, répond à une partie de l’équation, mais déplace la charge vers l’organisation. Compétences MLOps, supervision des sorties, évaluation des biais et gestion des incidents deviennent des postes budgétaires, avec des arbitrages entre équipes internes, prestataires et centres de calcul.

La présence du CSCS dans l’architecture du projet renvoie aussi à la question de la capacité de calcul et des chaînes de production. Les entreprises utilisatrices disposent rarement d’infrastructures adaptées à l’entraînement complet, mais peuvent viser l’adaptation fine et l’inférence sur des environnements maîtrisés. La variable décisive devient alors le dimensionnement, la sécurité et les coûts énergétiques, plus que la démonstration technologique.

Apertus face aux modèles propriétaires, implications économiques et limites de performance

Avec 70 milliards de paramètres, Apertus se situe sous les ordres de grandeur des modèles propriétaires les plus avancés, dont l’entraînement mobilise des budgets et des volumes de calcul supérieurs. Cette différence se traduit, selon les tâches, par des écarts sur le raisonnement complexe, la robustesse en contexte long ou certaines capacités d’outillage. Dans un service juridique d’une grande entreprise alémanique, la synthèse multilingue de dossiers volumineux peut rester plus fiable sur des solutions propriétaires, au prix d’une dépendance et de contraintes contractuelles.

Le projet assume un positionnement de brique de base plutôt que d’agent conversationnel grand public. L’enjeu économique se situe donc dans l’écosystème. Éditeurs logiciels suisses, intégrateurs et unités data des grandes entreprises peuvent bâtir des solutions spécialisées, avec des niveaux d’explicabilité et de contrôle adaptés aux exigences des clients. La compétition se joue sur la qualité des données sectorielles, les mécanismes d’évaluation, la cybersécurité et le support, plus que sur la seule taille du modèle.

Cette trajectoire correspond à une logique de bien public numérique, où la valeur est captée en aval par les services, l’intégration et la conformité. Pour un laboratoire de recherche, l’accès à une base multilingue documentée facilite la reproductibilité et les comparaisons, un point récurrent dans l’histoire du logiciel scientifique. Pour une entreprise, la question demeure immédiate. Les équipes sont-elles prêtes à internaliser une partie de la chaîne, plutôt que de déléguer à un fournisseur de cloud et à des modèles fermés.

Apertus : l’IA suisse qui allie ouverture, traçabilité et souveraineté

Apertus, modèle de langage open source suisse pour la souveraineté numérique

Transparence et traçabilité, un levier pour les acteurs publics et les secteurs régulés

Apertus face aux modèles propriétaires, implications économiques et limites de performance

About Author

Antoine Keller

La Suisse révolutionne le chauffage domestique grâce à une intelligence artificielle innovante

L’or captive les investisseurs suisses : un refuge sûr ou le signe d’une frénésie naissante ?

Leave a Reply Cancel reply

Pubications récentes

Categories

Related Posts

Lemanfinance.

Apertus, modèle de langage open source suisse pour la souveraineté numérique

Transparence et traçabilité, un levier pour les acteurs publics et les secteurs régulés

Apertus face aux modèles propriétaires, implications économiques et limites de performance

About Author

Antoine Keller

La Suisse révolutionne le chauffage domestique grâce à une intelligence artificielle innovante

L’or captive les investisseurs suisses : un refuge sûr ou le signe d’une frénésie naissante ?

Leave a Reply Cancel reply

Pubications récentes

Categories

Related Posts

Les 7 Meilleurs Outils SEO Alimentés par l’IA pour Booster Votre Classement en 2026

La fin du SEO tel que nous le connaissons : comment l’IA révolutionne la recherche, la découverte et la réservation

Qu’est-ce que l’IA vraiment et quel impact a-t-elle sur le référencement SEO ?