Le gouvernement ouzbek développe une grande modèle linguistique national d’intelligence artificielle (IA) pour assurer son indépendance numérique, préserver son identité culturelle et stimuler l’innovation dans des secteurs clés comme la santé et l’éducation. Ce projet s’inscrit dans une stratégie nationale ambitieuse jusqu’en 2030, avec un double enjeu technique et socioculturel.
Une IA linguistique nationale au service du développement et de l’identité culturelle
L’Ouzbékistan a officiellement engagé en 2024 le développement d’un grand modèle linguistique (Large Language Model, LLM) spécifique à la langue ouzbèke, dans le cadre de sa Stratégie de développement de l’intelligence artificielle jusqu’en 2030. Ce projet repose sur la collecte massive de données en langue ouzbèke — textes littéraires, contenus analytiques, images, mais aussi données médicales anonymisées (comme des IRM ou des scanners) — afin de constituer des ensembles de données (datasets) optimisés pour l’entraînement des algorithmes d’IA. Cette approche vise à créer une base numérique exhaustive et fiable, représentative de la culture, de l’histoire et des spécificités locales.
Les autorités mettent un point d’honneur à ce que cette IA reflète fidèlement la mémoire collective et évite les biais des modèles mondiaux tels que ChatGPT, qui peuvent véhiculer des stéréotypes ou des erreurs factuelles. Par exemple, la figure historique d’Amir Temur peut être interprétée de façon divergent selon les sources internationales. Avec un modèle national, Ouzbékistan entend consolider une « vérité » historique et culturelle locale, intégrée dans l’intelligence artificielle, pour un usage public mais aussi scientifique et administratif. Cette IA doit aussi répondre à des besoins pratiques : traduction automatique, reconnaissance vocale, assistance médicale via diagnostic précoce, ou encore automatisation de procédures dans la banque et le service client.
Le projet comprend aussi un volet infrastructurel avec l’installation de clusters GPU locaux, notamment un grand cluster prévu pour 2026, capable de gérer jusqu’à 100 projets différents. Cela doit réduire la dépendance aux serveurs étrangers coûteux et garantir la confidentialité des données sensibles, notamment dans les institutions publiques.
Le projet kazakhstanais, une initiative parallèle en Asie centrale
Dans la région, le Kazakhstan mène une démarche comparable avec son propre LLM baptisé « KAZ-LLM », présenté récemment et déjà opérationnel. Ce modèle vise lui aussi à renforcer la souveraineté numérique du pays en proposant une IA adaptée aux langues kazakhe et russe, deux langues majeures du pays. Il s’inscrit dans une volonté similaire de préserver l’identité culturelle, améliorer l’accès aux services numériques et encourager l’innovation locale.
Le KAZ-LLM, développé avec le soutien d’institutions universitaires et du secteur privé, met l’accent sur la diversité linguistique et culturelle du pays, en évitant les biais des modèles internationaux. Comme en Ouzbékistan, ce LLM servira à des applications variées : traduction automatique, analyse de données, support à l’éducation et à la recherche, mais aussi développement d’applications dans la santé ou la finance. La disponibilité de ce modèle sur des serveurs locaux permet également de réduire les coûts d’exploitation et d’accélérer la diffusion de l’IA au sein des PME et startups kazakhes.
Ces initiatives montrent une tendance forte en Asie centrale à vouloir maîtriser leurs propres technologies d’intelligence artificielle. Elles illustrent aussi les défis de la numérisation dans des contextes plurilingues et multiculturels, où la précision historique et linguistique est cruciale pour éviter les déformations. Ainsi, le Kazakhstan et l’Ouzbékistan se positionnent comme des pionniers régionaux dans la construction d’un écosystème numérique souverain, à la fois moderne et respectueux des particularités nationales.
