bo Le Bulletin officiel de l'éducation nationale, de la jeunesse et des sports

Le Bulletin officiel de l'éducation nationale, de la jeunesse et des sports publie des actes administratifs : décrets, arrêtés, notes de service, etc. La mise en place de mesures ministérielles et les opérations annuelles de gestion font l'objet de textes réglementaires publiés dans des BO spéciaux.

Organisation générale

Commission d’enrichissement de la langue française

Vocabulaire de l’intelligence artificielle

NOR : CTNR2423171K

Liste - JO du 6-9-2024

Ministère de la Culture

I. Termes et définitions

apprentissage antagoniste

Domaine : Informatique.

Définition : Apprentissage automatique qui consiste à entraîner un modèle à partir d’un jeu de données comprenant des données trompeuses ou ambiguës, de manière qu’il apprenne à discerner de telles données.

Note :

1. Les données trompeuses ou ambiguës sont souvent produites par un autre modèle.

2. L’apprentissage antagoniste sert par exemple à améliorer la reconnaissance d’infox vidéo, ou d’images et de textes falsifiés.

Voir aussi : apprentissage automatique, infox vidéo.

Équivalent étranger : adversarial machine learning (AML).

apprentissage par transfert

Domaine : Informatique.

Définition : Apprentissage automatique qui consiste à soumettre un modèle préentraîné à une nouvelle phase d’entraînement sur un volume réduit de données relatives à un domaine cible afin que le modèle ainsi obtenu génère des réponses pertinentes pour ce domaine.

Note : L’apprentissage par transfert réduit la durée et le coût de l’apprentissage automatique dans un domaine cible, notamment lorsque le volume de données disponibles dans ce domaine est faible.

Voir aussi : apprentissage automatique, modèle préentraîné.

Équivalent étranger : transfer learning.

génération automatique d’audio

Domaine : Informatique.

Définition : Opération qui consiste à produire ou à modifier des contenus audio, en réponse à une instruction générative, le plus souvent en utilisant un modèle à bruit statistique.

Note : La génération automatique d’audio est notamment employée pour composer des œuvres musicales en imitant un style donné ou pour produire un énoncé oral en imitant une voix particulière.

Voir aussi : infox vidéo, instruction générative, modèle à bruit statistique.

Équivalent étranger : AI audio generation, audio generative AI.

génération automatique de texte

Domaine : Informatique.

Définition : Opération par laquelle un grand modèle de langage, en réponse à une instruction générative, produit, modifie ou complète automatiquement des textes.

Note :

1. La génération automatique de texte en langue naturelle peut être employée, par exemple, pour répondre à une simple question, pour produire un résumé, un rapport, une traduction, voire une œuvre littéraire.

2. La génération automatique de texte en langage de programmation est notamment employée à des fins d’écriture ou de correction de codes sources.

Voir aussi : grand modèle de langage, instruction générative.

Équivalent étranger : AI text generation, automatic text generation, text generation.

génération automatique d’image

Domaine : Informatique.

Définition : Opération qui consiste à produire ou à modifier des images, en réponse à une instruction générative, le plus souvent en utilisant un modèle à bruit statistique.

Note : La génération automatique d’image peut être appliquée aux images animées. On parle alors de « génération automatique de vidéo ».

Voir aussi : infox vidéo, instruction générative, modèle à bruit statistique.

Équivalent étranger : AI image generation, automatic image generation, image2image, image-to-image, text2image, text-to-image.

grand modèle de langage

Abréviation : GML.

Domaine : Informatique.

Définition : Modèle génératif qui, à partir de grands volumes de données textuelles, calcule des probabilités des enchaînements de jetons textuels en vue de la génération automatique de texte ou de code informatique.

Note :

1. Les données textuelles du jeu d’entraînement d’un grand modèle de langage sont généralement moissonnées au préalable sur la toile et traitées par des transformeurs.

2. Les grands modèles de langage sont notamment employés dans les dialogueurs, la transcription automatique de la parole et la synthèse vocale.

Voir aussi : dialogueur, génération automatique de texte, jeton textuel, modèle génératif, moissonnage de données, synthèse vocale de texte, transcription automatique de la parole, transformeur.

Équivalent étranger : large language model (LLM).

instruction générative

Forme abrégée : instruction, n.f.

Domaine : Informatique.

Définition : Consigne donnée par un utilisateur à un modèle génératif, généralement formulée en langue naturelle, qui décrit la tâche à accomplir.

Note :

1. L’instruction générative peut prendre la forme d’un texte à compléter, d’une question, d’une consigne à respecter dans la production de la réponse, voire d’un ou de plusieurs exemples de résultats attendus.

2. On trouve aussi le terme « invite », qui est déconseillé dans ce sens.

Voir aussi : génération automatique d’audio, génération automatique de texte, génération automatique d’image, grand modèle de langage, modèle génératif.

Équivalent étranger : prompt.

intelligence artificielle générative

Forme abrégée : IA générative.

Domaine : Informatique.

Définition : Branche de l’intelligence artificielle mettant en œuvre des modèles génératifs, qui vise à produire des contenus textuels, graphiques ou audiovisuels.

Voir aussi : génération automatique d’audio, génération automatique de texte, génération automatique d’image, intelligence artificielle, modèle génératif.

Équivalent étranger : GenAI, generative AI, generative artificial intelligence.

jeton textuel

Domaine : Informatique.

Définition : Donnée élémentaire d’un grand modèle de langage, qui est constituée d’une suite de caractères obtenue par la segmentation automatique d’un texte.

Note :

1. La segmentation en jetons textuels est utilisée aussi bien dans la phase d’apprentissage automatique que dans la phase de traitement d’une instruction générative.

2. Le nombre de jetons textuels sert à mesurer la taille d’un grand modèle de langage ; il permet aussi d’estimer et de facturer le coût de fonctionnement des grands modèles de langage commerciaux.

Voir aussi : apprentissage automatique, grand modèle de langage, instruction générative.

Équivalent étranger : text token, token.

modèle à bruit statistique

Domaine : Informatique-Audiovisuel/Infographie.

Définition : Modèle génératif qui est obtenu par un apprentissage automatique, au cours duquel est éliminé le bruit statistique préalablement ajouté aux données du jeu d’entraînement et qui produit des contenus graphiques ou audio nouveaux.

Note : L’instruction générative donnée à un modèle à bruit statistique peut être une image assortie d’un texte spécifiant par exemple l’application d’un style ou l’ajout d’un élément dans la composition du contenu à produire.

Voir aussi : apprentissage automatique, génération automatique d’audio, génération automatique d’image, instruction générative, modèle génératif.

Équivalent étranger : diffusion model, diffusion probabilistic model, latent diffusion model (LDM), score-based generative model.

modèle génératif

Domaine : Informatique.

Définition : Résultat d’un apprentissage automatique destiné à être appliqué à une tâche de génération de données comparables à celles de son jeu de données d’entraînement.

Note :

1. Un modèle génératif est généralement obtenu par l’application d’un apprentissage supervisé à un modèle préentraîné.

2. Un modèle génératif est notamment utilisé dans la génération automatique de texte, la génération automatique d’image et la génération automatique d’audio.

3. On trouve aussi, dans le langage professionnel, le terme « modèle de fondation », qui est déconseillé.

Voir aussi : apprentissage automatique, apprentissage supervisé, génération automatique d’audio, génération automatique de texte, génération automatique d’image, instruction générative, modèle préentraîné, transformeur.

Équivalent étranger : deep generative model, foundation model, generative model.

modèle préentraîné

Forme développée : modèle d’apprentissage préentraîné.

Domaine : Informatique.

Définition : Résultat d’un apprentissage automatique généraliste réalisé sur un grand volume de données, qui est destiné à être réutilisé dans une grande variété de tâches, généralement à l’issue d’un apprentissage par transfert.

Note : Un modèle préentraîné est accompagné d’une notice.

Voir aussi : apprentissage automatique, apprentissage par transfert, notice de modèle préentraîné.

Équivalent étranger : pretrained model.

notice de modèle préentraîné

Forme développée : notice de modèle d’apprentissage préentraîné.

Domaine : Informatique.

Définition : Ensemble des informations qui accompagnent un modèle préentraîné et qui définissent les caractéristiques de son jeu de données d’entraînement, son paramétrage et le cadre de son utilisation.

Voir aussi : modèle préentraîné.

Équivalent étranger : model card.

transformeur, n.m.

Domaine : Informatique.

Définition : Réseau de neurones artificiels qui réalise un traitement parallèle des données d’entraînement d’un apprentissage autosupervisé afin de développer un modèle génératif.

Note :

1. Le traitement parallèle permet d’accélérer l’apprentissage et ainsi d’exploiter à faible coût des jeux de données hétérogènes, peu ou pas structurées.

2. Le transformeur est notamment utilisé dans la génération automatique de texte, la génération automatique d’image et la génération automatique d’audio.

Voir aussi : génération automatique d’audio, génération automatique de texte, génération automatique d’image, modèle génératif, réseau de neurones artificiels.

Équivalent étranger : transformer.

II. Table d’équivalence

A. Termes étrangers

Terme étranger (1)

Domaine/Sous-domaine

Équivalent français (2)

adversarial machine learning (AML).

Informatique.

apprentissage antagoniste.

AI audio generation, audio generative AI.

Informatique.

génération automatique d’audio.

AI image generation, automatic image generation, image2image, image-to-image, text2image, text-to-image.

Informatique.

génération automatique d’image.

AI text generation, automatic text generation, text generation.

Informatique.

génération automatique de texte.

audio generative AI, AI audio generation.

Informatique.

génération automatique d’audio.

automatic image generation, AI image generation, image2image, image-to-image, text2image, text-to-image.

Informatique.

génération automatique d’image.

automatic text generation, AI text generation, text generation.

Informatique.

génération automatique de texte.

deep generative model, foundation model, generative model.

Informatique.

modèle génératif.

diffusion model, diffusion probabilistic model, latent diffusion model (LDM), score-based generative model.

Informatique-Audiovisuel/Infographie.

modèle à bruit statistique.

foundation model, deep generative model, generative model.

Informatique.

modèle génératif.

GenAI, generative AI, generative artificial intelligence.

Informatique.

intelligence artificielle générative, IA générative.

generative model, deep generative model, foundation model.

Informatique.

modèle génératif.

image2image, AI image generation, automatic image generation, image-to-image, text2image, text-to-image.

Informatique.

génération automatique d’image.

large language model (LLM).

Informatique.

grand modèle de langage (GML).

latent diffusion model (LDM), diffusion model, diffusion probabilistic model, score-based generative model.

Informatique-Audiovisuel/Infographie.

modèle à bruit statistique.

model card.

Informatique.

notice de modèle préentraîné, notice de modèle d’apprentissage préentraîné.

pretrained model.

Informatique.

modèle préentraîné, modèle d’apprentissage préentraîné.

prompt.

Informatique.

instruction générative, instruction, n.f.

score-based generative model, diffusion model, diffusion probabilistic model, latent diffusion model (LDM).

Informatique-Audiovisuel/Infographie.

modèle à bruit statistique.

text2image, AI image generation, automatic image generation, image2image, image-to-image, text-to-image.

Informatique.

génération automatique d’image.

text generation, AI text generation, automatic text generation.

Informatique.

génération automatique de texte.

text-to-image, AI image generation, automatic image generation, image2image, image-to-image, text2image.

Informatique.

génération automatique d’image.

text token, token.

Informatique.

jeton textuel.

transfer learning.

Informatique.

apprentissage par transfert.

transformer.

Informatique.

transformeur, n.m.

(1) Il s’agit de termes anglais, sauf mention contraire.

(2) Les termes en caractères gras sont définis dans la partie I (Termes et définitions).

B. Termes français

Terme français (1)

Domaine/Sous-domaine

Équivalent étranger (2)

apprentissage antagoniste.

Informatique.

adversarial machine learning (AML).

apprentissage par transfert.

Informatique.

transfer learning.

génération automatique d’audio.

Informatique.

AI audio generation, audio generative AI.

génération automatique de texte.

Informatique.

AI text generation, automatic text generation, text generation.

génération automatique d’image.

Informatique.

AI image generation, automatic image generation, image2image, image-to-image, text2image, text-to-image.

grand modèle de langage (GML).

Informatique.

large language model (LLM).

IA générative, intelligence artificielle générative.

Informatique.

GenAI, generative AI, generative artificial intelligence.

instruction générative, instruction, n.f.

Informatique.

prompt.

intelligence artificielle générative, IA générative.

Informatique.

GenAI, generative AI, generative artificial intelligence.

jeton textuel.

Informatique.

text token, token.

modèle à bruit statistique.

Informatique-Audiovisuel/Infographie.

diffusion model, diffusion probabilistic model, latent diffusion model (LDM), score-based generative model.

modèle d’apprentissage préentraîné, modèle préentraîné.

Informatique.

pretrained model.

modèle génératif.

Informatique.

deep generative model, foundation model, generative model.

modèle préentraîné, modèle d’apprentissage préentraîné.

Informatique.

pretrained model.

notice de modèle préentraîné, notice de modèle d’apprentissage préentraîné.

Informatique.

model card.

transformeur, n.m.

Informatique.

transformer.

(1) Les termes en caractères gras sont définis dans la partie I (Termes et définitions).

(2) Il s’agit d’équivalents anglais, sauf mention contraire.