Glossaire IA

Les termes techniques de l'IA souveraine, expliqués simplement

L’intelligence artificielle s’accompagne d’un vocabulaire spécialisé qui peut sembler opaque. Ce glossaire a été rédigé pour vous aider à comprendre la documentation de BrainDup, nos pages Architecture, Développement et Contact, sans avoir besoin d’un diplôme en informatique. Chaque terme est expliqué en français, avec des analogies concrètes quand c’est utile.

Infrastructure & matériel

Les composants physiques et logiciels qui font tourner BrainDup sur votre propre station, sans dépendre du cloud.

GPU

Processeur graphique, initialement conçu pour l’affichage vidéo, mais aujourd’hui indispensable pour l’IA. Contrairement au processeur classique (CPU) qui exécute les tâches une par une, le GPU en traite des milliers simultanément — comme une armée de calculateurs parallèles.

NVIDIA Blackwell

Dernière génération d’architecture GPU signée NVIDIA (2024-2025). Les cartes Blackwell (série RTX 50xx) offrent des performances IA nettement supérieures aux générations précédentes, à consommation électrique réduite.

VRAM

Mémoire dédiée du GPU. Plus il y a de VRAM, plus le GPU peut charger un modèle d’IA volumineux en une seule fois. C’est le facteur limitant principal pour faire tourner des LLM en local.

CUDA / cuDNN

Boîte à outils logicielle fournie par NVIDIA pour exploiter la puissance des GPU. CUDA est le socle général ; cuDNN est sa couche spécialisée pour l’IA et le deep learning.

Driver

Logiciel qui permet au système d’exploitation de communiquer avec un matériel (ici le GPU). Sans le bon driver, le GPU reste inutilisable. BrainDup s’assure que les drivers NVIDIA sont toujours à jour.

Docker

Outil qui emballe une application avec tout ce dont elle a besoin (bibliothèques, configuration) dans un paquet isolé appelé conteneur. Imaginez une boîte hermétique : l’application fonctionne de manière identique partout.

Conteneur

Environnement isolé et léger créé par Docker. Chaque brique de BrainDup (base de données, modèle IA, interface…) tourne dans son propre conteneur, ce qui évite les conflits et simplifie les mises à jour.

Orchestration

Coordination automatique de plusieurs conteneurs qui doivent travailler ensemble. BrainDup utilise Docker Compose pour lancer, arrêter et relier ses différents services en une seule commande.

NGINX

Serveur web très performant utilisé comme point d’entrée unique pour accéder aux services BrainDup. Il répartit le trafic, gère la sécurité HTTPS et protège les services internes.

Reverse proxy

Intermédiaire placé devant vos services web. Il reçoit toutes les requêtes extérieures et les redirige vers le bon service interne, comme un standardiste qui oriente les appels.

HTTPS

Protocole de communication sécurisé sur le web. Le cadenas dans votre navigateur indique que les données échangées sont chiffrées. BrainDup force le HTTPS pour protéger toutes les communications.

Serveur

Ordinateur (ou logiciel) qui fournit des services à d’autres machines. Dans le contexte BrainDup, votre station locale joue le rôle de serveur privé : elle héberge vos modèles IA et vos données.

Local (on-premise)

Se dit d’une infrastructure installée physiquement dans vos locaux, par opposition au cloud. Avec BrainDup, « local » signifie que vos données ne quittent jamais votre bâtiment.

Cloud

Ensemble de serveurs distants (data centers) loués à des tiers (Amazon, Google, Microsoft…). Pratique mais coûteux à long terme, et vos données sont hébergées hors de votre contrôle.

Souveraineté des données

Capacité d’une organisation à conserver le contrôle total sur ses données : où elles sont stockées, qui y accède, sous quelle juridiction. C’est le principe fondateur de BrainDup.

Bases de données & stockage

Comment BrainDup stocke, indexe et retrouve vos documents et connaissances.

Base de données

Système organisé pour stocker et retrouver des informations. Comme un classeur numérique intelligent capable de gérer des millions de fiches et de répondre à des requêtes complexes en une fraction de seconde.

PostgreSQL

Base de données relationnelle open source de référence, utilisée par BrainDup pour stocker les données structurées (utilisateurs, projets, historiques). Fiable, performante et gratuite.

Milvus

Base de données spécialisée dans le stockage de vecteurs (embeddings). Elle permet à BrainDup de retrouver les documents les plus pertinents en comparant leur « empreinte sémantique » plutôt que des mots-clés.

Base vectorielle

Type de base de données qui stocke des représentations mathématiques (vecteurs) du sens des textes. Elle permet de trouver des documents similaires même s’ils n’utilisent pas les mêmes mots.

Vecteur (embedding)

Liste de nombres représentant le « sens » d’un texte dans un espace mathématique. Deux textes au sens proche auront des vecteurs proches, même s’ils utilisent des mots différents.

Embedding

Procédé de transformation d’un texte (ou d’une image) en vecteur numérique. C’est la première étape du RAG : chaque document est converti en embedding pour être stocké dans la base vectorielle.

Recherche sémantique

Recherche basée sur le sens plutôt que sur les mots exacts. Chercher « rémunération des salariés » trouvera aussi les documents parlant de « paie » ou de « compensation ».

Neo4j

Base de données orientée graphe utilisée par BrainDup pour cartographier les relations entre concepts. Elle permet de naviguer dans les connaissances comme sur une carte, en suivant les liens entre les idées.

Graphe de connaissances

Représentation des connaissances sous forme de réseau : des nœuds (concepts) reliés par des arêtes (relations). Permet à l’IA de raisonner en contexte plutôt que de simplement chercher des mots.

MinIO

Serveur de stockage de fichiers open source, compatible avec le standard S3. BrainDup l’utilise pour stocker les documents volumineux (PDF, images, vidéos) en local, sans passer par Amazon.

S3

Standard de stockage de fichiers inventé par Amazon (Simple Storage Service). MinIO parle le même « langage » que S3, ce qui permet de bénéficier de l’écosystème S3 en restant en local.

Nextcloud

Alternative open source à Google Drive ou Dropbox. Permet de synchroniser, partager et collaborer sur des fichiers, le tout hébergé sur votre propre infrastructure.

Collabora

Suite bureautique en ligne (traitement de texte, tableur, présentation) intégrée à Nextcloud. Équivalent local de Google Docs, vos documents restent chez vous.

Intelligence artificielle & modèles de langage

Les concepts clés de l’IA et des modèles de langage au cœur de BrainDup.

Intelligence artificielle (IA)

Ensemble de techniques permettant à une machine d’imiter des capacités humaines : comprendre un texte, analyser une image, résumer un document. BrainDup déploie l’IA en local pour protéger vos données.

Modèle (d’IA)

Programme entraîné sur de grandes quantités de données pour effectuer une tâche précise (générer du texte, traduire, classer…). C’est le « cerveau » de l’IA, téléchargé et exécuté sur votre station.

LLM

Large Language Model — modèle de langage de grande taille, capable de comprendre et générer du texte en langage naturel. GPT, Mistral, Qwen et Claude sont des exemples de LLM.

Inférence

Phase où le modèle IA produit une réponse à partir d’une question. C’est le moment où le « cerveau » réfléchit. Avec BrainDup, l’inférence se fait sur votre GPU, pas sur un serveur distant.

Paramètres d’un modèle

Valeurs numériques ajustées pendant l’entraînement qui déterminent le comportement du modèle. Un modèle à 70 milliards de paramètres est plus puissant (mais plus gourmand en VRAM) qu’un modèle à 7 milliards.

Mistral

Entreprise française d’IA créant des LLM open source performants. Leurs modèles sont utilisés dans BrainDup car ils sont souverains, gratuits et optimisés pour le français.

Qwen

Famille de modèles IA open source développée par Alibaba. Offre d’excellentes performances en traitement de texte et de code, utilisable librement en local via BrainDup.

Claude

Modèle IA développé par Anthropic, réputé pour sa précision et son respect des consignes. Accessible via API, il peut être intégré en complément des modèles locaux pour des tâches nécessitant une puissance supérieure.

ChatGPT / GPT

Modèles IA d’OpenAI, les plus connus du grand public. Puissants mais hébergés exclusivement sur les serveurs d’OpenAI (cloud américain) — vos données leur sont envoyées à chaque requête.

Gemini

Modèle IA de Google. Comme GPT, il est performant mais fonctionne uniquement dans le cloud Google, ce qui pose les mêmes problèmes de souveraineté et de coût récurrent.

Ollama

Outil open source qui simplifie le téléchargement et l’exécution de modèles IA sur votre propre machine. BrainDup l’utilise pour gérer les modèles locaux avec une seule commande.

Modèle vision / VLM

Modèle capable de comprendre à la fois du texte et des images. Utile pour analyser des documents scannés, des photos ou des schémas techniques sans intervention humaine.

OCR

Reconnaissance optique de caractères — technologie qui convertit une image de texte (scan, photo) en texte éditable. BrainDup combine OCR et IA pour extraire le contenu de n’importe quel document.

Hallucination

Quand un modèle IA invente une information fausse mais la présente avec assurance. Le RAG utilisé par BrainDup réduit drastiquement ce risque en ancrant les réponses dans vos documents réels.

RAG

Retrieval-Augmented Generation — technique qui consiste à chercher d’abord les documents pertinents dans votre base, puis à les fournir au modèle IA pour qu’il réponde en s’appuyant sur des sources vérifiées. C’est le cœur de BrainDup.

Fine-tuning

Réentraînement partiel d’un modèle IA sur vos propres données pour le spécialiser. Comme former un expert généraliste à votre métier spécifique.

Prompt

Instruction ou question que vous soumettez à un modèle IA. La qualité du prompt influence directement la qualité de la réponse — c’est l’art de poser la bonne question.

Token

Unité de base du texte pour un LLM. Un token représente environ 3/4 d’un mot en français. Les modèles facturent et mesurent leurs capacités en nombre de tokens traités.

Contexte

Quantité de texte qu’un modèle peut prendre en compte simultanément pour formuler sa réponse. Un contexte large (128k tokens) permet d’analyser des documents entiers d’un coup.

Open source

Logiciel dont le code est public, gratuit et modifiable par tous. BrainDup privilégie les briques open source pour garantir transparence, auditabilité et indépendance vis-à-vis des éditeurs.

Hugging Face

Plateforme communautaire où des milliers de modèles IA open source sont partagés librement. C’est le « GitHub de l’IA » : BrainDup y télécharge les modèles pour les exécuter en local.

Développement logiciel & code

Les outils et pratiques de développement qui garantissent la qualité et la fiabilité de BrainDup.

Python

Langage de programmation de référence pour l’IA et le traitement de données. Simple, lisible et doté d’un écosystème immense, c’est le langage principal de BrainDup.

Code

Instructions écrites dans un langage de programmation pour dire à l’ordinateur quoi faire. Le code source de BrainDup est l’ensemble des instructions qui font fonctionner la plateforme.

FastAPI

Framework Python moderne pour créer des API web rapides et documentées automatiquement. BrainDup l’utilise pour exposer ses services IA sous forme d’API REST.

API

Interface de programmation — contrat standardisé permettant à deux logiciels de communiquer entre eux. Comme une prise électrique normalisée : n’importe quel appareil compatible peut s’y brancher.

Endpoint

Adresse précise d’une API où envoyer une requête pour obtenir un service spécifique. Par exemple, un endpoint de BrainDup reçoit un document et renvoie son résumé.

JSON

Format universel d’échange de données entre applications, lisible par les humains et les machines. C’est le « langage commun » qu’utilisent les API pour s’échanger des informations.

Pipeline

Chaîne d’étapes automatisées exécutées dans un ordre précis. Dans BrainDup, un pipeline RAG enchaîne : réception du document → découpage → embedding → stockage → indexation.

Test unitaire

Vérification automatisée qu’un petit morceau de code (une fonction) fonctionne correctement, pris isolément. Comme tester chaque pièce d’un moteur séparément avant l’assemblage.

Test d’intégration

Vérification que plusieurs composants fonctionnent correctement ensemble. Après avoir testé chaque pièce séparément, on vérifie que le moteur assemblé tourne bien.

Régression

Bug introduit involontairement en modifiant du code existant. Un test de régression vérifie que les corrections ou ajouts n’ont pas cassé ce qui fonctionnait déjà.

Bug

Erreur dans un programme qui provoque un comportement inattendu. Détecter et corriger les bugs (déboguer) est une activité quotidienne du développement logiciel.

Framework

Cadre de développement fournissant une structure et des outils prêts à l’emploi. Plutôt que de construire une maison brique par brique, on part d’une ossature solide.

Bibliothèque

Collection de fonctions réutilisables écrites par d’autres développeurs. Comme emprunter un livre plutôt que de le réécrire : on gagne du temps en réutilisant du code éprouvé.

Gestion de versions & publication

Comment le code de BrainDup est suivi, validé et publié de manière fiable.

Git

Système de gestion de versions qui enregistre chaque modification du code source, comme un historique complet avec possibilité de revenir en arrière à tout moment.

GitHub

Plateforme en ligne hébergeant des dépôts Git. Elle facilite la collaboration entre développeurs et offre des outils de revue de code, d’automatisation et de gestion de projet.

Commit

Enregistrement d’un ensemble de modifications dans Git, accompagné d’un message descriptif. C’est comme sauvegarder une version nommée de votre travail.

Branche

Copie parallèle du code permettant de développer une fonctionnalité sans toucher à la version stable. Une fois la fonctionnalité terminée, la branche est fusionnée.

Pull Request

Demande formelle de fusion d’une branche dans le code principal. Elle permet à d’autres développeurs de relire et valider les modifications avant intégration.

CI/CD

Intégration continue / déploiement continu — automatisation des tests et de la mise en production. Chaque modification est testée automatiquement et, si tout est vert, déployée sans intervention humaine.

Release / Version

Publication officielle d’une version du logiciel, identifiée par un numéro (ex. v2.1.0). Chaque release contient un ensemble de nouvelles fonctionnalités et corrections de bugs.

Orchestration, workflows & intégration

Les outils qui automatisent et connectent les différents services de BrainDup.

Workflow

Séquence d’étapes automatisées déclenchées par un événement. Par exemple : un document arrive → il est analysé par l’IA → un résumé est créé → une notification est envoyée.

n8n

Plateforme d’automatisation open source utilisée par BrainDup pour créer des workflows visuellement, sans coder. Alternative souveraine à Zapier ou Make, hébergée en local.

Nœud

Dans n8n, chaque étape d’un workflow est un nœud : réception d’un fichier, appel à l’IA, envoi d’e-mail… Les nœuds se connectent visuellement pour former le flux.

Webhook

Mécanisme permettant à une application d’envoyer automatiquement une notification à une autre lorsqu’un événement se produit. Comme une sonnette qui prévient n8n qu’un nouveau document est arrivé.

Batch

Traitement groupé de plusieurs éléments en une seule opération. Au lieu de traiter 100 documents un par un, on les traite par lots (batchs) pour plus d’efficacité.

Retry

Mécanisme de réessai automatique en cas d’échec. Si une étape du workflow échoue (réseau instable, service temporairement indisponible), BrainDup retente automatiquement après un délai.

Fallback

Solution de repli activée quand la solution principale échoue. Par exemple, si le modèle IA principal est surchargé, BrainDup bascule automatiquement sur un modèle alternatif.

Méthodologie & gouvernance projet

Les méthodes et cadres réglementaires qui structurent le développement de BrainDup.

BMAD

Méthode de gestion de projet IA utilisée pour structurer le développement de BrainDup. Elle définit les rôles, les livrables et les jalons pour chaque phase du projet.

Story

Description courte d’une fonctionnalité du point de vue de l’utilisateur. Exemple : « En tant que juriste, je veux rechercher une jurisprudence par thème. » Les stories guident le développement.

Sprint

Période de travail courte et fixée (généralement 1 à 2 semaines) pendant laquelle l’équipe réalise un ensemble de stories. À la fin du sprint, une version fonctionnelle est livrée.

Backlog

Liste ordonnée de toutes les fonctionnalités, améliorations et corrections à réaliser. Le backlog est vivant : les priorités évoluent en fonction des retours utilisateurs et des objectifs métier.

PRD

Product Requirements Document — document décrivant précisément ce qu’un produit doit faire, pour qui et pourquoi. C’est la feuille de route fonctionnelle de BrainDup.

RGPD

Règlement Général sur la Protection des Données — loi européenne imposant des règles strictes sur la collecte et le traitement des données personnelles. BrainDup est conçu pour être nativement conforme.

EU AI Act

Règlement européen sur l’intelligence artificielle, entré en vigueur en 2024. Il classe les systèmes IA par niveau de risque et impose des obligations de transparence et d’audit.

Dette technique

Accumulation de raccourcis et de compromis techniques qui ralentissent le développement futur. Comme un crédit : on gagne du temps aujourd’hui, mais on paie des intérêts demain sous forme de bugs et de maintenance.

Passez à l'action

30 minutes pour évaluer le potentiel de l'IA souveraine dans votre organisation. Sans engagement.

Audit souveraineté gratuit