Glossaire IA
Les termes techniques de l'IA souveraine, expliqués simplement
L’intelligence artificielle s’accompagne d’un vocabulaire spécialisé qui peut sembler opaque. Ce glossaire a été rédigé pour vous aider à comprendre la documentation de BrainDup, nos pages Architecture, Développement et Contact, sans avoir besoin d’un diplôme en informatique. Chaque terme est expliqué en français, avec des analogies concrètes quand c’est utile.
Infrastructure & matériel
Les composants physiques et logiciels qui font tourner BrainDup sur votre propre station, sans dépendre du cloud.
GPU
Processeur graphique, initialement conçu pour l’affichage vidéo, mais aujourd’hui indispensable pour l’IA. Contrairement au processeur classique (CPU) qui exécute les tâches une par une, le GPU en traite des milliers simultanément — comme une armée de calculateurs parallèles.
NVIDIA Blackwell
Dernière génération d’architecture GPU signée NVIDIA (2024-2025). Les cartes Blackwell (série RTX 50xx) offrent des performances IA nettement supérieures aux générations précédentes, à consommation électrique réduite.
VRAM
Mémoire dédiée du GPU. Plus il y a de VRAM, plus le GPU peut charger un modèle d’IA volumineux en une seule fois. C’est le facteur limitant principal pour faire tourner des LLM en local.
CUDA / cuDNN
Boîte à outils logicielle fournie par NVIDIA pour exploiter la puissance des GPU. CUDA est le socle général ; cuDNN est sa couche spécialisée pour l’IA et le deep learning.
Driver
Logiciel qui permet au système d’exploitation de communiquer avec un matériel (ici le GPU). Sans le bon driver, le GPU reste inutilisable. BrainDup s’assure que les drivers NVIDIA sont toujours à jour.
Docker
Outil qui emballe une application avec tout ce dont elle a besoin (bibliothèques, configuration) dans un paquet isolé appelé conteneur. Imaginez une boîte hermétique : l’application fonctionne de manière identique partout.
Conteneur
Environnement isolé et léger créé par Docker. Chaque brique de BrainDup (base de données, modèle IA, interface…) tourne dans son propre conteneur, ce qui évite les conflits et simplifie les mises à jour.
Orchestration
Coordination automatique de plusieurs conteneurs qui doivent travailler ensemble. BrainDup utilise Docker Compose pour lancer, arrêter et relier ses différents services en une seule commande.
NGINX
Serveur web très performant utilisé comme point d’entrée unique pour accéder aux services BrainDup. Il répartit le trafic, gère la sécurité HTTPS et protège les services internes.
Reverse proxy
Intermédiaire placé devant vos services web. Il reçoit toutes les requêtes extérieures et les redirige vers le bon service interne, comme un standardiste qui oriente les appels.
HTTPS
Protocole de communication sécurisé sur le web. Le cadenas dans votre navigateur indique que les données échangées sont chiffrées. BrainDup force le HTTPS pour protéger toutes les communications.
Serveur
Ordinateur (ou logiciel) qui fournit des services à d’autres machines. Dans le contexte BrainDup, votre station locale joue le rôle de serveur privé : elle héberge vos modèles IA et vos données.
Local (on-premise)
Se dit d’une infrastructure installée physiquement dans vos locaux, par opposition au cloud. Avec BrainDup, « local » signifie que vos données ne quittent jamais votre bâtiment.
Cloud
Ensemble de serveurs distants (data centers) loués à des tiers (Amazon, Google, Microsoft…). Pratique mais coûteux à long terme, et vos données sont hébergées hors de votre contrôle.
Souveraineté des données
Capacité d’une organisation à conserver le contrôle total sur ses données : où elles sont stockées, qui y accède, sous quelle juridiction. C’est le principe fondateur de BrainDup.
Bases de données & stockage
Comment BrainDup stocke, indexe et retrouve vos documents et connaissances.
Base de données
Système organisé pour stocker et retrouver des informations. Comme un classeur numérique intelligent capable de gérer des millions de fiches et de répondre à des requêtes complexes en une fraction de seconde.
PostgreSQL
Base de données relationnelle open source de référence, utilisée par BrainDup pour stocker les données structurées (utilisateurs, projets, historiques). Fiable, performante et gratuite.
Milvus
Base de données spécialisée dans le stockage de vecteurs (embeddings). Elle permet à BrainDup de retrouver les documents les plus pertinents en comparant leur « empreinte sémantique » plutôt que des mots-clés.
Base vectorielle
Type de base de données qui stocke des représentations mathématiques (vecteurs) du sens des textes. Elle permet de trouver des documents similaires même s’ils n’utilisent pas les mêmes mots.
Vecteur (embedding)
Liste de nombres représentant le « sens » d’un texte dans un espace mathématique. Deux textes au sens proche auront des vecteurs proches, même s’ils utilisent des mots différents.
Embedding
Procédé de transformation d’un texte (ou d’une image) en vecteur numérique. C’est la première étape du RAG : chaque document est converti en embedding pour être stocké dans la base vectorielle.
Recherche sémantique
Recherche basée sur le sens plutôt que sur les mots exacts. Chercher « rémunération des salariés » trouvera aussi les documents parlant de « paie » ou de « compensation ».
Neo4j
Base de données orientée graphe utilisée par BrainDup pour cartographier les relations entre concepts. Elle permet de naviguer dans les connaissances comme sur une carte, en suivant les liens entre les idées.
Graphe de connaissances
Représentation des connaissances sous forme de réseau : des nœuds (concepts) reliés par des arêtes (relations). Permet à l’IA de raisonner en contexte plutôt que de simplement chercher des mots.
MinIO
Serveur de stockage de fichiers open source, compatible avec le standard S3. BrainDup l’utilise pour stocker les documents volumineux (PDF, images, vidéos) en local, sans passer par Amazon.
S3
Standard de stockage de fichiers inventé par Amazon (Simple Storage Service). MinIO parle le même « langage » que S3, ce qui permet de bénéficier de l’écosystème S3 en restant en local.
Nextcloud
Alternative open source à Google Drive ou Dropbox. Permet de synchroniser, partager et collaborer sur des fichiers, le tout hébergé sur votre propre infrastructure.
Collabora
Suite bureautique en ligne (traitement de texte, tableur, présentation) intégrée à Nextcloud. Équivalent local de Google Docs, vos documents restent chez vous.
Intelligence artificielle & modèles de langage
Les concepts clés de l’IA et des modèles de langage au cœur de BrainDup.
Intelligence artificielle (IA)
Ensemble de techniques permettant à une machine d’imiter des capacités humaines : comprendre un texte, analyser une image, résumer un document. BrainDup déploie l’IA en local pour protéger vos données.
Modèle (d’IA)
Programme entraîné sur de grandes quantités de données pour effectuer une tâche précise (générer du texte, traduire, classer…). C’est le « cerveau » de l’IA, téléchargé et exécuté sur votre station.
LLM
Large Language Model — modèle de langage de grande taille, capable de comprendre et générer du texte en langage naturel. GPT, Mistral, Qwen et Claude sont des exemples de LLM.
Inférence
Phase où le modèle IA produit une réponse à partir d’une question. C’est le moment où le « cerveau » réfléchit. Avec BrainDup, l’inférence se fait sur votre GPU, pas sur un serveur distant.
Paramètres d’un modèle
Valeurs numériques ajustées pendant l’entraînement qui déterminent le comportement du modèle. Un modèle à 70 milliards de paramètres est plus puissant (mais plus gourmand en VRAM) qu’un modèle à 7 milliards.
Mistral
Entreprise française d’IA créant des LLM open source performants. Leurs modèles sont utilisés dans BrainDup car ils sont souverains, gratuits et optimisés pour le français.
Qwen
Famille de modèles IA open source développée par Alibaba. Offre d’excellentes performances en traitement de texte et de code, utilisable librement en local via BrainDup.
Claude
Modèle IA développé par Anthropic, réputé pour sa précision et son respect des consignes. Accessible via API, il peut être intégré en complément des modèles locaux pour des tâches nécessitant une puissance supérieure.
ChatGPT / GPT
Modèles IA d’OpenAI, les plus connus du grand public. Puissants mais hébergés exclusivement sur les serveurs d’OpenAI (cloud américain) — vos données leur sont envoyées à chaque requête.
Gemini
Modèle IA de Google. Comme GPT, il est performant mais fonctionne uniquement dans le cloud Google, ce qui pose les mêmes problèmes de souveraineté et de coût récurrent.
Ollama
Outil open source qui simplifie le téléchargement et l’exécution de modèles IA sur votre propre machine. BrainDup l’utilise pour gérer les modèles locaux avec une seule commande.
Modèle vision / VLM
Modèle capable de comprendre à la fois du texte et des images. Utile pour analyser des documents scannés, des photos ou des schémas techniques sans intervention humaine.
OCR
Reconnaissance optique de caractères — technologie qui convertit une image de texte (scan, photo) en texte éditable. BrainDup combine OCR et IA pour extraire le contenu de n’importe quel document.
Hallucination
Quand un modèle IA invente une information fausse mais la présente avec assurance. Le RAG utilisé par BrainDup réduit drastiquement ce risque en ancrant les réponses dans vos documents réels.
RAG
Retrieval-Augmented Generation — technique qui consiste à chercher d’abord les documents pertinents dans votre base, puis à les fournir au modèle IA pour qu’il réponde en s’appuyant sur des sources vérifiées. C’est le cœur de BrainDup.
Fine-tuning
Réentraînement partiel d’un modèle IA sur vos propres données pour le spécialiser. Comme former un expert généraliste à votre métier spécifique.
Prompt
Instruction ou question que vous soumettez à un modèle IA. La qualité du prompt influence directement la qualité de la réponse — c’est l’art de poser la bonne question.
Token
Unité de base du texte pour un LLM. Un token représente environ 3/4 d’un mot en français. Les modèles facturent et mesurent leurs capacités en nombre de tokens traités.
Contexte
Quantité de texte qu’un modèle peut prendre en compte simultanément pour formuler sa réponse. Un contexte large (128k tokens) permet d’analyser des documents entiers d’un coup.
Open source
Logiciel dont le code est public, gratuit et modifiable par tous. BrainDup privilégie les briques open source pour garantir transparence, auditabilité et indépendance vis-à-vis des éditeurs.
Hugging Face
Plateforme communautaire où des milliers de modèles IA open source sont partagés librement. C’est le « GitHub de l’IA » : BrainDup y télécharge les modèles pour les exécuter en local.
Développement logiciel & code
Les outils et pratiques de développement qui garantissent la qualité et la fiabilité de BrainDup.
Python
Langage de programmation de référence pour l’IA et le traitement de données. Simple, lisible et doté d’un écosystème immense, c’est le langage principal de BrainDup.
Code
Instructions écrites dans un langage de programmation pour dire à l’ordinateur quoi faire. Le code source de BrainDup est l’ensemble des instructions qui font fonctionner la plateforme.
FastAPI
Framework Python moderne pour créer des API web rapides et documentées automatiquement. BrainDup l’utilise pour exposer ses services IA sous forme d’API REST.
API
Interface de programmation — contrat standardisé permettant à deux logiciels de communiquer entre eux. Comme une prise électrique normalisée : n’importe quel appareil compatible peut s’y brancher.
Endpoint
Adresse précise d’une API où envoyer une requête pour obtenir un service spécifique. Par exemple, un endpoint de BrainDup reçoit un document et renvoie son résumé.
JSON
Format universel d’échange de données entre applications, lisible par les humains et les machines. C’est le « langage commun » qu’utilisent les API pour s’échanger des informations.
Pipeline
Chaîne d’étapes automatisées exécutées dans un ordre précis. Dans BrainDup, un pipeline RAG enchaîne : réception du document → découpage → embedding → stockage → indexation.
Test unitaire
Vérification automatisée qu’un petit morceau de code (une fonction) fonctionne correctement, pris isolément. Comme tester chaque pièce d’un moteur séparément avant l’assemblage.
Test d’intégration
Vérification que plusieurs composants fonctionnent correctement ensemble. Après avoir testé chaque pièce séparément, on vérifie que le moteur assemblé tourne bien.
Régression
Bug introduit involontairement en modifiant du code existant. Un test de régression vérifie que les corrections ou ajouts n’ont pas cassé ce qui fonctionnait déjà.
Bug
Erreur dans un programme qui provoque un comportement inattendu. Détecter et corriger les bugs (déboguer) est une activité quotidienne du développement logiciel.
Framework
Cadre de développement fournissant une structure et des outils prêts à l’emploi. Plutôt que de construire une maison brique par brique, on part d’une ossature solide.
Bibliothèque
Collection de fonctions réutilisables écrites par d’autres développeurs. Comme emprunter un livre plutôt que de le réécrire : on gagne du temps en réutilisant du code éprouvé.
Gestion de versions & publication
Comment le code de BrainDup est suivi, validé et publié de manière fiable.
Git
Système de gestion de versions qui enregistre chaque modification du code source, comme un historique complet avec possibilité de revenir en arrière à tout moment.
GitHub
Plateforme en ligne hébergeant des dépôts Git. Elle facilite la collaboration entre développeurs et offre des outils de revue de code, d’automatisation et de gestion de projet.
Commit
Enregistrement d’un ensemble de modifications dans Git, accompagné d’un message descriptif. C’est comme sauvegarder une version nommée de votre travail.
Branche
Copie parallèle du code permettant de développer une fonctionnalité sans toucher à la version stable. Une fois la fonctionnalité terminée, la branche est fusionnée.
Pull Request
Demande formelle de fusion d’une branche dans le code principal. Elle permet à d’autres développeurs de relire et valider les modifications avant intégration.
CI/CD
Intégration continue / déploiement continu — automatisation des tests et de la mise en production. Chaque modification est testée automatiquement et, si tout est vert, déployée sans intervention humaine.
Release / Version
Publication officielle d’une version du logiciel, identifiée par un numéro (ex. v2.1.0). Chaque release contient un ensemble de nouvelles fonctionnalités et corrections de bugs.
Orchestration, workflows & intégration
Les outils qui automatisent et connectent les différents services de BrainDup.
Workflow
Séquence d’étapes automatisées déclenchées par un événement. Par exemple : un document arrive → il est analysé par l’IA → un résumé est créé → une notification est envoyée.
n8n
Plateforme d’automatisation open source utilisée par BrainDup pour créer des workflows visuellement, sans coder. Alternative souveraine à Zapier ou Make, hébergée en local.
Nœud
Dans n8n, chaque étape d’un workflow est un nœud : réception d’un fichier, appel à l’IA, envoi d’e-mail… Les nœuds se connectent visuellement pour former le flux.
Webhook
Mécanisme permettant à une application d’envoyer automatiquement une notification à une autre lorsqu’un événement se produit. Comme une sonnette qui prévient n8n qu’un nouveau document est arrivé.
Batch
Traitement groupé de plusieurs éléments en une seule opération. Au lieu de traiter 100 documents un par un, on les traite par lots (batchs) pour plus d’efficacité.
Retry
Mécanisme de réessai automatique en cas d’échec. Si une étape du workflow échoue (réseau instable, service temporairement indisponible), BrainDup retente automatiquement après un délai.
Fallback
Solution de repli activée quand la solution principale échoue. Par exemple, si le modèle IA principal est surchargé, BrainDup bascule automatiquement sur un modèle alternatif.
Méthodologie & gouvernance projet
Les méthodes et cadres réglementaires qui structurent le développement de BrainDup.
BMAD
Méthode de gestion de projet IA utilisée pour structurer le développement de BrainDup. Elle définit les rôles, les livrables et les jalons pour chaque phase du projet.
Story
Description courte d’une fonctionnalité du point de vue de l’utilisateur. Exemple : « En tant que juriste, je veux rechercher une jurisprudence par thème. » Les stories guident le développement.
Sprint
Période de travail courte et fixée (généralement 1 à 2 semaines) pendant laquelle l’équipe réalise un ensemble de stories. À la fin du sprint, une version fonctionnelle est livrée.
Backlog
Liste ordonnée de toutes les fonctionnalités, améliorations et corrections à réaliser. Le backlog est vivant : les priorités évoluent en fonction des retours utilisateurs et des objectifs métier.
PRD
Product Requirements Document — document décrivant précisément ce qu’un produit doit faire, pour qui et pourquoi. C’est la feuille de route fonctionnelle de BrainDup.
RGPD
Règlement Général sur la Protection des Données — loi européenne imposant des règles strictes sur la collecte et le traitement des données personnelles. BrainDup est conçu pour être nativement conforme.
EU AI Act
Règlement européen sur l’intelligence artificielle, entré en vigueur en 2024. Il classe les systèmes IA par niveau de risque et impose des obligations de transparence et d’audit.
Dette technique
Accumulation de raccourcis et de compromis techniques qui ralentissent le développement futur. Comme un crédit : on gagne du temps aujourd’hui, mais on paie des intérêts demain sous forme de bugs et de maintenance.
Index alphabétique
Passez à l'action
30 minutes pour évaluer le potentiel de l'IA souveraine dans votre organisation. Sans engagement.
Audit souveraineté gratuit