Brique 03 — approfondissement
Assistant de connaissances RAG — indépendant de la plateforme, hébergé UE.
Quand Microsoft Copilot ne convient pas — parce que les sources sont hors M365, parce que l'hébergement UE est impératif, ou parce que la licence par utilisateur ne tient pas économiquement — nous construisons un assistant RAG propre. Document Chat sur vos contenus, sur infrastructure européenne.
Ce que signifie RAG
Retrieval-Augmented Generation (RAG) est l'architecture établie pour les assistants de connaissances IA : vos documents sont indexés dans une base vectorielle, un modèle d'embedding produit des représentations sémantiques, et un Large Language Model formule la réponse à partir des preuves trouvées. Contrairement aux LLM « nus », un système RAG répond sur vos données — avec citation de la source et sans hallucination dans le vide.
LLMs hébergés UE
Nous nous appuyons sur Mistral et Aleph Alpha comme fournisseurs LLM européens, avec hébergement UE et engagements RGPD clairs. Les deux ont largement comblé l'écart de qualité avec OpenAI ces 24 derniers mois — pour les réponses de savoir en français et en allemand, ils sont à niveau.
Mise en place Vector DB
Nous utilisons selon les exigences Qdrant, Weaviate ou pgvector (extension PostgreSQL). Stratégie d'embedding, chunking, re-ranking et partitionnement d'index par cercle de permissions font partie du package pilote.
Sources hybrides
Un assistant RAG peut intégrer des sources que Microsoft Copilot n'atteint pas : file shares, Confluence, bases SQL anciennes, PDF scannés (avec OCR), bases métier. C'est ce qui en fait le bon choix quand votre savoir est dispersé.
Métriques de qualité
Chaque pilote RAG chez nous fournit dès le départ des métriques : recall (quels documents pertinents sont trouvés ?), precision (combien des documents trouvés sont réellement pertinents ?) et taux d'hallucination (à quelle fréquence le LLM formule-t-il des réponses sans preuve ?). Sans ces métriques, un assistant RAG reste une impression — nous le rendons mesurable.