Skip to content
| 2 min read

RAG local : interrogez vos documents sans cloud

Comment le RAG (Retrieval-Augmented Generation) fonctionne en local avec Lockal pour interroger vos PDF, notes et code source en toute confidentialite.

Qu’est-ce que le RAG ?

Le RAG (Retrieval-Augmented Generation) est une technique qui permet a un LLM de repondre en s’appuyant sur vos propres documents. Au lieu de se fier uniquement a son entrainement, le modele recherche d’abord les passages pertinents dans votre base documentaire, puis formule sa reponse en les citant.

Pourquoi le RAG en local change tout

Les solutions RAG cloud (comme les GPTs custom d’OpenAI) necessitent d’uploader vos documents sur des serveurs tiers. Pour des documents confidentiels — contrats, dossiers medicaux, code proprietaire — c’est souvent inacceptable.

Avec Lockal, toute la chaine RAG reste sur votre machine :

  1. Indexation : vos documents sont decoupes et vectorises localement
  2. Stockage : les embeddings sont sauvegardes sur votre disque
  3. Recherche : la recherche semantique s’execute en local
  4. Generation : le LLM produit sa reponse sans connexion internet

Comment ca marche dans Lockal

Ajouter des documents

Glissez un dossier dans Lockal ou utilisez le panneau Sources :

  • PDF : rapports, contrats, manuels
  • Markdown : notes, documentation, wiki
  • Code source : repositories complets
  • Texte brut : emails exportes, transcriptions

L’indexation

Lockal decoupe vos documents en segments (chunks) et genere des vecteurs d’embeddings via un modele local leger. L’indexation d’un dossier de 1000 documents prend generalement moins de 2 minutes sur Apple Silicon.

Poser des questions

Une fois l’indexation terminee, posez vos questions en langage naturel :

  • “Quelles sont les clauses de non-concurrence dans le contrat Dupont ?”
  • “Resume les changements de l’API dans les derniers commits”
  • “Quels sont les risques identifies dans le rapport d’audit Q1 ?”

Lockal affiche les sources utilisees pour chaque reponse, avec les passages pertinents surlignés.

Performances

MetriqueValeur typique (M3 Pro)
Indexation~500 pages/min
Recherche< 100ms
Generation avec contexte2-5 secondes
RAM supplementaire1-2 Go

Cas d’usage

  • Juridique : interroger des centaines de contrats sans risque de fuite
  • Developpement : comprendre une codebase inconnue rapidement
  • Recherche : naviguer dans une base d’articles scientifiques
  • Support : retrouver la procedure exacte dans une documentation technique

Limites actuelles

  • Les documents scannes (images) necessitent un OCR prealable
  • Les tres gros corpus (100k+ documents) peuvent necessiter 64 Go de RAM
  • Les embeddings ne sont pas partageables entre machines (pour l’instant)

Essayez le RAG local avec Lockal : telechargez sur lockal.ai et glissez votre premier dossier.

Share: