← Retour au plateau

Installer un LLM en local — Mode Privé

Le mode Privé du chatbot envoie vos questions directement à un modèle hébergé chez vous (ou via votre propre clé API). Aucune donnée ne transite par notre serveur. Voici deux options gratuites et hors ligne.

L'objectif éditorial reste la neutralité. En mode Privé, c'est votre LLM qui formule la réponse à partir des données du site. Choisissez un modèle généraliste et évitez les modèles « instruct » trop opinés.

Option A — Ollama (recommandé, open source)

  1. Téléchargez Ollama pour Windows / macOS / Linux : ollama.com/download
  2. Lancez Ollama (icône en barre d'état). Le serveur tourne sur http://localhost:11434.
  3. Ouvrez un terminal (PowerShell sous Windows) et tirez un modèle :
    ollama run llama3.1
    # ou plus léger :
    ollama run qwen2.5:7b
  4. Revenez sur ce site, ouvrez le chat, cliquez Privé, sélectionnez Ollama, base URL http://localhost:11434/v1, modèle llama3.1 (ou celui que vous avez tiré).

Option B — LM Studio (interface graphique)

  1. Téléchargez LM Studio : lmstudio.ai
  2. Onglet Discover → cherchez par exemple Llama-3.1-8B-Instruct ou Mistral-7B-Instruct-v0.3, cliquez Download.
  3. Onglet DeveloperStart Server. Le serveur écoute par défaut sur http://localhost:1234.
  4. Sur le site : PrivéLM Studio → URL http://localhost:1234/v1 → choisissez le modèle chargé.

Option C — Clé API d'un fournisseur

Vous pouvez aussi coller votre clé API personnelle (OpenAI, Anthropic, Mistral, Gemini, Grok, OpenRouter…). La clé est stockée uniquement dans votre navigateur (localStorage) et envoyée au backend uniquement dans l'en-tête X-LLM-Key au moment de la requête (jamais persistée).

Conseils pour des réponses neutres

Pas de connaissance externe : le LLM ne reçoit que les passages sélectionnés du site. Il ne peut pas inventer un programme qui n'y est pas — sauf à halluciner. Toujours croiser avec les sources liées.

Mise à jour : avril 2026 — versions testées : Ollama 0.5+, LM Studio 0.3+.