Voice Bot RAG avec
n8n + ElevenLabs + Qdrant
Créez un agent vocal qui répond depuis vos propres documents — FAQ, menu, catalogue produit, base de connaissances — sans écrire une seule ligne de code.
Ce que vous allez construire
Un agent vocal disponible 24h/24 sur votre site, capable de répondre à toutes les questions sur votre activité en puisant dans vos documents Google Drive.
Pipeline d'ingestion (1 fois)
Pipeline de conversation (temps réel)
Prérequis
n8n
Cloud ou self-hosted
ElevenLabs
Plan Creator ou +
Qdrant Cloud
Gratuit disponible
OpenAI API
Clé API nécessaire
Vous aurez aussi besoin d'un dossier Google Drive contenant vos documents (PDF, Google Docs, fichiers texte).
Créer l'agent ElevenLabs
10 min · Étapes 1 → 2
Créer l'agent sur ElevenLabs
ElevenLabs est la plateforme de référence pour les voix IA. Son module Conversational AI permet de créer des agents vocaux capables d'appeler des webhooks externes — c'est le pont entre la voix de l'utilisateur et votre workflow n8n.
Connectez-vous sur elevenlabs.io, puis naviguez vers Products → Conversational AI → Agents et cliquez sur Create Agent.
Sélectionnez Blank Agent pour partir d'une configuration vide.
Donnez un nom à votre agent (ex. : assistant-entreprise), puis dans le champ First Message, entrez le message d'accueil que l'agent dira au démarrage de chaque conversation.
Exemple de First Message :
"Bonjour, je suis l'assistant de [Votre Entreprise]. Comment puis-je vous aider aujourd'hui ?"
Dans le champ System Prompt, décrivez le rôle et le comportement de l'agent. Précisez qu'il doit utiliser son outil webhook pour toutes les questions métier.
Exemple de System Prompt :
// Adaptez ce prompt à votre activité
Vous êtes l'assistant virtuel de [Nom de l'entreprise].
Pour toute question sur nos produits, services, horaires
ou informations pratiques, utilisez l'outil "assistant_rag".
Répondez de manière claire, concise et professionnelle.
Restez toujours dans le périmètre de votre base de connaissances.Conseil
Soyez précis dans le System Prompt sur quand utiliser le webhook. Plus l'instruction est claire, plus l'agent sera fiable pour déclencher le bon outil au bon moment.
Configurer le webhook ElevenLabs → n8n
C'est le maillon clé : chaque fois que l'agent ElevenLabs veut répondre à une question, il appelle ce webhook n8n qui exécute la recherche RAG et lui renvoie la réponse.
Dans la configuration de votre agent, faites défiler jusqu'à la section Tools et cliquez sur Add Tool, puis choisissez Webhook.
Configurez le webhook avec ces paramètres :
Activez Body Parameters et ajoutez un paramètre avec ces valeurs :
Comment ça fonctionne
ElevenLabs intercepte la question de l'utilisateur, la place dans le champ question, et envoie un POST à n8n. n8n renvoie la réponse, et ElevenLabs la vocalise instantanément.
Récupérez l'Agent ID de votre agent (visible dans l'URL ou les paramètres) — vous en aurez besoin à l'étape 7.
Configurer Qdrant
5 min · Étape 3
Créer votre base vectorielle Qdrant
Qdrant est une base de données vectorielle open source. Elle stocke vos documents sous forme de vecteurs numériques et permet des recherches sémantiques ultra-rapides — la colonne vertébrale de tout système RAG.
Créez un compte gratuit sur cloud.qdrant.io, puis créez un nouveau cluster en choisissant la région la plus proche (pour minimiser la latence).
Une fois le cluster créé, récupérez deux informations essentielles dans les paramètres de votre cluster :
URL du cluster
Format : https://xxxx-xxxx.eu-central.aws.cloud.qdrant.io
API Key
Générée dans Access → API Keys de votre dashboard Qdrant
Dans n8n, créez une credential de type HTTP Header Auth avec : Header Name = api-key, Value = votre clé API Qdrant. Vous l'utiliserez dans les nodes HTTP Request des étapes suivantes.
Pourquoi Qdrant plutôt que Pinecone ou Supabase ?
Qdrant est open source, très performant et dispose d'un plan cloud gratuit généreux. n8n intègre un node natif Qdrant Vector Store qui simplifie considérablement la configuration.
Choisissez un nom pour votre collection (ex. : knowledge-base) et notez-le — vous l'utiliserez à chaque étape suivante à la place de COLLECTION.
La collection est créée automatiquement
Vous n'avez pas besoin de créer la collection manuellement dans Qdrant. Le workflow n8n inclut un node HTTP Request dédié qui la crée lors du premier lancement.
Vectoriser vos documents
10 min · Étapes 4 → 5
Préparer vos documents sur Google Drive
Le workflow lit les documents directement depuis un dossier Google Drive. C'est l'approche la plus flexible : modifiez vos documents, relancez le workflow, votre agent se met à jour automatiquement.
Créez un dossier dédié sur votre Google Drive (ex. : knowledge-base-agent) et déposez-y vos documents.
Formats acceptés :
Conseil : structurez vos documents en sections claires avec des titres. Le RAG sera plus précis si les informations sont bien organisées.
Notez l'ID du dossier Google Drive (visible dans l'URL : drive.google.com/drive/folders/[ID]). Vous le renseignerez dans le node Get folder à l'étape suivante.
Configurer le workflow d'ingestion dans n8n
Ce workflow (déclenché manuellement) lit tous vos documents Drive, les découpe en petits morceaux, les convertit en vecteurs OpenAI, et les stocke dans Qdrant. À relancer à chaque mise à jour de vos documents.
Importez le workflow JSON fourni dans n8n via Workflows → Import from file.
Voici les nodes à configurer, dans l'ordre :
Ces deux nodes HTTP Request créent la collection Qdrant et suppriment les anciens vecteurs avant d'insérer les nouveaux. Remplacez dans les deux nodes :
- →
QDRANTURLpar l'URL de votre cluster Qdrant - →
COLLECTIONpar le nom de votre collection - → Sélectionnez la credential HTTP Header Auth créée à l'étape 3
Liste les fichiers de votre dossier Google Drive. Configurez :
- → Connectez votre compte Google Drive via OAuth
- → Dans Folder ID, entrez l'ID du dossier noté à l'étape 4
Ce node télécharge chaque fichier. Le champ File ID est déjà configuré avec ={{ $json.id }} pour prendre l'ID dynamiquement depuis Get folder. Les Google Docs sont automatiquement convertis en texte brut.
Ce groupe de nodes gère la vectorisation et le stockage :
- → Dans Qdrant Vector Store1 : mode Insert, collection = votre nom de collection, credentials Qdrant
- → Dans Embeddings OpenAI1 : connectez votre clé API OpenAI (modèle
text-embedding-ada-002par défaut) - → Token Splitter : chunk size = 300, overlap = 30 (paramètres optimaux pour la plupart des cas)
Le découpage en chunks (Token Splitter)
Vos documents sont découpés en morceaux de 300 tokens (~225 mots) avec un chevauchement de 30 tokens. Le chevauchement évite de perdre du contexte entre deux chunks. Chaque chunk est ensuite converti en un vecteur de 1536 dimensions par OpenAI Embeddings.
Une fois tous les nodes configurés, cliquez sur Test workflow (bouton en bas de l'éditeur). Vérifiez dans votre dashboard Qdrant que la collection contient bien des points (vecteurs) après l'exécution.
Configurer l'agent RAG dans n8n
10 min · Étape 6
Assembler le workflow RAG
Ce workflow s'exécute en temps réel à chaque question d'un utilisateur. Il reçoit la question via webhook, interroge Qdrant, génère une réponse avec GPT-4o, et la renvoie à ElevenLabs en quelques secondes.
Architecture du workflow RAG :
{ "question": "..." } Configurez chaque node dans l'ordre :
- → HTTP Method : POST
- → Path :
test_voice_message_elevenlabs(ou le nom de votre choix) - → Respond : Using Respond to Webhook Node
- → Copiez l'URL webhook générée — vous en aurez besoin pour l'étape 2 (outil ElevenLabs)
- → Prompt Type : Define
- → Text :
={{ $json.body.question }}
- → Connectez votre clé API OpenAI
- → Modèle recommandé :
gpt-4o(meilleur rapport qualité/vitesse)
- → Name :
company(ou un nom descriptif) - → Description : "Répond aux questions relatives à l'entreprise" — plus c'est précis, mieux l'agent sait quand utiliser cet outil
- → Mode : Retrieve
- → Collection : votre nom de collection
- → Credentials : votre credential Qdrant
Connectez la même clé API OpenAI. Ce node convertit la question de l'utilisateur en vecteur pour la recherche dans Qdrant.
Deuxième instance OpenAI, dédiée au traitement interne du Vector Store Tool. Modèle : gpt-4o-mini (moins coûteux pour cette tâche intermédiaire).
⚠ Deux instances OpenAI distinctes
Le workflow utilise intentionnellement deux nodes OpenAI séparés : OpenAI pour le raisonnement principal de l'AI Agent, et OpenAI Chat Model pour le traitement interne du Vector Store Tool. Les deux doivent être configurés.
Retournez dans ElevenLabs (étape 2) et renseignez maintenant l'URL du webhook Listen dans la configuration de votre outil.
Dans n8n, activez le workflow avec le toggle en haut à droite. Le webhook est maintenant en écoute permanente.
Déployer sur votre site
5 min · Étape 7
Tester et intégrer le widget
Avant d'intégrer le widget sur votre site, testez le système de bout en bout depuis l'interface ElevenLabs.
Dans votre agent ElevenLabs, cliquez sur Test Agent (bouton en haut à droite). Posez une question qui devrait se trouver dans vos documents et vérifiez que la réponse est correcte.
Checklist avant mise en production :
- ✓ L'agent répond au message d'accueil correctement
- ✓ Les questions sur vos documents reçoivent des réponses précises
- ✓ L'agent dit qu'il ne sait pas pour les questions hors périmètre
- ✓ La latence est acceptable (< 3 secondes)
- ✓ Le workflow n8n est bien activé (toggle ON)
Une fois les tests validés, ajoutez le widget ElevenLabs sur votre site en collant ce code HTML avant la balise </body> :
<!-- Remplacez AGENT_ID par votre ID ElevenLabs --> <elevenlabs-convai agent-id="AGENT_ID"> </elevenlabs-convai> <script src="https://elevenlabs.io/convai-widget/index.js" async type="text/javascript"> </script>
Trouver votre Agent ID
L'Agent ID se trouve dans l'URL de votre agent ElevenLabs : elevenlabs.io/app/conversational-ai/[AGENT_ID], ou dans Settings → Agent ID de la configuration de l'agent.
Personnalisation du widget :
- → Couleurs et position : configurables depuis le dashboard ElevenLabs → Widget
- → Il apparaît comme un bouton flottant en bas à droite de votre page
- → Compatible avec tous les CMS : WordPress, Webflow, Shopify, Wix, etc.
🎉
Votre voice bot RAG est en ligne !
Vous avez mis en place une architecture RAG complète : vos documents sont vectorisés dans Qdrant, votre agent ElevenLabs appelle n8n en temps réel, et GPT-4o génère des réponses précises depuis votre base de connaissances.
Aller plus loin
Mise à jour automatique des documents
Ajoutez un trigger Google Drive pour relancer l'ingestion automatiquement à chaque modification de vos fichiers.
Plusieurs bases de connaissances
Créez plusieurs collections Qdrant et plusieurs Vector Store Tools pour séparer produits, FAQ et support technique.
Logging des conversations
Ajoutez un node Google Sheets ou Airtable après l'AI Agent pour enregistrer chaque question et réponse.
Escalade vers un humain
Configurez un transfert vers un agent humain ou un envoi d'email/Slack quand l'agent ne peut pas répondre.
Vous voulez qu'on le construise pour vous ?
Mindeon.ai conçoit et déploie des agents vocaux RAG sur mesure — connectés à vos outils, formés sur vos données, opérationnels en quelques jours.
Parlons de votre projet