Retour aux guides
n8n ElevenLabs Qdrant RAG

Voice Bot RAG avec n8n + ElevenLabs + Qdrant

Créez un agent vocal qui répond depuis vos propres documents — FAQ, menu, catalogue produit, base de connaissances — sans écrire une seule ligne de code.

5 parties · 7 étapes
~35 minutes
Niveau intermédiaire

Ce que vous allez construire

Un agent vocal disponible 24h/24 sur votre site, capable de répondre à toutes les questions sur votre activité en puisant dans vos documents Google Drive.

Pipeline d'ingestion (1 fois)

Google Drive n8n Découpage texte OpenAI Embeddings Qdrant

Pipeline de conversation (temps réel)

Utilisateur parle ElevenLabs Webhook n8n AI Agent Qdrant (recherche) OpenAI GPT-4o ElevenLabs (voix)

Prérequis

n8n

Cloud ou self-hosted

ElevenLabs

Plan Creator ou +

Qdrant Cloud

Gratuit disponible

OpenAI API

Clé API nécessaire

Vous aurez aussi besoin d'un dossier Google Drive contenant vos documents (PDF, Google Docs, fichiers texte).

1

Créer l'agent ElevenLabs

10 min · Étapes 1 → 2

1

Créer l'agent sur ElevenLabs

ElevenLabs est la plateforme de référence pour les voix IA. Son module Conversational AI permet de créer des agents vocaux capables d'appeler des webhooks externes — c'est le pont entre la voix de l'utilisateur et votre workflow n8n.

Connectez-vous sur elevenlabs.io, puis naviguez vers Products → Conversational AI → Agents et cliquez sur Create Agent.

Sélectionnez Blank Agent pour partir d'une configuration vide.

Donnez un nom à votre agent (ex. : assistant-entreprise), puis dans le champ First Message, entrez le message d'accueil que l'agent dira au démarrage de chaque conversation.

Exemple de First Message :

"Bonjour, je suis l'assistant de [Votre Entreprise]. Comment puis-je vous aider aujourd'hui ?"

Dans le champ System Prompt, décrivez le rôle et le comportement de l'agent. Précisez qu'il doit utiliser son outil webhook pour toutes les questions métier.

Exemple de System Prompt :

// Adaptez ce prompt à votre activité
Vous êtes l'assistant virtuel de [Nom de l'entreprise].
Pour toute question sur nos produits, services, horaires
ou informations pratiques, utilisez l'outil "assistant_rag".
Répondez de manière claire, concise et professionnelle.
Restez toujours dans le périmètre de votre base de connaissances.

Conseil

Soyez précis dans le System Prompt sur quand utiliser le webhook. Plus l'instruction est claire, plus l'agent sera fiable pour déclencher le bon outil au bon moment.

2

Configurer le webhook ElevenLabs → n8n

C'est le maillon clé : chaque fois que l'agent ElevenLabs veut répondre à une question, il appelle ce webhook n8n qui exécute la recherche RAG et lui renvoie la réponse.

Dans la configuration de votre agent, faites défiler jusqu'à la section Tools et cliquez sur Add Tool, puis choisissez Webhook.

Configurez le webhook avec ces paramètres :

Name assistant_rag
Description "Répond aux questions sur l'entreprise. Stocke la question dans le champ question."
Method POST
URL À renseigner à l'étape 6 (URL du webhook n8n)

Activez Body Parameters et ajoutez un paramètre avec ces valeurs :

Name question
Data Type string
Value Type LLM Prompt
Description "La question posée par l'utilisateur"

Comment ça fonctionne

ElevenLabs intercepte la question de l'utilisateur, la place dans le champ question, et envoie un POST à n8n. n8n renvoie la réponse, et ElevenLabs la vocalise instantanément.

Récupérez l'Agent ID de votre agent (visible dans l'URL ou les paramètres) — vous en aurez besoin à l'étape 7.

2

Configurer Qdrant

5 min · Étape 3

3

Créer votre base vectorielle Qdrant

Qdrant est une base de données vectorielle open source. Elle stocke vos documents sous forme de vecteurs numériques et permet des recherches sémantiques ultra-rapides — la colonne vertébrale de tout système RAG.

Créez un compte gratuit sur cloud.qdrant.io, puis créez un nouveau cluster en choisissant la région la plus proche (pour minimiser la latence).

Une fois le cluster créé, récupérez deux informations essentielles dans les paramètres de votre cluster :

URL du cluster

Format : https://xxxx-xxxx.eu-central.aws.cloud.qdrant.io

API Key

Générée dans Access → API Keys de votre dashboard Qdrant

Dans n8n, créez une credential de type HTTP Header Auth avec : Header Name = api-key, Value = votre clé API Qdrant. Vous l'utiliserez dans les nodes HTTP Request des étapes suivantes.

Pourquoi Qdrant plutôt que Pinecone ou Supabase ?

Qdrant est open source, très performant et dispose d'un plan cloud gratuit généreux. n8n intègre un node natif Qdrant Vector Store qui simplifie considérablement la configuration.

Choisissez un nom pour votre collection (ex. : knowledge-base) et notez-le — vous l'utiliserez à chaque étape suivante à la place de COLLECTION.

La collection est créée automatiquement

Vous n'avez pas besoin de créer la collection manuellement dans Qdrant. Le workflow n8n inclut un node HTTP Request dédié qui la crée lors du premier lancement.

3

Vectoriser vos documents

10 min · Étapes 4 → 5

4

Préparer vos documents sur Google Drive

Le workflow lit les documents directement depuis un dossier Google Drive. C'est l'approche la plus flexible : modifiez vos documents, relancez le workflow, votre agent se met à jour automatiquement.

Créez un dossier dédié sur votre Google Drive (ex. : knowledge-base-agent) et déposez-y vos documents.

Formats acceptés :

Google Docs (converti en texte)
PDF
Fichiers .txt
Google Sheets

Conseil : structurez vos documents en sections claires avec des titres. Le RAG sera plus précis si les informations sont bien organisées.

Notez l'ID du dossier Google Drive (visible dans l'URL : drive.google.com/drive/folders/[ID]). Vous le renseignerez dans le node Get folder à l'étape suivante.

5

Configurer le workflow d'ingestion dans n8n

Ce workflow (déclenché manuellement) lit tous vos documents Drive, les découpe en petits morceaux, les convertit en vecteurs OpenAI, et les stocke dans Qdrant. À relancer à chaque mise à jour de vos documents.

Importez le workflow JSON fourni dans n8n via Workflows → Import from file.

Voici les nodes à configurer, dans l'ordre :

Create collection + Refresh collection

Ces deux nodes HTTP Request créent la collection Qdrant et suppriment les anciens vecteurs avant d'insérer les nouveaux. Remplacez dans les deux nodes :

  • QDRANTURL par l'URL de votre cluster Qdrant
  • COLLECTION par le nom de votre collection
  • Sélectionnez la credential HTTP Header Auth créée à l'étape 3
Get folder

Liste les fichiers de votre dossier Google Drive. Configurez :

  • Connectez votre compte Google Drive via OAuth
  • Dans Folder ID, entrez l'ID du dossier noté à l'étape 4
Download Files

Ce node télécharge chaque fichier. Le champ File ID est déjà configuré avec ={{ $json.id }} pour prendre l'ID dynamiquement depuis Get folder. Les Google Docs sont automatiquement convertis en texte brut.

Qdrant Vector Store1 + Embeddings OpenAI1 + Default Data Loader + Token Splitter

Ce groupe de nodes gère la vectorisation et le stockage :

  • Dans Qdrant Vector Store1 : mode Insert, collection = votre nom de collection, credentials Qdrant
  • Dans Embeddings OpenAI1 : connectez votre clé API OpenAI (modèle text-embedding-ada-002 par défaut)
  • Token Splitter : chunk size = 300, overlap = 30 (paramètres optimaux pour la plupart des cas)

Le découpage en chunks (Token Splitter)

Vos documents sont découpés en morceaux de 300 tokens (~225 mots) avec un chevauchement de 30 tokens. Le chevauchement évite de perdre du contexte entre deux chunks. Chaque chunk est ensuite converti en un vecteur de 1536 dimensions par OpenAI Embeddings.

Une fois tous les nodes configurés, cliquez sur Test workflow (bouton en bas de l'éditeur). Vérifiez dans votre dashboard Qdrant que la collection contient bien des points (vecteurs) après l'exécution.

4

Configurer l'agent RAG dans n8n

10 min · Étape 6

6

Assembler le workflow RAG

Ce workflow s'exécute en temps réel à chaque question d'un utilisateur. Il reçoit la question via webhook, interroge Qdrant, génère une réponse avec GPT-4o, et la renvoie à ElevenLabs en quelques secondes.

Architecture du workflow RAG :

Listen — reçoit le POST d'ElevenLabs avec { "question": "..." }
AI Agent — orchestre la réponse en utilisant ses sous-nodes
OpenAI — le LLM principal (GPT-4o) qui formule la réponse
Window Buffer Memory — mémorise les N derniers échanges pour une conversation cohérente
Vector Store Tool — outil de recherche dans Qdrant, lui-même alimenté par :
Qdrant Vector Store (mode retrieve) + Embeddings OpenAI + OpenAI Chat Model
Respond to ElevenLabs — renvoie la réponse au webhook ElevenLabs

Configurez chaque node dans l'ordre :

Listen Webhook trigger
  • HTTP Method : POST
  • Path : test_voice_message_elevenlabs (ou le nom de votre choix)
  • Respond : Using Respond to Webhook Node
  • Copiez l'URL webhook générée — vous en aurez besoin pour l'étape 2 (outil ElevenLabs)
AI Agent
  • Prompt Type : Define
  • Text : ={{ $json.body.question }}
OpenAI LLM principal de l'AI Agent
  • Connectez votre clé API OpenAI
  • Modèle recommandé : gpt-4o (meilleur rapport qualité/vitesse)
Vector Store Tool
  • Name : company (ou un nom descriptif)
  • Description : "Répond aux questions relatives à l'entreprise" — plus c'est précis, mieux l'agent sait quand utiliser cet outil
Qdrant Vector Store Mode retrieval
  • Mode : Retrieve
  • Collection : votre nom de collection
  • Credentials : votre credential Qdrant
Embeddings OpenAI Connecté à Qdrant Vector Store (retrieval)

Connectez la même clé API OpenAI. Ce node convertit la question de l'utilisateur en vecteur pour la recherche dans Qdrant.

OpenAI Chat Model Connecté à Vector Store Tool

Deuxième instance OpenAI, dédiée au traitement interne du Vector Store Tool. Modèle : gpt-4o-mini (moins coûteux pour cette tâche intermédiaire).

⚠ Deux instances OpenAI distinctes

Le workflow utilise intentionnellement deux nodes OpenAI séparés : OpenAI pour le raisonnement principal de l'AI Agent, et OpenAI Chat Model pour le traitement interne du Vector Store Tool. Les deux doivent être configurés.

Retournez dans ElevenLabs (étape 2) et renseignez maintenant l'URL du webhook Listen dans la configuration de votre outil.

Dans n8n, activez le workflow avec le toggle en haut à droite. Le webhook est maintenant en écoute permanente.

5

Déployer sur votre site

5 min · Étape 7

7

Tester et intégrer le widget

Avant d'intégrer le widget sur votre site, testez le système de bout en bout depuis l'interface ElevenLabs.

Dans votre agent ElevenLabs, cliquez sur Test Agent (bouton en haut à droite). Posez une question qui devrait se trouver dans vos documents et vérifiez que la réponse est correcte.

Checklist avant mise en production :

  • L'agent répond au message d'accueil correctement
  • Les questions sur vos documents reçoivent des réponses précises
  • L'agent dit qu'il ne sait pas pour les questions hors périmètre
  • La latence est acceptable (< 3 secondes)
  • Le workflow n8n est bien activé (toggle ON)

Une fois les tests validés, ajoutez le widget ElevenLabs sur votre site en collant ce code HTML avant la balise </body> :

<!-- Remplacez AGENT_ID par votre ID ElevenLabs -->

<elevenlabs-convai
  agent-id="AGENT_ID">
</elevenlabs-convai>

<script
  src="https://elevenlabs.io/convai-widget/index.js"
  async type="text/javascript">
</script>

Trouver votre Agent ID

L'Agent ID se trouve dans l'URL de votre agent ElevenLabs : elevenlabs.io/app/conversational-ai/[AGENT_ID], ou dans Settings → Agent ID de la configuration de l'agent.

Personnalisation du widget :

  • Couleurs et position : configurables depuis le dashboard ElevenLabs → Widget
  • Il apparaît comme un bouton flottant en bas à droite de votre page
  • Compatible avec tous les CMS : WordPress, Webflow, Shopify, Wix, etc.

🎉

Votre voice bot RAG est en ligne !

Vous avez mis en place une architecture RAG complète : vos documents sont vectorisés dans Qdrant, votre agent ElevenLabs appelle n8n en temps réel, et GPT-4o génère des réponses précises depuis votre base de connaissances.

Aller plus loin

Mise à jour automatique des documents

Ajoutez un trigger Google Drive pour relancer l'ingestion automatiquement à chaque modification de vos fichiers.

Plusieurs bases de connaissances

Créez plusieurs collections Qdrant et plusieurs Vector Store Tools pour séparer produits, FAQ et support technique.

Logging des conversations

Ajoutez un node Google Sheets ou Airtable après l'AI Agent pour enregistrer chaque question et réponse.

Escalade vers un humain

Configurez un transfert vers un agent humain ou un envoi d'email/Slack quand l'agent ne peut pas répondre.

Vous voulez qu'on le construise pour vous ?

Mindeon.ai conçoit et déploie des agents vocaux RAG sur mesure — connectés à vos outils, formés sur vos données, opérationnels en quelques jours.

Parlons de votre projet