[EPIC] Définir et réaliser des tests pour optimiser le Retriever #24

rprebot · 2024-12-03T15:08:17Z

📌 Contexte

Une fois la base de connaissance externe créée sur Albert, on va l'interroger pour récupérer des sources de droits identifiées les plus pertinentes et les insérer dans le prompt du LLM qui génère la réponse.

Sur la "pipeline RAG" il y a différentes étapes (rewriter, chunking, pre-retriever, retriever, re-ranker, post retriever, ...) sur laquelle différents choix de paramètres et / ou méthodes peuvent être sélectionnés afin d'optimiser la performance du RAG.

🚀 Objectif

Toutes les options de paramétrage de la "pipeline RAG" (et leurs combinatoires) ne pourront pas être testées pour construire le MVP, soit par manque de temps, soit par manque de moyen technique.

L'objectif de cette EPIC est de prioriser des tests à réaliser pour améliorer la performance de cette "pipeline RAG".

Les critères qui nous permettent d'évaluer la performance du RAG sont :

la précision (%) : (nombre de sources pertinentes par rapport à la question) / (nombre de sources de droit total identifiées)
le recall (%) : (nombre de principes généraux de droit déductibles à partir des sources **) / (nombre de principes généraux de droit attendus)
** ce nombre est évalué par un LLM

Les différentes options possibles à tester sont répertoriées dans ce document

🔎 Features attendues - MVP

🤖 Features attendues - Post-MVP

à définir

📚 Ressources utiles

Advance RAG - Improve RAG performance : https://luv-bansal.medium.com/advance-rag-improve-rag-performance-208ffad5bb6a
chunk augmentation (réalisé par un data scientist etalab) : https://medium.com/@camille_andre/enhancing-language-model-performance-insights-into-rag-and-chunking-augmentation-techniques-897ba15a04d6

rprebot changed the title ~~[EPIC] Optimiser le Retrieval~~ [EPIC] Définir les tests à réaliser pour optimiser le Retrieval Dec 3, 2024

rprebot changed the title ~~[EPIC] Définir les tests à réaliser pour optimiser le Retrieval~~ [EPIC] Définir les tests à réaliser pour optimiser la "pipeline RAG" Dec 3, 2024

rprebot changed the title ~~[EPIC] Définir les tests à réaliser pour optimiser la "pipeline RAG"~~ [EPIC] Définir et réaliser des tests pour optimiser la "pipeline RAG" Dec 3, 2024

rprebot added the EPIC label Dec 3, 2024

rprebot changed the title ~~[EPIC] Définir et réaliser des tests pour optimiser la "pipeline RAG"~~ [EPIC] Définir et réaliser des tests pour optimiser le Retriever Dec 3, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[EPIC] Définir et réaliser des tests pour optimiser le Retriever #24

[EPIC] Définir et réaliser des tests pour optimiser le Retriever #24

rprebot commented Dec 3, 2024 •

edited

Loading

[EPIC] Définir et réaliser des tests pour optimiser le Retriever #24

[EPIC] Définir et réaliser des tests pour optimiser le Retriever #24

Comments

rprebot commented Dec 3, 2024 • edited Loading

📌 Contexte

🚀 Objectif

🔎 Features attendues - MVP

🤖 Features attendues - Post-MVP

📚 Ressources utiles

rprebot commented Dec 3, 2024 •

edited

Loading