Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

[EPIC] Définir et réaliser des tests pour optimiser le Retriever #24

Open
5 tasks
rprebot opened this issue Dec 3, 2024 · 0 comments
Open
5 tasks
Labels

Comments

@rprebot
Copy link
Contributor

rprebot commented Dec 3, 2024

📌 Contexte

Une fois la base de connaissance externe créée sur Albert, on va l'interroger pour récupérer des sources de droits identifiées les plus pertinentes et les insérer dans le prompt du LLM qui génère la réponse.

Sur la "pipeline RAG" il y a différentes étapes (rewriter, chunking, pre-retriever, retriever, re-ranker, post retriever, ...) sur laquelle différents choix de paramètres et / ou méthodes peuvent être sélectionnés afin d'optimiser la performance du RAG.

🚀 Objectif

Toutes les options de paramétrage de la "pipeline RAG" (et leurs combinatoires) ne pourront pas être testées pour construire le MVP, soit par manque de temps, soit par manque de moyen technique.

L'objectif de cette EPIC est de prioriser des tests à réaliser pour améliorer la performance de cette "pipeline RAG".

Les critères qui nous permettent d'évaluer la performance du RAG sont :

  • la précision (%) : (nombre de sources pertinentes par rapport à la question) / (nombre de sources de droit total identifiées)
  • le recall (%) : (nombre de principes généraux de droit déductibles à partir des sources **) / (nombre de principes généraux de droit attendus)
    ** ce nombre est évalué par un LLM

Les différentes options possibles à tester sont répertoriées dans ce document

🔎 Features attendues - MVP

🤖 Features attendues - Post-MVP

à définir

📚 Ressources utiles

@rprebot rprebot changed the title [EPIC] Optimiser le Retrieval [EPIC] Définir les tests à réaliser pour optimiser le Retrieval Dec 3, 2024
@rprebot rprebot changed the title [EPIC] Définir les tests à réaliser pour optimiser le Retrieval [EPIC] Définir les tests à réaliser pour optimiser la "pipeline RAG" Dec 3, 2024
@rprebot rprebot changed the title [EPIC] Définir les tests à réaliser pour optimiser la "pipeline RAG" [EPIC] Définir et réaliser des tests pour optimiser la "pipeline RAG" Dec 3, 2024
@rprebot rprebot added the EPIC label Dec 3, 2024
@rprebot rprebot changed the title [EPIC] Définir et réaliser des tests pour optimiser la "pipeline RAG" [EPIC] Définir et réaliser des tests pour optimiser le Retriever Dec 3, 2024
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
Projects
None yet
Development

No branches or pull requests

1 participant