You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Dépendance
est nécessaire pour la réalisation de #30
Contexte
On va tester 2 méthodes pour récupérer le contenu des sources de droit priorisés en sortie du Retrieval :
option 1 : on insère seulement les chunks dans le prompt
option 2 : on insère l'intégralité du texte sources dont sont issus les chunks dans le prompt (dans la limite de la fenêtre de contexte)
Solution
Dans ce ticket, on a besoin d'héberger dans un BDD externe (i.e. externe à Albert) les sources (avec le contenu brut et non vectorisé) des dumps de données utilisées pour générer les collections.
Il faut donc un ID unique entre le chunk et les sources de cette BDD. Il y a plusieurs options :
l'ID unique du document dans Albert (mais cela nécessite de le récupérer)
l'URL du document
le titre du document
The text was updated successfully, but these errors were encountered:
rprebot
changed the title
[pipeline RAG] Héberger les sources brutes sur une base de données externes
[pipeline RAG] Héberger le contenu des documents sur une base de données externes
Dec 11, 2024
Dépendance
est nécessaire pour la réalisation de #30
Contexte
On va tester 2 méthodes pour récupérer le contenu des sources de droit priorisés en sortie du Retrieval :
Solution
Dans ce ticket, on a besoin d'héberger dans un BDD externe (i.e. externe à Albert) les sources (avec le contenu brut et non vectorisé) des dumps de données utilisées pour générer les collections.
Il faut donc un ID unique entre le chunk et les sources de cette BDD. Il y a plusieurs options :
The text was updated successfully, but these errors were encountered: