Mejorar la eficacia con la que jueces y funcionarios del poder judicial acceden a resoluciones previas relevantes de una cámara federal, facilitando la identificación de antecedentes de resoluciones similares y evitando contradicciones con fallos anteriores.
- Antonio Santiago Tepsich
- Máximo Gubitosi
- Gabor Gorondi
- Bruno Castagnino Rossi
Este repositorio agrupa todo el trabajo realizado para construir, evaluar y desplegar un sistema Retrieval-Augmented Generation (RAG) especializado en jurisprudencia.
| Carpeta | Descripción |
|---|---|
legal-rag/ |
Proyecto final listo para producción: backend (FastAPI), frontend (Streamlit) y un subconjunto del dataset. Contiene su propio README con los pasos detallados para construir índices, configurar variables de entorno y ejecutar el stack mediante docker-compose. |
legal-rag-eval-version/ |
Clon de legal-rag ampliado para correr varias configuraciones de RAG en paralelo sobre versiones modificadas del dataset. Lo usamos para comparar estrategias de búsqueda, distintos LLMs y parámetros. |
post_evaluation/ |
Código y resultados de la fase de evaluación offline. Dentro encontrarás un archivo reporte_evaluacion.md donde explicamos la metodología y las métricas utilizadas. |
Los cuadernos Jupyter bajo legal-rag/Notebooks muestran paso a paso cómo transformamos los fallos en PDF al formato JSON enriquecido que consume el backend en producción.
Por motivos de confidencialidad sólo incluimos unas pocas sentencias para que puedas levantar el sistema y probar su funcionamiento. Durante el desarrollo trabajamos con más de 290 fallos reales. Si necesitás acceso completo para investigación o pruebas, no dudes en contactarnos y coordinamos el envío.
Para correr la aplicación:
- Lee el README dentro de
legal-rag/. - Sigue las instrucciones allí indicadas (crear entorno, construir índices y lanzar
docker-compose).
Con eso obtendrás el backend, el frontend y los índices mínimos para explorar las funcionalidades del sistema.
