Este repositorio contiene scripts y rutinas orientados a la evaluación automática de la calidad de datos, con énfasis en la taxonomía, coordenadas y estructura de los conjuntos de datos, conforme a los criterios de calidad definidos por el Instituto Humboldt a través de la Infraestructura Institucional de Datos e Información (I2D), para su publicación a través de los catálogos institucionales y del SiB Colombia, y están diseñadas para ser reutilizables, escalables y adaptables a distintos flujos de trabajo. Los scripts en este repositorio permiten:
- Verificar la completitud, consistencia y validez de los campos obligatorios. (en el futuro)
- Evaluar la coherencia taxonómica (en el futuro).
- Revisar la calidad de la información geográfica, incluyendo coordenadas y posibles inconsistencias espaciales (en proceso).
- Identificar valores atípicos, errores frecuentes y posibles duplicados tanto en los campos del core (en el futuro) como de las extensiones (en proceso).
- Generar reportes que apoyan la toma de decisiones durante los procesos de integración, curaduría y publicación de datos.