Gestión de datos de investigación para equipos sin data manager
Gestiona, limpia, documenta y traspasa los datos de tu proyecto de investigación sin contratar a un data manager a tiempo completo. Pipelines reproducibles, salidas alineadas con FAIR, depósito en archivo — propiedad de tu equipo, sin proveedor.
Dónde se acumulan las brechas en gestión de datos
Después de entregar trabajo de datos para equipos de investigación en salud, neurociencia y políticas públicas, los mismos patrones aparecen una y otra vez.
Deriva de esquema durante la recogida. Seis meses después, el dataset tiene columnas que nadie documentó y un formato de fecha que cambia entre sitios.
Limpieza no reproducible. Las figuras publicadas citan el dataset limpio, pero nadie puede re-derivarlo de forma determinista desde los datos crudos.
Documentación en cabezas, no en archivos. El PI sabe por qué se excluyeron las medidas de principios de 2025. Cuando se va, el conocimiento institucional del dataset se va con él.
Compromisos FAIR aspiracionales. El DMP prometía salidas alineadas con FAIR; no se hizo nada para producirlas realmente.
Las peticiones de datos del financiador pillan al equipo desprevenido. '¿Dónde puede un revisor acceder al dataset limpio?' se convierte en un proyecto frenético de dos semanas.
Qué entregamos
Un proyecto de gestión de datos lleva tus datos de 'dispersos en portátiles del equipo' a 'estructurados, documentados, reproducibles' en 4–8 semanas. Específicamente:
Validación de esquema como código
Definiciones Pydantic / JSON Schema que detectan deriva en la ingestión, no a la hora de informar. Las versiones de esquema son explícitas; los cambios se trazan.
Pipelines de limpieza reproducibles
Ejecuciones de un solo comando desde crudo a limpio, parametrizadas donde tiene sentido, con control de versiones. Las decisiones de limpieza se registran en código, no en la memoria de alguien.
Pipelines de análisis que producen las figuras del informe
Las figuras del informe final regenerables al re-ejecutar el script de análisis. Sin capturas, sin pasos manuales en Excel, sin números huérfanos.
Metadatos y documentación alineados con FAIR
Diccionario de datos, README, registro de decisiones, claridad de licencia. Depósito en Zenodo o en tu repositorio institucional con DOI citable.
Paquete de traspaso que el equipo puede operar
Guía de instalación, runbook, test del portátil nuevo en verde, actualización del plan de gestión de datos. El equipo posee y mantiene la infraestructura cuando salimos.
Cómo funciona un proyecto de gestión de datos
Cuatro a ocho semanas, tres fases, sin contrato recurrente.
Auditoría (semana 1)
Inventariamos tus activos de datos actuales: qué existe, dónde vive, quién lo tocó, qué está documentado. Salida: un análisis claro de la brecha entre el estado actual y el estado objetivo alineado con FAIR.
Construcción (semanas 2–6)
Validación de esquema, pipelines de limpieza, scripts de análisis, estructura de metadatos — todo entregado como código que tu equipo posee. Iterativo, con revisiones semanales.
Traspaso (semana 7–8)
Documentación, test del portátil nuevo, depósito en el archivo de tu elección, actualización del DMP, sesión de formación con el equipo. Tras el traspaso, la infraestructura corre sin nosotros.
Cuánto cuesta esto frente a las alternativas
Contratar a un data manager: 40.000–55.000 €/año, más tres meses de búsqueda, más supervisión continuada. La mayoría de proyectos de investigación no pueden justificar ese coste recurrente. Una consultoría con tarifa mensual: 3.000–6.000 €/mes indefinidamente. Un proyecto acotado de 4–8 semanas con Pragma: finito, tu equipo posee la salida como código, sin contrato recurrente, sin dependencia de proveedor. El precio depende del alcance — la revisión de proyecto te da la cifra exacta para el tuyo, sin compromiso previo.
Qué pinta tiene 'no hacer nada': la deriva de esquema no se corrige, las figuras publicadas citan un dataset limpio que nadie puede regenerar, los compromisos FAIR siguen siendo aspiracionales. Cuando el financiador pide acceso al dataset limpio para un revisor, la respuesta es un proyecto frenético de dos semanas. El coste: parte de la reputación del proyecto en el peor momento posible. El coste de actuar ahora: 60 minutos de revisión de proyecto gratuita.
Preguntas sobre gestión de datos de investigación
¿Necesitas que la parte de datos de tu proyecto esté cubierta?
Cuéntanos el estado actual de tu dataset, las expectativas del financiador y tu plazo. Responderemos en 2 días laborables con un alcance o con las preguntas que necesitaríamos resolver.
Solicitar revisión de proyecto