Gestió de dades de recerca per a equips sense data manager
Gestiona, neteja, documenta i traspassa les dades del teu projecte de recerca sense contractar un data manager a temps complet. Pipelines reproduïbles, sortides alineades amb FAIR, dipòsit a arxiu — propietat del teu equip, sense proveïdor.
On s'acumulen les bretxes en gestió de dades
Després d'entregar feina de dades per a equips de recerca en salut, neurociència i polítiques públiques, els mateixos patrons apareixen una i altra vegada.
Deriva d'esquema durant la recollida. Sis mesos després, el dataset té columnes que ningú va documentar i un format de data que canvia entre seus.
Neteja no reproduïble. Les figures publicades citen el dataset net, però ningú pot re-derivar-lo de manera determinista des de les dades crues.
Documentació en caps, no en arxius. El PI sap per què es van excloure les mesures de principis de 2025. Quan se'n va, el coneixement institucional del dataset se'n va amb ell.
Compromisos FAIR aspiracionals. El DMP prometia sortides alineades amb FAIR; no es va fer res per produir-les realment.
Les peticions de dades del finançador agafen l'equip desprevingut. 'On pot un revisor accedir al dataset net?' es converteix en un projecte frenètic de dues setmanes.
Què entreguem
Un projecte de gestió de dades porta les teves dades de 'disperses en portàtils de l'equip' a 'estructurades, documentades, reproduïbles' en 4–8 setmanes. Específicament:
Validació d'esquema com a codi
Definicions Pydantic / JSON Schema que detecten deriva a la ingesta, no a l'hora d'informar. Les versions d'esquema són explícites; els canvis es tracen.
Pipelines de neteja reproduïbles
Execucions d'una sola comanda des de cru a net, parametritzades on té sentit, amb control de versions. Les decisions de neteja es registren en codi, no en la memòria d'algú.
Pipelines d'anàlisi que produeixen les figures de l'informe
Les figures de l'informe final regenerables en re-executar l'script d'anàlisi. Sense captures, sense passos manuals a Excel, sense números orfes.
Metadades i documentació alineades amb FAIR
Diccionari de dades, README, registre de decisions, claredat de llicència. Dipòsit a Zenodo o al teu repositori institucional amb DOI citable.
Paquet de traspàs que l'equip pot operar
Guia d'instal·lació, runbook, test del portàtil nou en verd, actualització del pla de gestió de dades. L'equip posseeix i manté la infraestructura quan sortim.
Com funciona un projecte de gestió de dades
Quatre a vuit setmanes, tres fases, sense contracte recurrent.
Auditoria (setmana 1)
Inventariem els teus actius de dades actuals: què existeix, on viu, qui ho va tocar, què està documentat. Sortida: una anàlisi clara de la bretxa entre l'estat actual i l'estat objectiu alineat amb FAIR.
Construcció (setmanes 2–6)
Validació d'esquema, pipelines de neteja, scripts d'anàlisi, estructura de metadades — tot entregat com a codi que el teu equip posseeix. Iteratiu, amb revisions setmanals.
Traspàs (setmana 7–8)
Documentació, test del portàtil nou, dipòsit a l'arxiu de la teva elecció, actualització del DMP, sessió de formació amb l'equip. Després del traspàs, la infraestructura corre sense nosaltres.
Quant costa això davant de les alternatives
Contractar un data manager: 40.000–55.000 €/any, més tres mesos de cerca, més supervisió continuada. La majoria de projectes de recerca no poden justificar aquest cost recurrent. Una consultoria amb tarifa mensual: 3.000–6.000 €/mes indefinidament. Un projecte acotat de 4–8 setmanes amb Pragma: finit, el teu equip posseeix la sortida com a codi, sense contracte recurrent, sense dependència de proveïdor. El preu depèn de l'abast — la revisió de projecte et dóna la xifra exacta per al teu, sense compromís previ.
Quina pinta té 'no fer res': la deriva d'esquema no es corregeix, les figures publicades citen un dataset net que ningú pot tornar a generar, els compromisos FAIR continuen sent aspiracionals. Quan el finançador demana accés al dataset net per a un revisor, la resposta és un projecte frenètic de dues setmanes. El cost: una part de la reputació del projecte en el pitjor moment possible. El cost d'actuar ara: 60 minuts de revisió de projecte gratuïta.
Preguntes sobre gestió de dades de recerca
Necessites cobrir la part de dades del teu projecte?
Explica'ns l'estat actual del teu dataset, les expectatives del finançador i el teu termini. Respondrem en 2 dies laborables amb un abast o amb les preguntes que necessitaríem resoldre.
Sol·licitar revisió de projecte