Salta al contingut
Servei · Gestió de dades de recerca

Gestió de dades de recerca per a equips sense data manager

Gestiona, neteja, documenta i traspassa les dades del teu projecte de recerca sense contractar un data manager a temps complet. Pipelines reproduïbles, sortides alineades amb FAIR, dipòsit a arxiu — propietat del teu equip, sense proveïdor.

On s'acumulen les bretxes en gestió de dades

Després d'entregar feina de dades per a equips de recerca en salut, neurociència i polítiques públiques, els mateixos patrons apareixen una i altra vegada.

Deriva d'esquema durant la recollida. Sis mesos després, el dataset té columnes que ningú va documentar i un format de data que canvia entre seus.

Neteja no reproduïble. Les figures publicades citen el dataset net, però ningú pot re-derivar-lo de manera determinista des de les dades crues.

Documentació en caps, no en arxius. El PI sap per què es van excloure les mesures de principis de 2025. Quan se'n va, el coneixement institucional del dataset se'n va amb ell.

Compromisos FAIR aspiracionals. El DMP prometia sortides alineades amb FAIR; no es va fer res per produir-les realment.

Les peticions de dades del finançador agafen l'equip desprevingut. 'On pot un revisor accedir al dataset net?' es converteix en un projecte frenètic de dues setmanes.

Què entreguem

Un projecte de gestió de dades porta les teves dades de 'disperses en portàtils de l'equip' a 'estructurades, documentades, reproduïbles' en 4–8 setmanes. Específicament:

Validació d'esquema com a codi

Definicions Pydantic / JSON Schema que detecten deriva a la ingesta, no a l'hora d'informar. Les versions d'esquema són explícites; els canvis es tracen.

Pipelines de neteja reproduïbles

Execucions d'una sola comanda des de cru a net, parametritzades on té sentit, amb control de versions. Les decisions de neteja es registren en codi, no en la memòria d'algú.

Pipelines d'anàlisi que produeixen les figures de l'informe

Les figures de l'informe final regenerables en re-executar l'script d'anàlisi. Sense captures, sense passos manuals a Excel, sense números orfes.

Metadades i documentació alineades amb FAIR

Diccionari de dades, README, registre de decisions, claredat de llicència. Dipòsit a Zenodo o al teu repositori institucional amb DOI citable.

Paquet de traspàs que l'equip pot operar

Guia d'instal·lació, runbook, test del portàtil nou en verd, actualització del pla de gestió de dades. L'equip posseeix i manté la infraestructura quan sortim.

Com funciona un projecte de gestió de dades

Quatre a vuit setmanes, tres fases, sense contracte recurrent.

Step 01

Auditoria (setmana 1)

Inventariem els teus actius de dades actuals: què existeix, on viu, qui ho va tocar, què està documentat. Sortida: una anàlisi clara de la bretxa entre l'estat actual i l'estat objectiu alineat amb FAIR.

Step 02

Construcció (setmanes 2–6)

Validació d'esquema, pipelines de neteja, scripts d'anàlisi, estructura de metadades — tot entregat com a codi que el teu equip posseeix. Iteratiu, amb revisions setmanals.

Step 03

Traspàs (setmana 7–8)

Documentació, test del portàtil nou, dipòsit a l'arxiu de la teva elecció, actualització del DMP, sessió de formació amb l'equip. Després del traspàs, la infraestructura corre sense nosaltres.

Quant costa això davant de les alternatives

Contractar un data manager: 40.000–55.000 €/any, més tres mesos de cerca, més supervisió continuada. La majoria de projectes de recerca no poden justificar aquest cost recurrent. Una consultoria amb tarifa mensual: 3.000–6.000 €/mes indefinidament. Un projecte acotat de 4–8 setmanes amb Pragma: finit, el teu equip posseeix la sortida com a codi, sense contracte recurrent, sense dependència de proveïdor. El preu depèn de l'abast — la revisió de projecte et dóna la xifra exacta per al teu, sense compromís previ.

Quina pinta té 'no fer res': la deriva d'esquema no es corregeix, les figures publicades citen un dataset net que ningú pot tornar a generar, els compromisos FAIR continuen sent aspiracionals. Quan el finançador demana accés al dataset net per a un revisor, la resposta és un projecte frenètic de dues setmanes. El cost: una part de la reputació del projecte en el pitjor moment possible. El cost d'actuar ara: 60 minuts de revisió de projecte gratuïta.

Preguntes sobre gestió de dades de recerca

La gestió de dades de recerca cobreix tot el cicle de vida de les dades: recollida, estructuració, neteja, anàlisi, arxiu, reutilització. Cobrim la part d'implementació — definicions d'esquema, neteja reproduïble, metadades FAIR, dipòsit a arxiu, documentació de traspàs — per a equips de recerca sense un data manager intern dedicat.

Necessites cobrir la part de dades del teu projecte?

Explica'ns l'estat actual del teu dataset, les expectatives del finançador i el teu termini. Respondrem en 2 dies laborables amb un abast o amb les preguntes que necessitaríem resoldre.

Sol·licitar revisió de projecte