DSC_0152.jpgDSC_0082.jpgDSC_0188.jpgDSC_0054 1.jpgDSC_0058.jpgDSC_0202.jpgDSC_0084 2.jpgDSC_0057.jpgDSC_0059.jpgDSC_0044 1.jpgDSC_0189.jpg

Reproducible Research

Che cosa è la Reproducible Research? [1]

  • Reproducible research permette al lettore dell'articolo scientifico di replicare autonomamente l'intera analisi.
  • Fa uso del paradigma Literate Programming (inventato da Donald Knuth) per combinare i dait di input, il codice sorgente, la descrizione literate delle procedure adottate e dei risultati conseguiti (tabelle, grafici, ecc.) in un documento unico che, al contempo, descrive e riproduce l'analisi.
  • Come regola generale, si può dire che un articolo segue i dettami della Reproducible Research se l'autore fornisce al lettore tutte le informazioni necessarie per replicare l'analisi di cui parla.
    • i dati (raw) originali
    • metodi ed algoritmi esaurientemente descritti
    • i metodi possono essere riprodotti
    • l'analisi può essere estesa ad altri dataset indipendenti

La reproducible Research può essere di aiuto, ad esempio [2]:

  • nel riprodurre nuovamente figure e tabelle nelle revisioni del report, ricreando i primi risultati del lavoro anche negli ultimi stage della ricerca;
  • nel permettere ad altre persone, che vogliono fare ricerca nel medesimo settore, di ripartire facilmente dall'attuale stato dell'arte, invece di spndere tempo e risorse per cercare di capire, leggendo gli articoli , che cosa è stato fatto e come;
  • perchè semplifica il confronto tra metodi nuovi e metodi esistenti ed i risultati possono essere comparati più facilmente, essendo più sicuri dell''implementazione del lavoro.

Fonti: [1] [2]

Il mio approccio con MarkDown

Il mio primo contatto con la Reproducible Research l'ho avuto allo UseR meeting del 2011 a Sheffield. La cosa mi interessò ma non ebbi tempo per approfondire l'argomento. Recentemente invece ho partecipato al primo Italian BioR day, che si è tenuto al Parco Tecnologico Padano di Lodi il 30 Novembre scorso, ed in quell'occasione ho avuto modo di ascoltare la talk di Paolo Sonego, di CBM, dal titolo "Reproducible Research in High-Throughput Biology: A Case Study". In quell'occasione Sonego ci ha introdotti, tra le varie cose, alla Reproducible Research e ad un linguaggio di MarkUp tanto facile da usare, quanto utile in questo contesto. Tale linguaggio, che si chiama MarkDown, è già implementato in RStudio, un software oramai utilizzatissimo da chi lavora con R.

Lavorando dentro RStudio è possibile scrivere il codice della propria analisi, copiarlo un un file .md con pochi e semplici passaggi, e generare in un attimo un report sulla propria analisi. Due grandi vantaggi: il primo è che il tempo per andare dall'analisi al report è praticamente azzerato, inoltre qualunque modifica sui dati studiati può essere immediatamente traferita nel report inserendola nel flusso di lavora già impostato e descritto. Il secondo è che, chiunque, in possesso di dati analizzabili in modo analogo, caricando il file .md in RStudio, potrà essere in grado di riprodurre tutto ciò che è stato esposto nel resport stesso.

MarkDown si impara davvero in pochisismo tempo, con poco sforzo.

"m. calderisi @ chemiometria.it", used under a Attribution-NonCommercial-ShareAlike license
joomla template by a4joomla
Privacy Policy