“Analisi genomica scalabile: tutorial GWAS con Hail” è il webinar scientifico che si terrà il 30 maggio dalle ore 12 alle ore 13 a cura di Francesco Versaci e Giovanni Busonera del CRS4.
Abstract
In questa presentazione sarà illustrato un workflow completo per l’esecuzione di uno studio di associazione genome-wide (GWAS) utilizzando Hail, una libreria scalabile ed efficiente per l’analisi genetica. Il tutorial mostrerà le principali strutture dati e funzionalità fornite dalla libreria, per poter manipolare i dati genomici al fine di applicare le principali operazioni necessarie in uno studio GWAS.
La presentazione inizierà con una breve panoramica sul calcolo distribuito e sull’architettura e configurazione di Hail (cluster Spark + object storage S3), per poi proseguire con una dimostrazione pratica del suo utilizzo. In dettaglio vedremo:
• il caricamento di dati genomici e metadati dei sample;
• il controllo di qualità;
• l’esecuzione dell’associazione con la gestione delle covariate.
L’obiettivo è fornire ai partecipanti una visione pratica del processo, con esempi di codice.
Bio
Giovanni Busonera ha conseguito la laurea specialistica in Ingegneria Elettronica presso l’Università degli Studi di Cagliari nel 2004 e il dottorato di ricerca in Ingegneria Elettronica ed Informatica presso la stessa Università nel 2008. Durante il dottorato ha partecipato ad una Internship al Microsoft Research Embedded Group presso Redmond. Dal 2008 è ricercatore al CRS4 in cui si è occupato di programmazione distribuita, accelerazione hardware per il calcolo parallelo e sviluppo di classificatori di immagini istopatologiche basati su neural network. Attualmente si occupa di analisi di dati e metodi statistici per applicazioni biomediche e la modellazione del traffico nelle reti.
Francesco Versaci ha conseguito la laurea in Ingegneria Informatica e il dottorato di ricerca in Ingegneria dell’Informazione presso l’Università degli Studi di Padova, su temi legati al calcolo ad alte prestazioni. Ha successivamente svolto un post-dottorato triennale presso il Politecnico di Vienna, approfondendo ulteriormente le ricerche sul calcolo parallelo e ad alte prestazioni. Dal 2015 è ricercatore presso il CRS4, dove si occupa di scalabilità e gestione di grandi moli di dati, con un focus particolare sulle applicazioni biomediche e sul deep learning.
Per seguire il seminario, ci si può collegare al link: https://meet.google.com/vaa-oczm-yjy