Universitą degli studi di Pavia
Contenuto della pagina
Cremaschi cv
Dottorando in Genetica, Biologia Molecolare e Cellulare - Ciclo XXVIII.
Supervisore scientifico: Dr.ssa Silvia Bione
Telefono: ++39 0382 546362
E-mail: paolo.cremaschi01@universitadipavia.it
CV
Formazione
2012 - Oggi UNIVERSITĄ DEGLI STUDI DI PAVIA Dottorato di ricerca in scienze genetiche e biomolecolari
Responsabile: Dott.ssa Silvia Bione
2012 - Laureato in Biologia - Facoltą di Scienze MM. FF. NN. - Universitą di Pavia con punti 103/110 – Laurea quinquennale vecchio ordinamento conseguito secondo la normativa in vigore anteriormente al D.M. 509/99.
Titolo della tesi: Ruolo del gene PRPF19 nel nucleo: sviluppo di uno strumento bioinformatico per l’identificazione e l’analisi di pathway funzionali nucleari.
1990 – 1996 UNIVERSITĄ DEGLI STUDI DI PAVIA Studente di Biologia - Facoltą di Scienze MM. FF. NN. - Universitą di Pavia.
Esperienza professionale nell’ambito della ricerca
2012 Istituto di Genetica molecolare – CNR, assegnista di ricerca e dottorando presso il laboratorio di Biologia Computazionale diretto dalla Dott.ssa Silvia Bione. Principale attivitą di ricerca: Sviluppo di uno strumento bioinformatico per l’analisi dei dati di co-espressione.
2011- 2012 Istituto di Genetica molecolare – CNR, studente presso il laboratorio di Biologia Computazionale diretto dalla Dott.ssa Silvia Bione. Principale attivitą di ricerca: Creazione di un modello di analisi della co-espressione.
Esperienza professionale nell’ambito della consulenza informatica
2011 evris Italia, quadro della divisione Industria. Principale attivitą: coordinatore di un gruppo di sviluppo per applicazioni di Business Intelligence.
2010 – 2011 evris Italia, consulente indipendente della divisione Industria. Principale attivitą: coordinatore di un gruppo di sviluppo per applicazioni distribuite per la gestione dei clienti e l’organizzazione della forza vendita.
2003 – 2010 ZeroUno informatica, consulente indipendente. Principale attivitą: analista per lo sviluppo di database multi-dimensionali per l’analisi dei dati finanziari e coordinatore del relativo gruppo di supporto.
2001 – 2003 ZeroUno informatica, consulente indipendente. Principale attivitą: analista e sviluppatore per numerosi progetti della divisione Marketing.
2000 – 2003 I.T.I. Information Technology Italia, sviluppatore senior. Principale attivitą: analista e sviluppatore per numerosi progetti della divisone Marketing e Vendite.
2000 – 2003 RS Ricerca e Sviluppo, sistemista e sviluppatore. Principale attivitą: installazioni di reti e sviluppo di progetti per l’integrazione di sistemi multi-piattaforma in numerose industrie del settore siderurgico.
Competenze tecniche di laboratorio
Costruzione di mutanti per l’espressione di proteine ricombinanti: PCR, Trasfezione, Miniprep, estrazione di DNA, purificazione del DNA in gradienti di cesio, gel di sequenza, selezione dei mutanti tramite ampicillina
Culture cellulari: cellule umane (HeLa) e murine (3T3)
Immunofluorescenza: microscopia e microscopia confocale
Competenze tecniche ed informatiche
• Sistemi Operativi
LINUX: RedHat, Fedora, Ubuntu
Microsoft: MS-DOS, Windows NT / 95 / 98 / XP / 2000 / 2003 / Windows 7
Mac OS: da versione X
• Linguaggi di Programmazione
Visual Studio: Visual Basic: da 3.0 a .NET 2008, C# da .Net
Office Automation: VBA, VB Script
Java: Java, JScript
Lisp: common lisp, Allegro Common Lisp
SQL: T-SQL, PL/SQL
R: (da versione 2.9 a 2.14) ho lavorato con i package base, xtable, stat, Rcurl, RJSON, XML, plyr, arules, Rweka, lattice, VennDiagram, plotrix, splines, RSQLite, RODBC, RPostgreSQL, RMySQL, multicore, snow
R/Bioconductor: ho lavorato con i package GEOquery, ArrayExpress, MADAM, genefilter, Biobase, geneplotter, AnnotationDbi, puma, affyQCReport, limma, multtest, PGSEA, GSEABase, GenePattern, DAVIDQuery, affycoretools, GOSim, igraph
HTML
XML: XML, DTD, XSL
• Database relazionali
Sybase
SQL Server: da versione 6.5 a 2008
SS Analysis Server: da versione 2000
Access: da versione 2.0 a 2010
Oracle: versione 11
MySQL: versione 5
PostgreSQL: da versione 8.1 a 9.1.3
SQLite: versione 3
• Banche dati di interesse biologico
DAVID Web Site: analisi di Functional Annotation Clustering, Functional Annotation Chart, Functional Annotation Table, Gene Functional Classification, Gene name batch viewer, Gene ID conversion
DAVID Application Program Interface: accesso alla banca dati e alle funzioni di analisi sia tramite l’R package DAVIDQuery sia direttamente tramite l’R package RCurl
Gene Expression Omnibus (GEO) web site: query di Dataset, Gene profile e Platform, analisi dei geni differenzialmente espressi, analisi dei cluster di geni e della data quality
Gene Expression Omnibus (GEO) Application Program Interface: accesso alla banca dati tramite l’R package GEOquery
ArrayExpress web site: query dei dataset e analisi dei geni differenzialmente espressi
ArrayExpress Application Program Interface: accesso alla banca dati tramite l’R package ArrayExpress e alle funzioni di analisi tramite l’R package RCurl
Gene Ontology (GO) web site: query dei termini tramite la search engine AmiGO e analisi dei grafi relativi a processi biologici, componenti cellulari e funzioni molecolari
Gene Ontology (GO) Application Program Interface: accesso alla banca dati GO tramite l’R package GOSim e analisi algoritmica dei grafi
Kyoto Enciclopedia of Genes and Genomes (KEGG) web site: analisi di pathway funzionali
NetView web site: analisi dei grafi Netview, Gene Ontology prediction e Gene Signature
Molecular Signatures Database (MSigDB) Application Program Interface: analisi di liste di geni tramite l’R package PGSEA e GSEABase
GRAIL e GraphWiz: analisi di liste di geni
Cytoscape: analisi di pathway funzionale tramite rappresentazione a grafi
• Applicazioni e configurazione di ambienti per il calcolo parallelo
SQL Server: parallelizzazione dei processi di ETL (SSIS) ed ottimizzazione dell’esecuzione di query parallele tramite la configurazione dell’Execution Plan.
SS Analysis Server: ottimizzazione dei processi di caricamento di cubi OLAP
Windows: sviluppo, configurazione ed ottimizzazione di applicazioni basate sul multithreading
R: sviluppo ed ottimizzazione di funzioni per il calcolo parallelo con i package “multicore” (su computer multi-core) e “snow” (su cluster e reti di computer)
Progetto di ricerca
Analisi dei segnali biologici nei dati ottenuti da esperimenti "high-throughput"
Sto svolgendo il dottorato di ricerca nel laboratorio di biologia computazionale dell’Istituto di Genetica Molecolare IGM – CNR sotto la supervisione della Dott.ssa Silvia Bione.
La mia attivitą di ricerca č rivolta all’integrazione di dati derivanti dalle numerose “omics technologies” pubblicamente disponibili. In particolare mi occupo dell’analisi dei risutati di esperimenti di “high-throughtput” attraverso lo siluppo di algoritmi di “machine learning” e di “data mining”.
Attualmente la mia attivitą riguarda lo sviluppo di uno strumento bioinformatico per l’analisi della co-espressione di geni e l’identificazione di pathway funzionali al fine di renderlo disponibile in rete (intranet CNR e internet).
Lo sviluppo di tale strumento include:
- lo sviluppo di un processo di ETL (Extract Transform and Load)
- sviluppo di una banca dati strutturata
- creazione e ottimizzazione di un algoritmo per l’analisi dei dati
- sviluppo di una interfaccia Web per l’accesso pubblico allo strumento
- ottimizzazione dell’elaborazione tramite la parallelizzazione dei processi
Come parte di questo progetto sto collaborando con l’Istituto di Matematica Applicata e Tecnologie Informatiche IMATI - CNR al fine implementare l’algoritmo per l’analisi della co-espressione in linguaggi che permettano di sfruttare pienamente architetture per il calcolo parallelo (Fortran e C++).
Pubblicazioni
Comunicazioni a congresso
Cremaschi P, Rovida S, Sacchi L, Lisa A, Montecucco A, Biamonti G, Bione S, Sacchi G – 2012 Inside complex disorder pathways through gene expression analysis (oral comunication)
ATTI Convegno Intelligence Data Analysis in Biomedicine and Pharmacology IDAMAP Pavia (PV) in stampa
Cremaschi P, Rovida S, Sacchi L, Lisa A, Montecucco A, Biamonti G, Bione S, Sacchi G – 2012 CorrelaGenes: a new tool for the interpretation of the human transcriptome (poster)
ATTI Convegno NETTAB Como (CO) in stampa
R. Rossi, E. Savini, P. Cremaschi, F. Weighardt, G. Biamonti, G. Ciarrocchi e A. Montecucco - 1995 Dissezione funzionale della DNA ligasi I di mammifero: identificazione dei segnali coinvolti nella localizzazione nucleare e subnucleare della proteina (oral comunication)
ATTI Convegno Congiunto ABCD-AGI-SIBBM-SIMGBM, Montesilvano Lido (PE), 5.25, pag. 91.
Supervisore scientifico: Dr.ssa Silvia Bione
Telefono: ++39 0382 546362
E-mail: paolo.cremaschi01@universitadipavia.it
CV
Formazione
2012 - Oggi UNIVERSITĄ DEGLI STUDI DI PAVIA Dottorato di ricerca in scienze genetiche e biomolecolari
Responsabile: Dott.ssa Silvia Bione
2012 - Laureato in Biologia - Facoltą di Scienze MM. FF. NN. - Universitą di Pavia con punti 103/110 – Laurea quinquennale vecchio ordinamento conseguito secondo la normativa in vigore anteriormente al D.M. 509/99.
Titolo della tesi: Ruolo del gene PRPF19 nel nucleo: sviluppo di uno strumento bioinformatico per l’identificazione e l’analisi di pathway funzionali nucleari.
1990 – 1996 UNIVERSITĄ DEGLI STUDI DI PAVIA Studente di Biologia - Facoltą di Scienze MM. FF. NN. - Universitą di Pavia.
Esperienza professionale nell’ambito della ricerca
2012 Istituto di Genetica molecolare – CNR, assegnista di ricerca e dottorando presso il laboratorio di Biologia Computazionale diretto dalla Dott.ssa Silvia Bione. Principale attivitą di ricerca: Sviluppo di uno strumento bioinformatico per l’analisi dei dati di co-espressione.
2011- 2012 Istituto di Genetica molecolare – CNR, studente presso il laboratorio di Biologia Computazionale diretto dalla Dott.ssa Silvia Bione. Principale attivitą di ricerca: Creazione di un modello di analisi della co-espressione.
Esperienza professionale nell’ambito della consulenza informatica
2011 evris Italia, quadro della divisione Industria. Principale attivitą: coordinatore di un gruppo di sviluppo per applicazioni di Business Intelligence.
2010 – 2011 evris Italia, consulente indipendente della divisione Industria. Principale attivitą: coordinatore di un gruppo di sviluppo per applicazioni distribuite per la gestione dei clienti e l’organizzazione della forza vendita.
2003 – 2010 ZeroUno informatica, consulente indipendente. Principale attivitą: analista per lo sviluppo di database multi-dimensionali per l’analisi dei dati finanziari e coordinatore del relativo gruppo di supporto.
2001 – 2003 ZeroUno informatica, consulente indipendente. Principale attivitą: analista e sviluppatore per numerosi progetti della divisione Marketing.
2000 – 2003 I.T.I. Information Technology Italia, sviluppatore senior. Principale attivitą: analista e sviluppatore per numerosi progetti della divisone Marketing e Vendite.
2000 – 2003 RS Ricerca e Sviluppo, sistemista e sviluppatore. Principale attivitą: installazioni di reti e sviluppo di progetti per l’integrazione di sistemi multi-piattaforma in numerose industrie del settore siderurgico.
Competenze tecniche di laboratorio
Costruzione di mutanti per l’espressione di proteine ricombinanti: PCR, Trasfezione, Miniprep, estrazione di DNA, purificazione del DNA in gradienti di cesio, gel di sequenza, selezione dei mutanti tramite ampicillina
Culture cellulari: cellule umane (HeLa) e murine (3T3)
Immunofluorescenza: microscopia e microscopia confocale
Competenze tecniche ed informatiche
• Sistemi Operativi
LINUX: RedHat, Fedora, Ubuntu
Microsoft: MS-DOS, Windows NT / 95 / 98 / XP / 2000 / 2003 / Windows 7
Mac OS: da versione X
• Linguaggi di Programmazione
Visual Studio: Visual Basic: da 3.0 a .NET 2008, C# da .Net
Office Automation: VBA, VB Script
Java: Java, JScript
Lisp: common lisp, Allegro Common Lisp
SQL: T-SQL, PL/SQL
R: (da versione 2.9 a 2.14) ho lavorato con i package base, xtable, stat, Rcurl, RJSON, XML, plyr, arules, Rweka, lattice, VennDiagram, plotrix, splines, RSQLite, RODBC, RPostgreSQL, RMySQL, multicore, snow
R/Bioconductor: ho lavorato con i package GEOquery, ArrayExpress, MADAM, genefilter, Biobase, geneplotter, AnnotationDbi, puma, affyQCReport, limma, multtest, PGSEA, GSEABase, GenePattern, DAVIDQuery, affycoretools, GOSim, igraph
HTML
XML: XML, DTD, XSL
• Database relazionali
Sybase
SQL Server: da versione 6.5 a 2008
SS Analysis Server: da versione 2000
Access: da versione 2.0 a 2010
Oracle: versione 11
MySQL: versione 5
PostgreSQL: da versione 8.1 a 9.1.3
SQLite: versione 3
• Banche dati di interesse biologico
DAVID Web Site: analisi di Functional Annotation Clustering, Functional Annotation Chart, Functional Annotation Table, Gene Functional Classification, Gene name batch viewer, Gene ID conversion
DAVID Application Program Interface: accesso alla banca dati e alle funzioni di analisi sia tramite l’R package DAVIDQuery sia direttamente tramite l’R package RCurl
Gene Expression Omnibus (GEO) web site: query di Dataset, Gene profile e Platform, analisi dei geni differenzialmente espressi, analisi dei cluster di geni e della data quality
Gene Expression Omnibus (GEO) Application Program Interface: accesso alla banca dati tramite l’R package GEOquery
ArrayExpress web site: query dei dataset e analisi dei geni differenzialmente espressi
ArrayExpress Application Program Interface: accesso alla banca dati tramite l’R package ArrayExpress e alle funzioni di analisi tramite l’R package RCurl
Gene Ontology (GO) web site: query dei termini tramite la search engine AmiGO e analisi dei grafi relativi a processi biologici, componenti cellulari e funzioni molecolari
Gene Ontology (GO) Application Program Interface: accesso alla banca dati GO tramite l’R package GOSim e analisi algoritmica dei grafi
Kyoto Enciclopedia of Genes and Genomes (KEGG) web site: analisi di pathway funzionali
NetView web site: analisi dei grafi Netview, Gene Ontology prediction e Gene Signature
Molecular Signatures Database (MSigDB) Application Program Interface: analisi di liste di geni tramite l’R package PGSEA e GSEABase
GRAIL e GraphWiz: analisi di liste di geni
Cytoscape: analisi di pathway funzionale tramite rappresentazione a grafi
• Applicazioni e configurazione di ambienti per il calcolo parallelo
SQL Server: parallelizzazione dei processi di ETL (SSIS) ed ottimizzazione dell’esecuzione di query parallele tramite la configurazione dell’Execution Plan.
SS Analysis Server: ottimizzazione dei processi di caricamento di cubi OLAP
Windows: sviluppo, configurazione ed ottimizzazione di applicazioni basate sul multithreading
R: sviluppo ed ottimizzazione di funzioni per il calcolo parallelo con i package “multicore” (su computer multi-core) e “snow” (su cluster e reti di computer)
Progetto di ricerca
Analisi dei segnali biologici nei dati ottenuti da esperimenti "high-throughput"
Sto svolgendo il dottorato di ricerca nel laboratorio di biologia computazionale dell’Istituto di Genetica Molecolare IGM – CNR sotto la supervisione della Dott.ssa Silvia Bione.
La mia attivitą di ricerca č rivolta all’integrazione di dati derivanti dalle numerose “omics technologies” pubblicamente disponibili. In particolare mi occupo dell’analisi dei risutati di esperimenti di “high-throughtput” attraverso lo siluppo di algoritmi di “machine learning” e di “data mining”.
Attualmente la mia attivitą riguarda lo sviluppo di uno strumento bioinformatico per l’analisi della co-espressione di geni e l’identificazione di pathway funzionali al fine di renderlo disponibile in rete (intranet CNR e internet).
Lo sviluppo di tale strumento include:
- lo sviluppo di un processo di ETL (Extract Transform and Load)
- sviluppo di una banca dati strutturata
- creazione e ottimizzazione di un algoritmo per l’analisi dei dati
- sviluppo di una interfaccia Web per l’accesso pubblico allo strumento
- ottimizzazione dell’elaborazione tramite la parallelizzazione dei processi
Come parte di questo progetto sto collaborando con l’Istituto di Matematica Applicata e Tecnologie Informatiche IMATI - CNR al fine implementare l’algoritmo per l’analisi della co-espressione in linguaggi che permettano di sfruttare pienamente architetture per il calcolo parallelo (Fortran e C++).
Pubblicazioni
Comunicazioni a congresso
Cremaschi P, Rovida S, Sacchi L, Lisa A, Montecucco A, Biamonti G, Bione S, Sacchi G – 2012 Inside complex disorder pathways through gene expression analysis (oral comunication)
ATTI Convegno Intelligence Data Analysis in Biomedicine and Pharmacology IDAMAP Pavia (PV) in stampa
Cremaschi P, Rovida S, Sacchi L, Lisa A, Montecucco A, Biamonti G, Bione S, Sacchi G – 2012 CorrelaGenes: a new tool for the interpretation of the human transcriptome (poster)
ATTI Convegno NETTAB Como (CO) in stampa
R. Rossi, E. Savini, P. Cremaschi, F. Weighardt, G. Biamonti, G. Ciarrocchi e A. Montecucco - 1995 Dissezione funzionale della DNA ligasi I di mammifero: identificazione dei segnali coinvolti nella localizzazione nucleare e subnucleare della proteina (oral comunication)
ATTI Convegno Congiunto ABCD-AGI-SIBBM-SIMGBM, Montesilvano Lido (PE), 5.25, pag. 91.