Esempi di statistica descrittiva e inferenziale/Analisi del proprio genoma: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Nuova pagina: {{Esempi di statistica descrittiva e inferenziale}} ==Caricamento librerie== <syntaxhighlight lang="rsplus"> library(dplyr) library(ggplot2) library(stringr) </syntaxhighlight>...
 
Nessun oggetto della modifica
Riga 23:
* il genotipo formato da 2 lettere tra le seguenti: adenina (A), citosina (C), guanina (G), e timina (T).
 
Un signore ha reso pubblico il proprio dataset di SNP fornito da 23andME ed è possibile scaricarlo da qui : https://www.kaggle.com/zusmani/mygenome
 
 
Riga 45:
5 rs115093905 1 787173 GG
6 rs11240777 1 798959 GG
 
E' possibile scaricare un dataset di links a pubblicazioni scientifiche relative ad SNP contenenti l'allele di rischio collegato ad una certa malattia o predisposizione.
In tal modo unendo i 2 datasets si potrà sapere se il proprio genotipo contiene quel particolare allele di rischio relativo ad una specifica malattia.
 
 
'''Caricamento dataset:'''
 
<syntaxhighlight lang="rsplus">
options(timeout = 300)
updated_gwas_data <- as.data.frame(makeCurrentGwascat())
</syntaxhighlight>
 
 
Le variabili contenute nel dataset di pubblicazioni scientifiche sono le seguenti:
 
<syntaxhighlight lang="rsplus">
names(updated_gwas_data)
</syntaxhighlight>
 
 
[1] "seqnames" "start"
[3] "end" "width"
[5] "strand" "DATE.ADDED.TO.CATALOG"
[7] "PUBMEDID" "FIRST.AUTHOR"
[9] "DATE" "JOURNAL"
[11] "LINK" "STUDY"
[13] "DISEASE.TRAIT" "INITIAL.SAMPLE.SIZE"
[15] "REPLICATION.SAMPLE.SIZE" "REGION"
[17] "CHR_ID" "CHR_POS"
[19] "REPORTED.GENE.S." "MAPPED_GENE"
[21] "UPSTREAM_GENE_ID" "DOWNSTREAM_GENE_ID"
[23] "SNP_GENE_IDS" "UPSTREAM_GENE_DISTANCE"
[25] "DOWNSTREAM_GENE_DISTANCE" "STRONGEST.SNP.RISK.ALLELE"
[27] "SNPS" "MERGED"
[29] "SNP_ID_CURRENT" "CONTEXT"
[31] "INTERGENIC" "RISK.ALLELE.FREQUENCY"
[33] "P.VALUE" "PVALUE_MLOG"
[35] "P.VALUE..TEXT." "OR.or.BETA"
[37] "X95..CI..TEXT." "PLATFORM..SNPS.PASSING.QC."
[39] "CNV" "MAPPED_TRAIT"
[41] "MAPPED_TRAIT_URI" "STUDY.ACCESSION"
[43] "GENOTYPING.TECHNOLOGY"