Applicazioni pratiche di machine learning/Diagnosi di malattie: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Nuova pagina: ==Caricamento librerie== <syntaxhighlight lang="rsplus"> library(dplyr) library(ggplot2) library(caret) </syntaxhighlight> ==Parte 1: Dati== Il dataset "heart.csv" scaricabile...
 
Nessun oggetto della modifica
Riga 1:
{{Applicazioni pratiche di machine learning}}
==Caricamento librerie==
 
Line 43 ⟶ 44:
 
==Parte 3: Esplorazione dei dati==
 
<syntaxhighlight lang="rsplus">
df <- heart
 
#Traduco le variabili del dataset in italiano:
 
names(df)<-c("eta","sesso","tipo di dolore toracico","pressione sanguigna a riposo","colesterolo in mg/dl","glicemia a digiuno","elettrocardiogramma a riposo","frequenza cardiaca massima raggiunta","angina indotta dall'esercizio","depressione ST indotta","pendenza del segmento ST","numero di vessels","talassemia","malattia al cuore")
 
#Rendo più comprensibili i valori delle variabili:
 
df$sesso[df$sesso==0]="Femmina"
df$sesso[df$sesso==1]="Maschio"
df$sesso=as.factor(df$sesso)
 
df$`tipo di dolore toracico`[df$`tipo di dolore toracico`==0]="Angina tipica"
df$`tipo di dolore toracico`[df$`tipo di dolore toracico`==1]="Angina atipica"
df$`tipo di dolore toracico`[df$`tipo di dolore toracico`==2]="Dolore non anginale"
df$`tipo di dolore toracico`[df$`tipo di dolore toracico`==3]="Asintomatico"
df$`tipo di dolore toracico`=as.factor(df$`tipo di dolore toracico`)
 
 
df$`glicemia a digiuno`[df$`glicemia a digiuno`==0] ="minore di 120 mg/ml"
df$`glicemia a digiuno`[df$`glicemia a digiuno`==1] ="maggiore di 120 mg/ml"
df$`glicemia a digiuno`=as.factor(df$`glicemia a digiuno`)
 
 
df$`elettrocardiogramma a riposo`[df$`elettrocardiogramma a riposo`==0]="Normale"
df$`elettrocardiogramma a riposo`[df$`elettrocardiogramma a riposo`==1]="con anomalia dell'onda ST-T"
df$`elettrocardiogramma a riposo`[df$`elettrocardiogramma a riposo`==2]="Ipertrofia ventricolare sinistra"
df$`elettrocardiogramma a riposo`= as.factor(df$`elettrocardiogramma a riposo`)
 
df$`malattia al cuore`[df$`malattia al cuore`==0]="No"
df$`malattia al cuore`[df$`malattia al cuore`==1]="Si"
</syntaxhighlight>
 
Visualizzo informazioni sulle variabili numeriche come min, max, media, mediana, 1°quartile, 3° quartile ecc e per le variabili categoriche il numero di elementi di ciascun livello:
 
<syntaxhighlight lang="rsplus">
summary(df)
</syntaxhighlight>
 
 
==Parte 4: Modellizzazione e previsione==
 
 
 
[[Categoria:Applicazioni pratiche di machine learning|/Diagnosi di malattie]]