Applicazioni pratiche di machine learning/Identificazione delle pulsar: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Nuova pagina: ==Caricamento librerie== <syntaxhighlight lang="rsplus"> library(dplyr) library(ggplot2) library(caret) </syntaxhighlight> ==Parte 1: Dati== Il dataset "pulsar_stars.csv" scari...
 
Nessun oggetto della modifica
Riga 48:
==Parte 2: Domanda di ricerca ==
Si vuole costruire un modello previsionale tramite un algoritmo di machine learning per predire quali stelle sono pulsar e quali no, avendo a disposizione alcune delle variabili di ingresso elencate in precedenza.
 
==Parte 3 : Esplorazione dei dati==
 
<syntaxhighlight lang="rsplus">
pulsar_stars %>%
ggplot(aes(Stella_Pulsar, fill=Stella_Pulsar))+
geom_bar()+
scale_y_continuous(breaks=seq(0,17000,2000))+
ggtitle("Numero di stelle del campione",subtitle = "suddivise in base alla variabile Stella Pulsar")
</syntaxhighlight>
 
[[File:Numero di stelle del campione.png|frame|centro]]
 
<syntaxhighlight lang="rsplus">
pulsar_stars %>%
ggplot(aes(Mean.of.the.integrated.profile , fill=Stella_Pulsar))+
geom_histogram(binwidth = 10,colour="gray")+
ggtitle("Istogrammi della variabile Mean.of.the.integrated.profile", subtitle = "suddivisi in base alla variabile Stella Pulsar")
</syntaxhighlight>
 
[[File:Istogrammi della variabile.png|frame|centro]]
 
<syntaxhighlight lang="rsplus">
pulsar_stars %>%
ggplot(aes(Excess.kurtosis.of.the.integrated.profile, Skewness.of.the.integrated.profile , colour=Stella_Pulsar))+
geom_point()+
ggtitle("Scatterplot di 2 variabili", subtitle = "suddiviso in base alla variabile Stella Pulsar")
</syntaxhighlight>
 
[[File:Scatterplot di 2 variabili.png|frame|centro]]