Applicazioni pratiche di machine learning/Previsioni sugli incendi: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Nessun oggetto della modifica
Nessun oggetto della modifica
Riga 71:
== Parte 3: Esplorazione dei dati ==
 
Come si vede dal seguente grafico la maggiorparte degli incendi avviene nei mesi di agosto e settembre, mentre a novembre e gennaio non ce ne sono.
 
<syntaxhighlight lang="rsplus">
forestfires %>%
group_by(month) %>%
summarise(total=sum(area)) %>%
mutate(month=reorder(month,total)) %>%
ggplot(aes(month,total)) +
geom_bar(stat="identity", fill="red") +
coord_flip()
</syntaxhighlight>
 
[[File:Forestfires.png|frame|centro]]
 
Creo una nuova variabile per poter valutare il tipo di danno:
 
<syntaxhighlight lang="rsplus">
danno <- rep(NA,nrow(forestfires))
for (i in 1:nrow(forestfires)) {
if (forestfires[i,13]==0)
danno[i]="Nessun danno"
else if (forestfires[i,13]<1)
danno[i]="Danno basso"
else if (forestfires[i,13]<25)
danno[i]="Danno moderato"
else if (forestfires[i,13]<100)
danno[i]="Danno alto"
else danno[i]="Danno molto elevato"
}
forestfires <- cbind(forestfires,danno)
</syntaxhighlight>
 
 
Come si vede dal seguente grafico i danni alti o molto elevati avvengono nei mesi di luglio, agosto e settembre.
 
<syntaxhighlight lang="rsplus">
forestfires %>%
ggplot(aes(month,area, fill=danno)) +
geom_bar(stat="identity") +
coord_flip()
</syntaxhighlight>
 
[[File:Forestfires2.png|frame|centro]]
 
== Parte 4: Modellizzazione e previsione==