Applicazioni pratiche di machine learning/Previsioni sul livello del mare: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
mNessun oggetto della modifica
esplorazione dei dati
Riga 53:
 
==Parte 2: Esplorazione dei dati==
Il sommario delle 2 stazioni "Venezia punta della salute" e "Venezia II" con minimo, massimo, media, mediana ecc. è il seguente:
 
<syntaxhighlight lang="rsplus">
print("Venezia punta della salute")
summary(Venezia_punta_della_salute_168[,c(1,2)])
print("Venezia II")
summary(Venezia_II_2100[,c(1,2)])
</syntaxhighlight>
 
[1] "Venezia punta della salute"
Anno Altezza
Min. :1909 Min. :6900
1st Qu.:1935 1st Qu.:6994
Median :1957 Median :7060
Mean :1957 Mean :7051
3rd Qu.:1980 3rd Qu.:7114
Max. :2000 Max. :7171
[1] "Venezia II"
Anno Altezza
Min. :2002 Min. :6857
1st Qu.:2005 1st Qu.:6931
Median :2008 Median :6971
Mean :2008 Mean :6979
3rd Qu.:2012 3rd Qu.:7023
Max. :2015 Max. :7108
 
<syntaxhighlight lang="rsplus">
df %>%
ggplot(aes(Anno,value, colour=Stazioni)) +
geom_line() +
scale_x_continuous(breaks=seq(1906,2016,10))+
ylab("Altezza annuale del mare in millimetri") +
xlab("Anno") +
ggtitle("Innalzamento annuale del mare in 2 stazioni di Venezia dal 1909 al 2015",subtitle = "in millimetri rispetto a 7m al di sotto del livello del mare")
</syntaxhighlight>
 
[[File:Innalzamento annuale del mare in 2 stazioni di Venezia.png|frame|centro]]
 
Per studiare la relazione tra le 2 variabili anno e altezza annuale si tracciano in figura 2 scatterplot che è un tipo di grafico in cui ogni punto rappresenta una singola osservazione di anno e altezza annuale.
Si nota dai grafico che c'è una relazione moderata tra anno e altezza annuale ma la relazione non è lineare cioè una linea retta non si adatterebbe ai dati ma una linea curva ottenuta tramite la tecnica dello Smoothing con la [[en:local regression| local regression]] si adatta meglio ai dati. In tal modo si evidenzia un trend significativo dei dati, attenuando il rumore. In altri termini sommando graficamente lo smooth trend e il rumore si ottiene l'andamento temporale della variazione di altezza.La zona grigia lungo la curva di smoothing rappresenta l'intervallo di confidenza al 95% che la curva rappresenti l'effettivo trend dei dati. Le 2 linee curve in blu evidenziano che l'altezza del livello del mare tende a diventare costante in entrambi i casi.
 
<syntaxhighlight lang="rsplus">
Venezia_punta_della_salute_168 %>%
ggplot(aes(Anno,Altezza)) +
geom_point() +
geom_smooth()+
ylab("Altezza annuale del mare in millimetri") +
xlab("Anno") +
ggtitle("Livello annuale del mare nella stazione di Venezia punta della salute",subtitle = "in millimetri rispetto a 7m al di sotto del livello del mare")
</syntaxhighlight>
 
[[File:Livello annuale del mare a Venezia punta della salute.png|frame|centro]]
 
<syntaxhighlight lang="rsplus">
Venezia_II_2100 %>%
ggplot(aes(Anno,Altezza)) +
geom_point() +
geom_smooth()+
ylab("Altezza annuale del mare in millimetri") +
xlab("Anno") +
ggtitle("Livello annuale del mare nella stazione di Venezia II",subtitle = "in millimetri rispetto a 7m al di sotto del livello del mare")
</syntaxhighlight>
 
[[File:Livello annuale del mare a Venezia II.png|frame|centro]]
 
==Parte 3 : Modellizzazione e previsione==