Applicazioni pratiche di machine learning/Previsioni sugli incendi: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Nuova pagina: ==Caricamento librerie== <syntaxhighlight lang="rsplus"> library(dplyr) library(ggplot2) library(h2o) </syntaxhighlight> == Parte 1: Dati == Il dataset "forestfires.csv", scar...
(Nessuna differenza)

Versione delle 07:07, 1 feb 2020

Caricamento librerie

 library(dplyr)
 library(ggplot2)
 library(h2o)


Parte 1: Dati

Il dataset "forestfires.csv", scaricabile da qui: https://archive.ics.uci.edu/ml/datasets/forest+fires è costituito da 513 righe e 13 variabili e contiene i dati sugli incendi boschivi provenienti dal parco naturale Montesinho, dal Trás-os-Montes regione nord-orientale del Portogallo . Le 13 variabili in questione del dataset sono le seguenti :

  • X - Coordinata spaziale dell'asse X all'interno della mappa del parco Montesinho con valori compresi tra 1 e 9
  • Y - Coordinata spaziale dell'asse Y all'interno della mappa del parco Montesinho con valori compresi tra 2 e 9
  • month - mese dell'anno: da "gen" a "dec"
  • day - giorno della settimana: da "mon" a "sun"
  • FFMC - Indice FFMC del sistema FWI: 18.7 a 96.20
  • DMC - Indice DMC del sistema FWI: da 1.1 a 291.3
  • DC - Indice DC del sistema FWI: da 7,9 a 860,6
  • ISI - Indice ISI del sistema FWI: da 0,0 a 56,10
  • temp - temperatura in gradi Celsius: da 2,2 a 33,30
  • RH - umidità relativa in %: da 15,0 a 100
  • wind - velocità del vento in km/h: da 0.40 a 9.40
  • rain - pioggia esterna in mm/m^2: da 0,0 a 6,4
  • area - l'area bruciata della foresta (in ha-ettari): da 0,00 a 1090,84 (questa variabile di output è molto proiettata verso lo 0, quindi potrebbe avere senso modellare con la trasformazione del logaritmo log(X+1)).

Il Forest Fire Weather Index (FWI) è il sistema canadese per la classificazione del pericolo di incendio e comprende sei componenti : FFMC rappresenta il contenuto di umidità dei rifiuti di superficie e influenza l'accensione e la propagazione del fuoco, DMC e DC rappresentano il contenuto di umidità degli strati organici superficiali e profondi che influenzano l'intensità del fuoco. L'ISI è un punteggio correlato alla diffusione della velocità del fuoco.

Parte 2: Domanda di ricerca

Si vuole prevedere l'area bruciata in ettari dagli incendi boschivi. Tale conoscenza è particolarmente utile per la gestione delle risorse antincendio e quindi per definire gli obiettivi prioritari delle autobotti e degli equipaggiamenti di terra (pianificazione delle risorse).

Parte 3: Esplorazione dei dati

Parte 4: Modellizzazione e previsione