Utente:G273Y/Sandbox: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
G273Y (discussione | contributi)
G273Y (discussione | contributi)
Riga 54:
categorie, marchi, aziende questo riduce il file a 76.6MB.
 
'''Caricamento dei dati:'''<br>
dfTrainHistory <- read.csv("trainHistory.csv")
dfTestHistory <- read.csv("testHistory.csv")
Riga 62:
dfTransactions <- merge(dfTransactions,dfTrainHistory, by =c("id","chain"))
 
'''Panoramica dei dati:'''<br>
# 1. Rows and colums in transaction merged with history
dim(dfTransactions)
Riga 77:
[[File:Correlations.png|centro|Non ci sono variabili collineari essendo il coefficiente di correlazione tra le variabili numeriche sempre basso]]
 
'''Pulizia dei dati:'''<br>
 
Si cercano eventuali dati mancanti identificati da NA, -1 oppure 999 :