Utente:G273Y/Sandbox: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
G273Y (discussione | contributi)
G273Y (discussione | contributi)
Nessun oggetto della modifica
Riga 90:
Si vuole prevedere quali clienti ritorneranno (durante o dopo il periodo promozionale) per acquistare nuovamente la stessa offerta e quindi quali clienti possono essere considerati “validi clienti" e con quale probabilità ripeteranno l'acquisto.
 
===Parte 3: Esplorazione dei datiModellizzazione===
 
 
===Parte 4: Modellizzazione===
I dati per costruire il modello sono quelli antecedenti al 01-04-2013 e sono chiamati traning set. Questa data corrispondono al 60% dei dati in base alla variabile offerdate, mentre quelli relativi al periodo successivo costituiscono il validation set.
 
Line 136 ⟶ 133:
verbose = T)
 
===Parte 54: Previsione===
Dopo aver ottenuto il modello, è possibile prevedere quali sono i clienti validi calcolando la probabilità di ripetere l'acquisto dell'offerta sia sul training set che sulla validation set
calcolando Accuracy, AUC, Precision, Recall.
Line 207 ⟶ 204:
## Boosting AUC in validation set
 
 
===Parte 45: ModellizzazioneConclusione ===
Ora è possibile sapere quali sono i clienti validi nel '''testing set''':
 
p1 = predict(gbm_model,newdata = dfTestHistory, n.trees = 1000)
df <- data.frame(idCustomer = dfTestHistory$id,repeatProbability = p1)
df <-df %>%
group_by(idCustomer) %>%
summarise(repeatProbability=mean(repeatProbability),ValuedShopper
=as.factor(ifelse(repeatProbability>0.65,"Yes","No")))
#first 6 customers with probability to repeat purchase:
head(df)
 
df %>%
ggplot(aes(idCustomer,repeatProbability, colour= ValuedShopper)) +
geom_point() +
ggtitle("Valued Shoppers a probability of more ", subtitle="than 65% to repeat the purchase of offers")
 
[[File:Validi clienti.png|centro|Validi clienti in celeste aventi una probabilità superiore al 65% di ripetere l'acquisto]]
[[Categoria:Applicazioni pratiche di machine learning|Previsione di vendite future]]