Utente:G273Y/Sandbox: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
G273Y (discussione | contributi)
Nuova pagina: == Sommario == :'''/Copertina/''' # {{modulo|Applicazioni pratiche di machine learning/Business Analytics}} #*{{modulo|Applicazioni pratiche di machine learning/Business Analy...
 
G273Y (discussione | contributi)
Nessun oggetto della modifica
Riga 3:
 
# {{modulo|Applicazioni pratiche di machine learning/Business Analytics}}
#*{{modulo|Applicazioni pratiche di machine learning/Business Analytics/PrevisioniPrevisione di venditavendite future }}
#*{{modulo|Applicazioni pratiche di machine learning/Business Analytics/Target dei clienti }}
 
Riga 12:
 
[[Categoria:Intelligenza artificiale| ]]
 
== Previsione di vendite future ==
 
===Caricamento librerie ===
library(dplyr)
library(gbm)
library(ggplot2)
 
===Parte 1: Dati===
Avendo un set di dati temporali composto da dati di vendita giornalieri,gentilmente fornito da una delle più grandi società di software russe - 1C Azienda (http://1c.ru/eng/title.htm) è possibile prevedere quali saranno le vendite future dell'azienda . Nel dataset sales_train ci sono 2.935.849 registrazioni giornaliere con 11 variabili a cui ne verranno aggiunte altre nei prossimi mesi. In tutto ci sono 60 negozi, 22170 articoli e 84 categorie.
 
'''Descrizioni dei files:'''
*''sales_train.csv'' : Dati storici giornalieri da gennaio 2013 a ottobre 2015.
*''items.csv'' - informazioni supplementari su articoli/prodotti.
*''item_categories.csv'' - informazioni supplementari su categorie di articoli.
*''shops.csv'' - informazioni supplementari sui negozi.
 
'''Variabili contenute nei datasets:'''
*''ID'' : un ID che rappresenta un negozio o un articolo all'interno del set di dati
*''shop_id'' : identificatore univoco di un negozio
*''item_id'' : identificatore univoco di un prodotto
*''item_category_id'' - identificatore univoco della categoria di articoli
*''item_cnt_day'' - numero di prodotti venduti. Si vuole predire un valore mensile di questo dato
*''item_price'' - prezzo corrente di un articolo
*''data'' - data nel formato gg/mm/aaaa
*''date_block_num'' - un numero di mese consecutivo, utilizzato per comodità. Gennaio 2013 è 0, febbraio 2013 è 1, ...,Ottobre 2015 è il 33
*''item_name'' : nome dell'articolo
*''name_shop'' : nome del negozio
*''item_category_name'' - nome della categoria dell'articolo
 
'''Caricamento dei dati:'''
sales_train <- read.csv("sales_train_v2.csv")
items2 <-read.csv("items.csv")
items <- read.csv("items-translated.csv")
items <- cbind(items,item_category_id=items2$item_category_id)
shops <- read.csv("shops-translated.csv")
categories <- read.csv("item_categories-translated.csv")
items <- merge(items,categories, by =c("item_category_id"), all.x = TRUE)
sales_train <- merge(sales_train,items, by =c("item_id"), all.x = TRUE)
sales_train <- merge(sales_train,shops, by =c("shop_id"), all.x = TRUE)