Applicazioni pratiche di machine learning/Identificazione dei social bot: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Nessun oggetto della modifica
Etichette: Modifica da mobile Modifica da web per mobile
Nessun oggetto della modifica
Etichette: Modifica da mobile Modifica da web per mobile
Riga 6:
library(caret)
</syntaxhighlight>
 
 
== Parte 3: Esplorazione dei dati ==
 
<syntaxhighlight lang="rsplus">
df %>%
ggplot(aes(Tipo_di_utente, fill=Tipo_di_utente))+
geom_bar()+
scale_y_continuous(breaks=seq(0,4000,500))+
ggtitle("Numero di utenti del campione",subtitle = "suddivisi in base alla variabile Tipo_di_utente")
</syntaxhighlight>
 
[[File:Utenti di Twitter (bot e human).png|frame|centro]]
 
Le variabili che si utilizzano come predictors nell'analisi sono tutte fortemente distorte a destra, nel senso che la maggiorparte degli utenti di Twitter hanno pochi followers, pochi amici ecc. e ci sono invece pochi utenti che ne hanno tantissimi al punto da potersi considerare outliers o valori anomali
 
 
<syntaxhighlight lang="rsplus">
df %>%
ggplot(aes(Tipo_di_utente,friends_count , fill=Tipo_di_utente))+
geom_boxplot()+
ggtitle("Boxplots della variabile friends_count", subtitle = "in base al tipo di utente")
</syntaxhighlight>
 
[[File:Boxplots di una variabile degli users di Twitter.png|frame|centro]]