Applicazioni pratiche di machine learning/Identificazione dei social bot: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Nuova pagina: ==Caricamento librerie== <syntaxhighlight lang="rsplus"> library(ggplot2) library(dplyr) library(caret) </syntaxhighlight> ==Parte 1: Dati == I social bot sono programmi che di...
 
Riga 87:
ggtitle("Numero di utenti del campione",subtitle = "suddivisi in base alla variabile Tipo_di_utente")
</syntaxhighlight>
 
[[File:Utenti di Twitter (bot e human).png|frame|centro]]
 
Le variabili che si utilizzano come predictors nell'analisi sono tutte fortemente distorte a destra, nel senso che la maggiorparte degli utenti di Twitter hanno pochi followers, pochi amici ecc. e ci sono invece pochi utenti che ne hanno tantissimi al punto da potersi considerare outliers o valori anomali
 
 
<syntaxhighlight lang="rsplus">
df %>%
ggplot(aes(Tipo_di_utente,friends_count , fill=Tipo_di_utente))+
geom_boxplot()+
ggtitle("Boxplots della variabile friends_count", subtitle = "in base al tipo di utente")
</syntaxhighlight>
 
[[File:Boxplots di una variabile degli users di Twitter.png|frame|centro]]