Applicazioni pratiche di machine learning/Diagnosi di malattie: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Nessun oggetto della modifica
Riga 112:
 
==Parte 4: Modellizzazione e previsione==
Divido il dataset heart in un training set costituito dal 70% delle osservazioni casuali, ottenendo 213 osservazioni, ed in un testing set costituito dalle rimanenti 90 osservazioni:
 
<syntaxhighlight lang="rsplus">
train <- createDataPartition(heart$target,p=0.7,list = FALSE)
training <- heart[train,]
testing <- heart[-train,]
 
training$target <- as.factor(training$target)
testing$target <- as.factor(testing$target)
</syntaxhighlight>
 
Utilizzando l'algoritmo Random Forest costruisco un modello previsionale sul training set che mi dà un'Accuracy quasi del 100% e sul testing set un'Accuracy dell'80% per cui il modello così ottenuto, con cui si predice se il paziente ha malattie al cuore oppure no , si può ritenere valido.
 
<syntaxhighlight lang="rsplus">
model <- train( target ~ .,data=training, method="rf", verbose=FALSE )
 
p3 <- predict(model,newdata = training)
print(confusionMatrix(p3,training$target))
 
p3 <- predict(model,newdata = testing)
print(confusionMatrix(p3,testing$target))
</syntaxhighlight>
 
Confusion Matrix and Statistics
 
Reference
Prediction 0 1
0 97 0
1 1 115
'''Accuracy : 0.9953'''
95% CI : (0.9741, 0.9999)
No Information Rate : 0.5399
P-Value [Acc > NIR] : <2e-16
Kappa : 0.9905
Mcnemar's Test P-Value : 1
Sensitivity : 0.9898
Specificity : 1.0000
Pos Pred Value : 1.0000
Neg Pred Value : 0.9914
Prevalence : 0.4601
Detection Rate : 0.4554
Detection Prevalence : 0.4554
Balanced Accuracy : 0.9949
'Positive' Class : 0
Confusion Matrix and Statistics
 
Reference
Prediction 0 1
0 33 11
1 7 39
'''Accuracy : 0.8'''
95% CI : (0.7025, 0.8769)
No Information Rate : 0.5556
P-Value [Acc > NIR] : 1.034e-06
Kappa : 0.599
Mcnemar's Test P-Value : 0.4795
Sensitivity : 0.8250
Specificity : 0.7800
Pos Pred Value : 0.7500
Neg Pred Value : 0.8478
Prevalence : 0.4444
Detection Rate : 0.3667
Detection Prevalence : 0.4889
Balanced Accuracy : 0.8025
'Positive' Class : 0
{{avanzamento|75%|05 febbraio 2020}}
[[Categoria:Applicazioni pratiche di machine learning|/Diagnosi di malattie]]