Applicazioni pratiche di deep learning/Segmentazione delle immagini
Nell'elaborazione di immagini digitali e nella visione artificiale, la segmentazione dell'immagine è il processo di partizione di un'immagine digitale in più segmenti di immagine, noti anche come regioni dell'immagine o oggetti immagine ( set di pixel ). In pratica attraverso il deep learning è possibile identificare le varie parti di un'immagine . Alcune delle applicazioni pratiche della segmentazione delle immagini sono:
- Imaging medico, comprese le immagini di rendering volumetrico da tomografia computerizzata e risonanza magnetica, ad esempio nella localizzazione dei tumori e in altre patologie
- Rilevamento di oggetti
- Rilevamento pedoni
- Riconoscimento facciale
- Riconoscimento delle impronte digitali
- Riconoscimento dell'iride
- Sistemi di controllo del traffico
- Video sorveglianza
Per procedere alla segmentazione della foto a destra
tramite Hugging Face, utilizzando il modello di default facebook/detr-resnet-50-panoptic, si procede cosi su Colab:
!pip install -q transformers
!pip install timm
from transformers import pipeline
model = pipeline("image-segmentation")
model("https://live.staticflickr.com/65535/52204191055_04e952292f_4k.jpg")
che dà il seguente risultato :
No model was supplied, defaulted to facebook/detr-resnet-50-panoptic (https://huggingface.co/facebook/detr-resnet-50-panoptic) [{'label': 'person', 'mask': <PIL.Image.Image image mode=L size=2731x4096 at 0x7FF14AF8AB90>, 'score': 0.9985314607620239}, {'label': 'playingfield', 'mask': <PIL.Image.Image image mode=L size=2731x4096 at 0x7FF14AF8A990>, 'score': 0.9412941336631775}, {'label': 'person', 'mask': <PIL.Image.Image image mode=L size=2731x4096 at 0x7FF14AF8AED0>, 'score': 0.9996600151062012}, {'label': 'bicycle', 'mask': <PIL.Image.Image image mode=L size=2731x4096 at 0x7FF14AF8A3D0>, 'score': 0.9092055559158325}]
Quindi il modello con un'accuratezza superiore al 90% ha individuato nella foto 2 persone, una bicicletta e un campo da gioco.
Link esterni
modifica