Successo dell’ateneo alla Visual Object Tracking Challenge 2021
Visione artificiale, l’Ateneo vince il “campionato del mondo” nella ricerca in Visual Tracking
Grazie a un gruppo di ricercatori del Dipartimento di Scienze matematiche, informatiche e fisiche
-
Immagine di gara di F1, tratta dal video che mostra i risultati dell'algoritmo
-
Immagine di un jumper, tratta dal video che mostra i risultati dell'algoritmo
-
Christian Micheloni
-
Kristian Simonato
Un gruppo di ricercatori dell’Università di Udine ha vinto il “campionato del mondo” per le più avanzate tecniche di intelligenza artificiale nell’ambito del visual tracking, cioè l’utilizzo dei computer per la ricerca di oggetti (persone, mezzi, animali, ecc…) tramite immagini e video. Il team è stato premiato per aver sviluppato il miglior algoritmo di intelligenza artificiale nell’ambito della “Visual Object Tracking Challenge 2021”, competizione internazionale che ha visto la partecipazione dei più importanti istituti di ricerca al mondo in intelligenza artificiale. Dalla videosorveglianza alla robotica, l’utilizzo di questi algoritmi è conveniente in tutte le attività industriali che richiedono di mantenere traccia del cambiamento di entità con il passare del tempo. Il video che mostra le capacità dell’algoritmo vincente.
Il gruppo vincitore, del Dipartimento di Scienze matematiche, informatiche e fisiche (Dmif), è composto da Matteo Dunnhofer, tarvisiano, è dottorando in Ingegneria industriale e dell’informazione e ha curato l’ideazione e l’implementazione della soluzione coadiuvato da Kristian Simonato, di San Michele al Tagliamento, che sul tema ha redatto la tesi magistrale in Comunicazione multimediale e tecnologie dell’informazione. Christian Micheloni, di Buttrio, professore di machine learning e computer vision e direttore del Laboratorio di Machine learning and Perception, ha diretto e supervisionato l’equipe.
Il visual object tracking è uno dei problemi fondamentali della visione artificiale, la branca dell’intelligenza artificiale che studia metodi e algoritmi per permettere ai computer di percepire il mondo tramite immagini e video. Esso richiede lo sviluppo di algoritmi di elaborazione video in grado di mantenere l’attenzione su un oggetto predefinito senza mai perderlo di vista. Come fanno le persone quando fissano un oggetto con lo sguardo. Il contesto di long-term, ovvero di mantenimento dell’attenzione a lungo termine, introduce notevoli difficoltà perché richiede di inseguire un oggetto per lunghi periodi di tempo, cercando di superare ostacoli di varia natura (variazioni di forma, colore o scala; situazioni che possono far scomparire momentaneamente l’oggetto dal campo visivo).
Quest’anno la competizione si è svolta nell’ambito dell' “International Conference on Computer Vision 2021”, una delle due principali conferenze internazionali sui temi di visione artificiale. La “gara” ha lo scopo di incentivare lo sviluppo di soluzioni sempre più performanti e viene organizzato ogni anno da un comitato composto dai più riconosciuti ricercatori nel campo della visione artificiale. Fra i team partecipanti l’Università di Oxford, il Politecnico di Zurigo (ETH), la Nanyang Technological University di Singapore e le numerose università cinesi leader in visione artificiale.
«La soluzione proposta – spiega Micheloni – implementa un avanzato algoritmo di machine learning in grado di supervisionare l’esecuzione di due algoritmi di visual tracking. L’algoritmo “impara” una rappresentazione astratta dell’oggetto da inseguire e, tramite il confronto di tale modello con quanto proposto dai sotto-algoritmi, è in grado di determinare la qualità dell’inseguimento dei due. Attraverso questa procedura di valutazione, l’algoritmo è in grado di selezionare qual è il sotto-algoritmo migliore per localizzare l’oggetto d’interesse, ed eventualmente utilizzare tale informazione per correggere l’altro. Questo permette di ottenere un algoritmo molto efficace a partire da due deboli».
«Le moderne soluzioni di visual tracking – sottolinea Micheloni – sono progettate per inseguire vari tipi di oggetti: persone, veicoli, animali, perfino forchette. Oltre che per applicazioni quali la videosorveglianza e la robotica, l’utilizzo di questi algoritmi è conveniente in tutte le attività industriali che richiedono di mantenere traccia del cambiamento di entità nel tempo. Le tecniche di deep learning utilizzate nella nostra soluzione sono generalizzabili e possono essere adattate facilmente a diversi tipi di dati e di algoritmi».