_
Il riconoscimento oggettuale per immagini sta diventando la nuova frontiera della memorizzazione di dati e della loro ricerca, come il riconoscimento facciale che molte perplessità aveva sollevato quando venne introdotto in Facebook, ma anche e soprattutto nella realtà aumentata e nelle applicazioni di marketing.
Diventa quindi un’esigenza prioritaria proporre degli standard che possano trasformare le immagini in oggetti che si descrivano non più in modo puramente analogico ma numerico tale da potere essere trattate velocemente e in modo interoperabile nel mondo binario dell’informatica.
Diventa quindi un’esigenza prioritaria proporre degli standard che possano trasformare le immagini in oggetti che si descrivano non più in modo puramente analogico ma numerico tale da potere essere trattate velocemente e in modo interoperabile nel mondo binario dell’informatica.
Con questo scopo il comitato MPEG vuole proporre lo standard CDVS (Compact Descriptors for Visual Search) in moda tale che possa venire adottato dal maggior numero di sistemi di memorizzazione di immagini e, quindi, consentire in automatico una serie di descrizione dei punti rilevanti di un’immagine, l’invio degli stessi ad una anagrafica visuale. la ricerca tramite dati numerici e la veloce soluzione dell’interrogazione, con elevati margini di pertinenza e informazioni.
Nella conferenza di presentazione tenutasi a Milano il 10 Giugno, presso la sede dell’UNI, Leonardo Chiariglione, presidente di MPEG group, e Gianluca Francini di TELECOM, impegnata direttamente nel progetto, hanno illustrato perfettamente le basi teoriche e pratiche dello standard.
Questo si basa su una normalizzazione delle caratteristiche di spettro dell’immagine, tramite colore e luminanza, e nella definizione di mappatura dei punti salienti che un algoritmo sofisticato deve tracciare sulla stessa, questo procedimento definisce le due parti descrittive su cui si fonda lo standard, quella globale che determina il contesto grezzo su cui si poggia il primo filtraggio della ricerca e quella più dettagliata che analizza e filtra le parti focali dell’immagine, che puà essere un semplice oggetto o una struttura aggregata più complessa, ad esempio un oggetto architettonico.
Questo procedimento euristico estrae l’informazione di cui l’immagine è parte, il contesto, ad esempio di quale complesso architettonico fa parte un dettaglio, fino a definire la posizione in cui è stata scattata la foto in modo tale da proporre anche dati di posizionamento e rendere ulteriormente ricca la risposta alla query visuale.
Questo procedimento euristico estrae l’informazione di cui l’immagine è parte, il contesto, ad esempio di quale complesso architettonico fa parte un dettaglio, fino a definire la posizione in cui è stata scattata la foto in modo tale da proporre anche dati di posizionamento e rendere ulteriormente ricca la risposta alla query visuale.
Le applicazioni pratiche possono essere infinite, specialmente in un mondo, quello futuro ma già molto a nostra disposizione, dove i dispositivi elettronici basati sulla visione e la registrazione di immagini sono ormai a livello immersivo.
Pensiamo banalmente ai dispositivi fotografici digitali, con le quali memorizziamo gran parte dei nostri approcci informativi ed emozionali e che succesivamente rielaboriamo cercando di darne un senso e prentendendo di arricchirli di dati e informazioni.
Pensiamo a oggetti ancora più immersivi come i Google Glass, basati completamente sulla visione ma che hanno un senso solo se estensioni cognitive del nostro squardo.
Pensiamo a oggetti ancora più immersivi come i Google Glass, basati completamente sulla visione ma che hanno un senso solo se estensioni cognitive del nostro squardo.
Alberto Messina di RAI ha presentato un sistema che integra CDVS nella ricerca di oggetti visuali durante la postproduzione televisiva, in particolare nella prostpruduzione in tempo reale, nelle news e nelel dirette, dove velocità e accuratezza molto difficilmente si accordano quando l’elemento umano deve operare ma ci si puà avvicinare se viene assistito da uno strumento digitale.
In questo caso la standardizzazione è il requisito base per analizzare la quantità di dati a disposizione negi data storage della RAI.
In questo caso la standardizzazione assolve anche alla necessità di interoperabilità nei passaggi generazionali tra tecnologie di memorizzazione e archiviazione, elemento critico quando un’azienda immagazzina dati da decenni con paradigmi diversi.
In questo caso la standardizzazione è il requisito base per analizzare la quantità di dati a disposizione negi data storage della RAI.
In questo caso la standardizzazione assolve anche alla necessità di interoperabilità nei passaggi generazionali tra tecnologie di memorizzazione e archiviazione, elemento critico quando un’azienda immagazzina dati da decenni con paradigmi diversi.
Alessandra Mosca di Sisvel Technology ha presentato una piattaforma, sviluppata con la collaborazione di Film Commission Torino Piemonte, con la quale l’utente turistico può avere informazioni dettagliate, fino a visuallizzare spezzonni e scene cinematografiche, sui luoghi torinesi che sono stati location e set cinematografici.
In questo caso basta semplicemente fotografare con l’app relativa il luogo e in risposta si ottiene l’oggetto ‘aumentato’.
Ovviamente questa applicazione può essere declinata in contesti i più disparati proprio grazie alla facilità con cui una standardizzazione rende abilitata qualsiasi idea base.
Ovviamente questa applicazione può essere declinata in contesti i più disparati proprio grazie alla facilità con cui una standardizzazione rende abilitata qualsiasi idea base.
Altri esempi presentati, Danilo Pau di ST Microelectronics con un’applicazione automotive e una di shopping mobile, Pedro Gusmão del Politecnico di Torino con una soluzioen applicata alla robotica fino a Massimo Mauro dell’Università di Brescia con il CDVS applicato alla manutenzione impiantistica, fanno capire come la ricerca per immagini è una tecnologia abilitante per eccellenza ed apre la strada a quell’asset, il visuale, che per la sua natura essenzialmente analogica finora era restata relegata alle prototipizzazioni e alle sperimentazioni non troppo ‘open’.