Web

Il riconoscimento di testo in Dropbox semplifica la ricerca di immagini e PDF

La funzione è un’esclusiva degli utenti Professional, Business Advanced e Enterprise

Dropbox

Non c’è niente di peggio che dover trovare all’interno di un grosso quantitativo di PDF contenenti documenti scansionati come immagini, dei contenuti specifici; Dropbox rende più facile farlo introducendo il riconoscimento automatico delle immagini, che estrae i testi da foto e PDF e li rende ricercabili.

 

Secondo il provider di cloud storage, ci sono 20 miliardi di file immagine e PDF memorizzati su Dropbox. Circa il 10-20% di questi, sono foto di documenti, quindi la nuova funzionalità può essere molto, molto utile.

 

Per cercare una foto o un PDF specifico, devi semplicemente digitare una parola chiave o una frase come faresti su un motore di ricerca. Dropbox mostrerà quindi i file che contengono quelle parole o frasi. La società ha dichiarato a VentureBeat che questo è “il progetto più impegnativo dal punto di vista computazionale che il suo team di apprendimento automatico abbia mai intrapreso”.

 

Sono stati particolarmente sfidati dai PDF, poiché i documenti composti da più pagine richiedono molta più potenza di elaborazione rispetto a un file di immagine. Per rendere fattibile l’indicizzazione, hanno progettato il sistema in modo da interrompere l’estrazione e l’indicizzazione del testo dopo 10 pagine.

Dropbox

Il riconoscimento automatico del testo delle immagini funziona per JPEG in inglese, file GIF statici, PNG, TIFF e PDF su Dropbox, anche quelli caricati prima del lancio della funzione. Tuttavia, la disponibilità è abbastanza limitata. Gli utenti di Dropbox Business Advanced e Enterprise potrebbero essere in grado di accedervi presto, a seconda di quando i loro amministratori di account attiveranno la funzione, mentre gli abbonati di Dropbox Professional avranno la funzione nel corso dei prossimi mesi. Gli utenti ordinari, invece, dovranno continuare a cercare documenti alla vecchia maniera.