Plustek innova i processi di estrazione dei dati provenienti dai documenti cartacei in uso presso aziende e PA; come funziona SmartZone Document Extraction Toolkit?
La piattaforma è stata sviluppata dal reparto R&D interno all’azienda e sfrutta le tecnologie di AI e di acquisizione dati cognitiva, in abbinamento agli scanner professionali già a listino.
Ogni documento contiene informazioni preziose; il processo di scansione è il primo passo per farle fruttare al massimo. Plustek propone infatti una visione in cui le pagine non sono unicamente convertite in un documento su PC, ma in una vera e propria sorgente di dati. Ciascuna parte del foglio contiene dettagli utili in varia misura, con gradi di importanza variabili e da considerare scrupolosamente.
La capacità di leggere e interpretare in modo evoluto ogni campo disponibile permette di classificare i singoli dati, generando indici che saranno utilizzabili per futuri impieghi. Il meccanismo proposto consente di accorciare sensibilmente la catena di passaggi da eseguire per sfruttare quanto catturato dal supporto cartaceo.
Valorizzare le informazioni, classificare i dati
Il pacchetto proposto da Plustek consente di effettuare una sorta di “radiografia” della pagina, al fine di individuare aree specifiche. È così possibile determinare aree con peculiarità precise, a partire dall’Area di Classificazione del file, che permette di individuare uno o più riferimenti rappresentativi del documento. Si tratta di una particolarità indispensabile per il successivo recupero delle informazioni dal database.
La successiva area permette al sistema di calcolare la posizione esatta dei campi dati per poter successivamente abilitare la funzione di posizionamento dinamico.
Una sezione “multi-linea” consente alla piattaforma di leggere riga per riga, sfruttando un meccanismo automatico per determinare spazi, parole e argomenti.
Tramite ulteriori finestre di ispezione del documento, SmartZone Document Extraction Toolkit può leggere e comprendere i riferimenti cronologici, firme, codici a barre, foto e altri dettagli per processare in modo approfondito ciò che viene scansionato.
Per definire al meglio il percorso di creazione e registrazione dei dati, il sistema può essere programmato per catturare specifici set di caratteri. Si potranno estrapolare solo numeri, solo cifre, lettere maiuscole o minuscole e ancora set alfanumerici.
Valorizzare le informazioni, integrazione facile
SmartZone può essere facilmente integrato con DMS e architetture di gestione esterne, questo grazie a SDK per sviluppatori e capacità di output evolute.
Grazie a questo sistema è possibile processare in modo accurato svariate tipologie di documenti. Si potranno generare e gestire modelli personalizzati: copie commissione, ordini, fatture, documenti di trasporto, contratti e certificati.
L’interfaccia di gestione non si discosta da quanto già disponibile sul mercato, con un layout coerente con le moderne applicazioni per l’ufficio. L’integrazione non costituirà dunque un problema specifico.
Una volta scansionato il documento e visualizzata l’anteprima è possibile selezionare campi e parole specifiche delineandone i contorni con il mouse.
La piattaforma consente di definire con precisione ogni area, assegnando una lingua di riconoscimento, il tipo di processo da avviare e la tipologia di documento per l’archiviazione finale.
Dopo aver definito le aree di interesse del documento è possibile salvare profili specifici, oltre all’originale catturato tramite lo scanner. Con una successiva lavorazione è possibile esportare le informazioni selezionate per utilizzi successivi.
Futuri documenti del medesimo tipo saranno dunque acquisiti e i dati in essi contenuti saranno scorporati e archiviati in modo autonomo e preciso.
Valorizzare le informazioni, l’asso nella manica delle imprese
Oltre a modelli personalizzabili e alla possibilità di estrarre informazioni da numerose tipologie di dati, Plustek SmartZone Document Extraction Toolkit consente di definire marcatori specifici.
Adottando sino a 9 marcatori unici, l’utente può definire in modo granulare come si deve svolgere l’estrazione dei campi indice.
A questa caratteristica si affianca un controllo intelligente delle eccezioni e delle corrispondenze dei dati. Si tratta di uno step molto importante per migliorare la qualità dell’output finale.
Il risultato finale è un processo seamless, che permette estrazione e valorizzazione dei dati, dalla carta al file grezzo. Tale materiale risulta pronto per essere integrato in pochi minuti all’interno di flussi di lavoro pre-esistenti, offrendo la qualità e le prestazioni delle tecnologie di estrazione dei dati basate su AI e sul deep learning.