Aprile 2011: ecco iCube, un’innovativa soluzione basata su moduli software e consulenza che si prende cura del patrimonio di conoscenza degli utenti aziendali, sviluppata partendo da un’innovativa tecnologia creata da Gruppo Consulenza Innovazione (www.gr-ci.com) e che proietta le aziende verso una totale comprensione delle proprie informazioni, ovviamente a vantaggio (e per la sicurezza totale) del proprio lavoro, e del risparmio di risorse e costi
Che cosa è e come funziona iCube:
iCube è innanzitutto un analizzatore dettagliato di una fonte dati NON strutturata (text file, libri, documenti quali contratti, lettere clienti, web, logs ...).
L'analisi dettagliata del contenuto avviene in vari modi:
• Indicizzazione di tutto il contenuto del testo, quindi non solo di alcuni "Campi Chiave" definiti a priori dall'utente. Questo permette di non scartare nessuna informazione che potrebbe essere importante ai fini dell'analisi stessa. Un processo cosi definito aiuta chi analizza le informazioni di fare il cosiddetto “Data Discovery"
• E’ possibile definire "Campi Chiave" che servono a iCube di individuare i valori corrispondenti. Esempio: per una fattura commerciale, definisco Campi Chiavi come Importo, Imponibile, Codice Cliente e Ragione Sociale, etc.. iCube è in grado di trovare i valori effettivi di tali Campi. In questo modo un testo destrutturata diventa anche strutturata dentro iCube, cioè sarà possibile fare interrogazioni per range di valori, date, e via dicendo ... In questa fase non è importante, anzi non serve definire un template, altrimenti per ogni tipo di documento andrebbe fatta questa definizione.
• Ricerca libera all'interno dei dati per singoli termini (“Token”) o per una combinazione di Token. iCube evidenzia, in frazioni di secondo, tutte le pagine che contengono il più possibile numero di tokens richiesti. Ad esempio, cerchiamo la seguente serie di parole "Mikele cinema poesia unita Italia festa" ovvero 6 Token: iCube individua le pagine che contengono esattamente questi 6 Token, altrimenti qualsiasi combinazione di 5 Token, e cosi via fino ad un solo token. Notare che si cercava Mikele e non Michele, ma iCube è in grado di trovare tutti i Tokens che foneticamente assomigliano a Michele
• iCube effettua una ricerca fonetica per similitudine di Token: ciò permette all'utente di individuare fino al sicuro ritrovamento di Token che per qualche motivi sono finiti in modo errato nel testo (errore di battitura, OCR, etc...)
• iCube crea in automatico dei Cluster di tutti i Token simili con la possibilità dinamica di calcolo delle distanze tra gli elementi del Cluster stesso. Esempio: da Mikele a Michele faccio due operazioni sui caratteri, tolgo la "k" e metto la "c", e poi aggiungo una "h". Tale processo (molto complesso anche su piccoli volumi di dati) viene fatto in pochissimo tempo anche su grossi volumi di dati
• Analisi per la riconciliazione degli incassi: effettua in base a diversi algoritmi il matching tra anagrafica ed i flussi di pagamento, bollettino postale, bonifici, etc... iCube aumenta di molto la percentuale di effettuare tale matching. Molte aziende, anche molto grandi, eseguono manualmente tale processo
• Web: Quality esegue una scansione delle pagine web definite, esegue un processo di data cleansing, pulizia dei tags ed altri caratteri inutili alla ricerca in questione. Esegue tutte le procedure di Clustering ed analisi sopra indicate. Dal risultato ottenuto è possibile fare diverse analisi, l'utente sarà molto agevolato in tale processo di Discovering.
• Possibile fare ricerca di coppie di Token, o triple o anche quadruple etc... iCube indica la distanza tra tali combinazioni di Token. Questa "Distanza" indica quanti altri tokens intercorrono tra le coppie di tokens obiettivo dell'analisi. La distanza può essere misurata in avanti o indietro, perchè magari questa differenza dà all'utente una percezione diversa
• iCube effettua un campionamento per la verifica dell'esistenza di un qualsiasi argomento sul web. Ad esempio: voglio controllare che sia presente la mia pubblicità su certo sito/i web/s per tutto il periodo della campagna di promozione del mio prodotto. Il campionamento può essere definito dall'utente, ogni minuti, 5 minuti e per fascia oraria, etc...
A cosa serve iCube:
• Web Reputation: Oggi tutti parlano di Web Reputation. Quello che viene scritto o detto nel web è difficilmente cancellabile, o sicuramente può avere una lunga vita su Internet. iCube effettua una scansione molto accurata sul web, recupera tutte le informazioni nei siti desiderati, non scarta dato alcuno, oppure in base a filtri predefiniti (ad esempio escludendo alcuni argomenti), confronta il contenuto con un dizionario predefinito producendo una “mappa di calore” basata sui pesi relativi ai singoli termini del dizionario.
iCube, oltre all'uso del motore Fonetico (vedi sotto), calcola la distanza tra qualunque combinazioni di termini che si desidera confrontare. Per esempio, la distanza tra il prodotto "OceanBlu" e l'aggettivo "fresco" è uguale a 2, questo vuol dire che in una frase o articolo esistono 2 termini che separano questa copia di dati.
In questo Modulo viene applicato il motore di Clustering (vedi sotto) a tutti i dati recuperati dal web.
• Document Indexing & Data Discovery: iCube effettua una tecnica di recupero delle informazioni contenute nei file di testo (non strutturati) e con template differenti. Il recupero è totale, quindi nessuna informazione viene scartata. In tale modo l'utente può interagire sui contenuti eseguendo una ricerca user-friendly per ottenere i risultati desiderati e stringere l'intervallo della ricerca fino al singolo documento a partire da una query composta da testo libero.
iCube, a partire da una predefinizione di alcuni tag, detti tag primari, in fase di recupero delle informazioni crea una struttura dati interrogabili in conformità a tali tag. E' possibile aggiungere alle query sopra indicate anche ricerca per intervallo di date, ricerca numerica ...
E' anche possibile definire un proprio dizionario dando un peso ai singoli termini (1=verde, 2= arancio, ... 5=rosso). iCube crea la cosiddetta mappa di calore in base al dizionario riportando la cardinalità all'interno dei singoli documenti analizzati
• Customer Care: con iCube si possono interrogare basi di dati contenenti risposte dal cliente e effettuare tutti gli opportuni matching
• Matching Incassi: Spesso le migliorie derivate dalle procedure innovative nei sistemi ERP, creano situazioni di difficile gestione, generate dai diversi modi e tempi di applicazione degli automatismi. iCube abbina anagrafica ed effettua un controllo di validazioni su oggetti non strutturati quaii flussi bancari, flussi registrati su conti transitori, informazioni provenienti da diversi servizi aziendali, …
• Phonetic Clustering & Similarity: Questo motore è integrato in tutti i sopra indicati moduli. Nel kernel di iCube è implementato un algoritmo di fonetica molto sofisticato che raggruppa tutte le anagrafiche (clienti, materiali, ecc...) che si assomigliano dal punto di vista fonetico.
Vengono creati in automatico dei cluster contenenti i dati similari. iCube permette in modo dinamico di stringere e/o aumentare il concetto di distanza di similarity tra tutti i dati oggetto di analisi. In caso di perdita di informazioni in fase di OCR, in base a questo motore, iCube sicuramente porta a trovare l'informazione desiderata, anche se essa non è stata recuperata in modo corretto. Per esempio, dopo una scansione di un documento il termine "cliente" può essere letto come "chente", "cliento", "chento", ecc.. . iCube abbina in modo corretto tutti questi termini a quello cercato, in questo caso "cliente"
iCube non è solo software, ma anche consulenza da Gruppo Consulenza Innovazione
iCube è un mondo immenso: è solo quando ci sei dentro che lo scopri appieno!