5. La preparazione dei dati

Dopo che la conoscenza aziendale è stata raccolta completamente, inizia la fase che determina in modo decisivo quanto sarà effettivamente performante, affidabile e utile la futura IA:

la preparazione dei dati.

In questa fase, da una grande quantità di singoli file, testi, media, estratti di sistema e resoconti di esperienza nasce per la prima volta un sistema di conoscenza coerente, strutturato e tecnicamente solido.

Qui entra in gioco Vimmera Cortex. La nostra base di conoscenza con una struttura dati molto speciale.

Le informazioni raccolte inizialmente si presentano con qualità molto diverse. Spesso esistono più versioni dello stesso contenuto, ci sono affermazioni contraddittorie, versioni obsolete, modalità di lavoro informali, termini non uniformi o riferimenti mancanti tra temi correlati. Molto si è sviluppato storicamente, non è stato mantenuto in modo coerente oppure è stato concepito per gruppi target e situazioni differenti.

Una componente particolarmente importante della preparazione dei dati è l’uniformazione e la strutturazione del linguaggio della Sua azienda. Termini tecnici, denominazioni interne, nomi di prodotto, abbreviazioni, nomi di processo e formulazioni tipiche vengono preparati e collegati tra loro in modo tale che l’IA comprenda e utilizzi correttamente il “linguaggio” della Sua organizzazione, dei Suoi collaboratori e dei Suoi clienti. Solo così le richieste possono essere interpretate correttamente, i contenuti assegnati in modo univoco e i malintesi evitati. Senza questo chiarimento linguistico, molte domande restano senza risposta oppure ricevono risposte imprecise, errate o incomplete.

Se un’IA lavorasse direttamente sul materiale grezzo non ordinato (cioè su semplici file e documenti), potrebbe sì ritrovare passaggi di testo e contenuti, ma non potrebbe decidere in modo affidabile quali informazioni siano valide, attuali e tecnicamente corrette. La situazione diventa ancora più difficile con domande complesse, nelle quali interagiscono più ambiti di conoscenza, regole, prodotti o processi. Senza preparazione, all’IA manca la chiarezza necessaria per riconoscere con sicurezza le correlazioni, argomentare senza contraddizioni o fornire risposte complete e affidabili.

La preparazione dei dati è quindi la fase in cui da informazioni disordinate nasce una base di conoscenza solida. Una base di conoscenza che è tecnicamente coerente, che parla il linguaggio della Sua azienda e che crea il presupposto affinché l’IA non solo trovi, ma comprenda, valuti e supporti in modo sensato.

Dal documento alla conoscenza

Un altro aspetto, spesso sottovalutato, è la qualità delle risposte successive in presenza di grandi quantità di dati. Quanto più informazioni vengono inserite in un database (vettoriale) e quanto più dati un’IA deve considerare contemporaneamente, tanto maggiore diventa l’imprecisione dei risultati e degli output. Questo è un problema noto di molti sistemi:

Con l’aumento della quantità di dati diminuisce la precisione, le risposte diventano più generiche, meno accurate oppure mescolano contenuti che dal punto di vista tecnico non hanno nulla a che fare tra loro.

Il motivo è semplice: nei sistemi classici migliaia di pagine, PDF, verbali o manuali si trovano uno accanto all’altro. Per l’IA queste sono fonti testuali di pari valore. Rilevanza, validità, responsabilità, riferimento al prodotto o contesto tecnico non vi sono rappresentati in modo univoco.

La preparazione dei dati per Vimmera Cortex risolve questo problema in modo fondamentale, trattando le informazioni non come documenti, ma come conoscenza. I contenuti vengono scomposti nei loro componenti tecnici: fatti, regole, termini, domande, risposte, correlazioni, dipendenze, validità, varianti e collegamenti. Il singolo documento perde il suo ruolo di contenitore della conoscenza, viene “dissolto”. Ciò che rimane è la conoscenza in esso contenuta in forma strutturata e astratta.

Il modo migliore per immaginare questo processo e la memorizzazione è pensare a come noi esseri umani archiviamo i ricordi. Dopotutto, non memorizziamo nel nostro cervello un PDF di un manuale di installazione quando vogliamo ricordare come funziona il nostro televisore.

La conoscenza raccolta in precedenza viene assegnata in modo univoco a prodotti, servizi, processi, funzioni, categorie o scenari di applicazione. In questo modo la quantità complessiva dei dati non gioca più alcun ruolo. L’IA non accede a una grande massa di testo indistinta, ma esattamente ai moduli di conoscenza rilevanti per la specifica richiesta.

Su richiesta, i documenti originali restano comunque disponibili. Può continuare a verificare dove si trova qualcosa, trovare documenti in modo mirato o cercare passaggi di testo.

Decisivo è però questo:

L’IA di Vimmera AI non lavora con documenti – lavora con la conoscenza di Vimmera Cortex, cioè con la Sua conoscenza.

Collegamento invece di archiviazione

Nella preparazione dei dati, i contenuti non vengono solo ripuliti e uniformati, ma soprattutto collegati tra loro. Diverse fonti di conoscenza, come documenti, processi, prodotti, regole, valori di esperienza e dati di sistema, vengono messe in relazione. Così nasce una rete di conoscenza in cui l’IA non conosce solo singoli fatti, ma anche il loro significato, la loro validità e il loro contesto.

A tal fine viene definito, tra l’altro:

  • quali documenti appartengono a quali processi
  • quali prodotti, codici articolo, varianti e regole sono collegati tra loro
  • quali funzioni sono pensate per cosa e quando non sono sensate
  • quali eccezioni, alternative o dipendenze esistono
  • quali informazioni devono essere considerate insieme in quali situazioni

Solo così l’IA potrà in seguito non solo trovare informazioni, ma anche classificarle correttamente, combinarle e valutarle.

Logica tecnica invece del caso

Nella preparazione dei dati per Vimmera Cortex viene inoltre definito quali collegamenti debbano essere applicati automaticamente in quali situazioni. In questo modo nasce una logica tecnica secondo cui l’IA opera.

Esempi:

  • In caso di una richiesta di prezzo, il sistema riconosce automaticamente il prodotto, il codice articolo corretto, le varianti correlate, i gruppi di sconto validi e le condizioni rilevanti.
  • In caso di una richiesta relativa a una funzione, non viene spiegato solo che cosa fa, ma anche se è sensata in questa situazione concreta, quali limitazioni si applicano o quali alternative sarebbero più adatte.
  • Nelle richieste di assistenza vengono collegati automaticamente tra loro dispositivo, codice di errore, cause note, pezzi di ricambio adatti e passaggi di soluzione collaudati.
  • Nelle domande sui processi vengono considerate contemporaneamente responsabilità, moduli, linee guida e dipendenze.

Tali risposte sono possibili solo se la conoscenza è stata strutturata, messa in rete e modellata dal punto di vista tecnico.