[clicca per tornare alla home page]

Data warehouse
Un sistema di data warehouse (letteralemente "magazzino di dati") è un insieme di dati provenienti dai vari sottosistemi aziendali con le seguenti caratteristiche:

· orientato alle informazioni ("subject oriented"): i dati presenti nei sistemi applicativi di base sono normalmente orientati al problema specifico trattato dall'applicativo (i dati di nosologia di un paziente sono presenti nel sistema di accettazione, mentre quelli relativi ai suoi consumi farmaceutici sono presenti nel programma di supporto al servizio farmaceutico, ecc.); nel data warehouse, invece, vengono ricostruite nella loro completezza (e rese disponibili in contemporanea) le informazioni presenti in modo frammentario nei vari sottosistemi;

· integrato ("integrated"): i vari sistemi informatici di base tipicamente utilizzano differenti (e molto spesso incompatibili) piattaforme tecnologiche, DBMS, codifiche, convenzioni sui nomi, attributi fisici, dimensioni degli attributi, ecc. I dati vengono inseriti in un data warehouse proprio per eliminare le molte inconsistenze e incongruenze dei sistemi elementari. È chiaro che questo aspetto è particolarmente critico soprattutto nelle realtà sanitarie in cui i diversi utenti dello stesso applicativo tendono ad utilizzarlo secondo modalità e criteri differenti;

· non volatile ("nonvolatile"): i dati sono continuamente aggiornati nei sistemi applicativi di base, mentre il data warehouse ha lo scopo di raccogliere tali dati affinché siano analizzati in modo massiccio senza però prevedere aggiornamenti diretti;

· varianza col tempo ("time variant"): l'orizzonte temporale dei dati "in linea" in un data warehouse è tipicamente molto superiore rispetto ai sistemi di base; questi ultimi, inoltre, tipicamente mantengono solo la versione corrente dei dati (anche delle anagrafiche), mentre il data warehouse ne contiene tutta la "storia".
(Tratto da 'Building the data warehouse', Immon)


OLAP: I dati in diretta
Una semplice definizione di OLAP (On Line Analitical Processing) potrebbe essere quella di uno strumento per l'analisi rapida di informazioni distribuite e in forma Multidimensionale.
In particolare una soluzione OLAP deve integrare tre funzioni:

· Interrogazione (Querying)

· Generazione di prospetti (Reporting)

· Analisi
Con riferimento alle analisi, quelle comunemente impiegate sono di due tipi:

· Slice and dice;

· Drill down/across.

Il primo tipo permette di segmentare i dati e quindi di esaminarli per gruppi omogenei.

Il secondo permette di 'navigare' nei dati ed esaminarli a diversi livelli di dettaglio.

Ovviamente le fasi di querying e analisi sono normalmente iterative, nel senso che si procede a individuare un primo insieme di dati di interesse , su cui si produce un'analisi che porterà a una ulteriore interrogazione e così via, fino a quando un certo fenomeno non è stato completamente compreso. A quel punto è probabile che venga generato un prospetto in cui si descrive (con tavole, grafici e commenti) il percorso mentale intrapreso e l'interpretazione per quel fenomeno.

Uno strumento OLAP apparirebbe come tipicamente induttivo (cerco, esplorando i dati, una risposta ai miei perché e quindi una spiegazione ai fenomeni che sto analizzando), in realtà esso prevede, per poter essere usato con semplicità, l'esistenza di una o più viste dei dati aziendali che racchiudono buona parte delle regole interpretative.

Questa attività preliminare è normalmente a carico dell'amministratore dei dati che ha appunto l'onere di delineare il modello di riferimento (approccio deduttivo) all'interno del quale l'utente finale compie le sue esplorazioni (approccio induttivo).
(Tratto da 'Network NEWS' 20 Giugno 1997)