|
Data warehouse
Un sistema di data warehouse (letteralemente "magazzino
di dati") è un insieme di dati provenienti dai
vari sottosistemi aziendali con le seguenti caratteristiche:
· orientato alle informazioni ("subject oriented"):
i dati presenti nei sistemi applicativi di base sono normalmente
orientati al problema specifico trattato dall'applicativo
(i dati di nosologia di un paziente sono presenti nel sistema
di accettazione, mentre quelli relativi ai suoi consumi farmaceutici
sono presenti nel programma di supporto al servizio farmaceutico,
ecc.); nel data warehouse, invece, vengono ricostruite nella
loro completezza (e rese disponibili in contemporanea) le
informazioni presenti in modo frammentario nei vari sottosistemi;
· integrato ("integrated"): i vari sistemi
informatici di base tipicamente utilizzano differenti (e molto
spesso incompatibili) piattaforme tecnologiche, DBMS, codifiche,
convenzioni sui nomi, attributi fisici, dimensioni degli attributi,
ecc. I dati vengono inseriti in un data warehouse proprio
per eliminare le molte inconsistenze e incongruenze dei sistemi
elementari. È chiaro che questo aspetto è particolarmente
critico soprattutto nelle realtà sanitarie in cui i
diversi utenti dello stesso applicativo tendono ad utilizzarlo
secondo modalità e criteri differenti;
· non volatile ("nonvolatile"): i dati sono
continuamente aggiornati nei sistemi applicativi di base,
mentre il data warehouse ha lo scopo di raccogliere tali dati
affinché siano analizzati in modo massiccio senza però
prevedere aggiornamenti diretti;
· varianza col tempo ("time variant"): l'orizzonte
temporale dei dati "in linea" in un data warehouse
è tipicamente molto superiore rispetto ai sistemi di
base; questi ultimi, inoltre, tipicamente mantengono solo
la versione corrente dei dati (anche delle anagrafiche), mentre
il data warehouse ne contiene tutta la "storia".
(Tratto da 'Building the data warehouse', Immon)
OLAP: I dati in diretta
Una semplice definizione di OLAP (On Line Analitical Processing)
potrebbe essere quella di uno strumento per l'analisi rapida
di informazioni distribuite e in forma Multidimensionale.
In particolare una soluzione OLAP deve integrare tre funzioni:
· Interrogazione (Querying)
· Generazione di prospetti (Reporting)
· Analisi
Con riferimento alle analisi, quelle comunemente impiegate
sono di due tipi:
· Slice and dice;
· Drill down/across.
Il primo tipo permette di segmentare i dati e quindi di esaminarli
per gruppi omogenei.
Il secondo permette di 'navigare' nei dati ed esaminarli a
diversi livelli di dettaglio.
Ovviamente le fasi di querying e analisi sono normalmente
iterative, nel senso che si procede a individuare un primo
insieme di dati di interesse , su cui si produce un'analisi
che porterà a una ulteriore interrogazione e così
via, fino a quando un certo fenomeno non è stato completamente
compreso. A quel punto è probabile che venga generato
un prospetto in cui si descrive (con tavole, grafici e commenti)
il percorso mentale intrapreso e l'interpretazione per quel
fenomeno.
Uno strumento OLAP apparirebbe come tipicamente induttivo
(cerco, esplorando i dati, una risposta ai miei perché
e quindi una spiegazione ai fenomeni che sto analizzando),
in realtà esso prevede, per poter essere usato con
semplicità, l'esistenza di una o più viste dei
dati aziendali che racchiudono buona parte delle regole interpretative.
Questa attività preliminare è normalmente a
carico dell'amministratore dei dati che ha appunto l'onere
di delineare il modello di riferimento (approccio deduttivo)
all'interno del quale l'utente finale compie le sue esplorazioni
(approccio induttivo).
(Tratto da 'Network NEWS' 20 Giugno 1997)
|