DATA RISE
La continua evoluzione tecnologica, le fusioni, le acquisizioni, la distribuzione geografica tra le sedi produttive rappresentano fattori che contribuiscono al proliferare di sistemi informatici e, quindi, alla proliferazione delle basi di dati in uso.
Ad esempio, nel settore bancario-finanziario, le fusioni sono un evento che oramai avviene con elevata frequenza. Il neo costituito gruppo, eredita il patrimonio dei dati delle singole banche che lo costituiscono.
Molti di questi dati possono essere stati organizzati utilizzando database relazionali, e implementati con diverse famiglie di data base management system. Possono essere stati utilizzati differenti sistemi di document management per l’archiviazione di documenti, o potrebbero essere presenti applicazioni per il calcolo di informazioni critiche (ad esempio, il rischio di un prestito a un determinato cliente), o possedere molte informazioni sui profili dei clienti.
Questo, in un ottica che spinge sempre più verso la integrazione e cooperazione dei processi, da quelli business-critical a quelli strettamente tecnico-operativi, rappresenta una grossa barriera alla conduzione strategica di una impresa/ente.
Post fusione diventa necessario accedere a tutte le precedenti tipologie di informazioni per ognuna delle banche fuse, analizzare il nuovo portafoglio clienti utilizzando sia risorse esistenti sia nuove applicazioni e, in generale, consentire l'uso combinato delle risorse attraverso una interfaccia comune. Deve essere possibile identificare i clienti comuni e consolidare i loro dati, anche se le varie banche utilizzano diversi metodi di recupero dei dati, o semplicemente diverse chiavi di identificazione.
Generalizzando, la necessità avvertita, infatti, è:
- valorizzare al massimo i dati e le informazioni (clienti, mercato, vendite, processi produttivi,…) raccolti nel tempo, facendoli divenire elemento fondante a supporto delle decisioni strategiche;
- Pervenire ad una integrazione dei processi a supporto del business di una impresa passando per la necessaria integrazione dei differenti sistemi informatici a questi sottostanti.
Al fine di soddisfare tale esigenza è tuttavia necessario disporre di metodi, tecniche e strumenti ad hoc:
- capaci di integrare sorgenti di dati ed informazioni tra loro eterogenee al fine di renderle utilizzabili come se queste fossero un’unica sorgente integrata;
- supportare il processo di reingegnerizzazione dei dati e successiva integrazione di questi affinché possano essere utilizzati da sistemi informatici integrati.
L’eterogeneità delle sorgenti dati è ad oggi dettata da elementi che spaziano dal logico, al tecnologico passando per le differenze strutturali e di contenuto:
- l’organizzazione logica dei dati può basarsi su modelli relazionali, ad oggetti, o semplicemente tracciati record su flat file, strutture dati XML based, ecc;
- i fornitori di tecnologia, ad es. Oracle, Microsoft, IBM propongono molteplici sistemi di gestione di basi di dati che spesso si ritrovano a convivere in uno stesso contesto (stessa impresa/ente) pur non dialogando tra loro. Più precisamente, non di rado ci si ritrova di fronte ad imprese o enti che, nel tempo, hanno acquisito DBMS di differenti produttori. Altresì, tali DBMS spesso contengono dati equivalenti (si pensi alla anagrafica dei clienti ad es.) pur essendo utilizzati da sistemi informatici differenti e tra loro non interconnessi;
- il contenuto informativo delle differenti basi di dati in uso presso un’impresa è spesso largamente sovrapposto (ad es. l’anagrafica clienti potrebbe, seppur contenuta in DBMS di produttori differenti, espressa in forma e struttura differente, essere utilizzata tanto dal sistema fatturazione che da quello marketing) generando evidenti problemi di ridondanza ed aggiornamento dei dati trattati.
Ciò premesso, l’obiettivo dell’iniziativa Data Rise è soddisfare le esigenze anzi espresse attraverso:
- proposizione di metodi e tecniche, logicamente integrati in processi, per la integrazione di informazioni distribuite tra più sorgenti fisiche tra loro eterogenee per contenuto, struttura e tecnologia (Information Integration) oltre che di supporto alla reingegnerizzazione di tali sorgenti.
- lo sviluppo di prototipi dimostrativi a supporto della automazione dei processi proposti;
- la sperimentazione dei processi proposti, resa possibile grazie all’uso dei dimostrativi sviluppati, al fine di verificarne quantitativamente l’efficacia.
Data Rise presenta le seguenti caratteristiche:
- Trasparenza: un sistema federato integrato è trasparente se nasconde all’utente le differenze, e le scelte implementative dei sottostanti livelli di dati.
- Flessibilità ed estendibilità: tutti i sistemi necessitano di evolversi nel corso del tempo e deve essere quindi possibile modificare rapidamente e implementare altrettanto rapidamente nuove funzionalità;
- Indipendenza dalle sorgenti dati: solitamente una sorgente dati è legata ad applicazioni ed utenti esistenti. E’ quindi fondamentale che le funzionalità originali non siano alterate dopo l’integrazione.
Indipendenza dai DBMS: l’aggiunta o la rimozione di fonti dati non introduce cambiamenti nella struttura dell’applicazione stessa, contrariamente a quanto avviene con i data warehouse;
- Potenza espressiva: l'utente finale deve poter dialogare con il sistema attraverso un linguaggio di query ad alto livello per combinare, estrarre e manipolare i dati di interesse;
- Economica: le più comuni soluzioni di integrazione aziendale, come i data warehouse, spesso si rivelano troppo costose, in quanto necessitano lo spostamento fisico e la conseguente duplicazione dei dati verso i warehouse. Al contrario, nel contesto di riferimento di questo progetto la soluzione proposta prevede che il warehouse creato sia virtuale, evitando così lo spostamento fisico di grosse quantità di informazioni.
Oltre a supportare le precedenti caratteristiche, DATA RISE dovrà garantire l’autonomia delle sorgenti di dati ed in particolare prevedere il rispetto dell’execution-autonomy e dell’association-autonomy, ovvero due delle principali proprietà che un Multiple Database System dovrebbe supportare.
L’esposizione dei dati integrati avverrà on fly, ovvero l’accesso alle fonti locali avverrà in tempo reale, garantendo una totale sincronizzazione tra il contenuto di queste e quello esposto dal sistema.
La strategia di Information Integration sottostante Data Rise, che contempla la capacità di integrare fonti di dati di natura differente, risulta inoltre essere un valido supporto alla reingegnerizzazione iterativa delle applicazioni. Data Rise consentirà infatti di re ingegnerizzare il patrimonio informativo senza richiedere interruzioni nell’esercizio del o dei vecchi sistemi informatici che utilizzano le sorgenti dati integrate. Queste ultime potranno infatti essere normalmente utilizzate sino al momento in cui, a valle del rilascio del nuovo sistema informatico, saranno fisicamente sostituite dal database re ingegnerizzato ed integrato, ottenuto quale risultato dell’applicazione di Data Rise.
E’ importante sottolineare questa particolare capacità di Data Rise in quanto l’approccio comunemente adottato durante un processo di reingegnerizzazione delle applicazioni, consta di due attività: la gestione dei cosiddetti “tempi morti” cioè il tempo che di solito intercorre tra l’inizio delle operazioni di reingegnerizzazione e il completamento di queste, e la obbligatoria duplicazione della sorgente dati interessata. Queste attività costituiscono un enorme carico di costi in termini di tempo e di risorse per le imprese che vogliono perseguire l’obiettivo di reingegnerizzazione. Attraverso le innovazioni introdotte da Data Rise, sarà possibile effettuare le suddette operazioni su porzioni più o meno ampie dei sistemi coinvolti in real-time, senza cioè inficiare la normale operatività che questi sistemi sono chiamati a garantire. In Data Rise non è necessario duplicare i dati soggetti a reingegnerizzazione in quanto la struttura che li espone all’esterno è virtuale e non coinvolge direttamente le sorgenti di origine.
Inoltre, le attività di reingegnerizzazione potrebbero essere distribuite nel tempo al crescere delle necessità e delle risorse a ciò destinate.
Ulteriore contributo di Data Rise alla risoluzione dei problemi legati alla reingegnerizzazione, è il poter rendere persistente uno schema integrato re ingegnerizzato generando così, in maniera automatica, lo schema fisico del database: una qualsiasi fonte dati integrata, totalmente o parzialmente re ingegnerizzata, può, quindi, essere oggetto di più integrazioni senza alcun impatto sulle applicazioni che la utilizzano. Riprendendo l’esempio del contesto bancario precedentemente presentato, una banca potrebbe sentire più impellente la re ingegnerizzazione del sistema di gestione dei mutui piuttosto che di altri sottosistemi o della totalità di questi. Questa banca, utilizzando Data Rise, potrebbe: effettuare una prima integrazione di tutte le sue sorgenti dati; progettare e realizzare una reingegnerizzazione mirata solo sulla sorgente dati del “sistema mutui”; materializzare la sorgente dati re ingegnerizzata e sostituirla a quella originaria; aggiornare l’integrazione precedente con la nuova sorgente re ingegnerizzata, senza alcun impatto sui restanti sistemi integrati e ad un costo decisamente inferiore a quello da sostenere con gli approcci tradizionali di reingegnerizzazione.