Cosa è il data Warehousing? Definizione

Definizione Di data Warehousing.

Il warehousing, o stoccaggio, concerne la progettazione e la gestione di infrastrutture logistiche, impianti ed altre attrezzature utilizzate per la raccolta, l’immagazzinamento e la movimentazione di beni. Rientra fra le principali funzioni della distribuzione fisica.

Per warehouse si intende generalmente il deposito dove viene conservata la merce prima di essere distribuita fra i punti vendita, nelle modalità e al momento richiesto. Si parla specificatamente di scorta, stock o giacenza per indicare i quantitativi di beni e materiali che vengono conservati in magazzino per un futuro utilizzo.

Componente fondamentale della business intelligence.

In informatica, un data warehouse (DW o DWH), noto anche come EDW (Enterprise Data Warehouse), è un sistema utilizzato per la reportistica e l’analisi dei dati ed è considerato un componente fondamentale della business intelligence. I DW sono repository centrali di dati integrati da una o più fonti disparate. Conservano i dati correnti e storici in un unico punto utilizzati per creare report analitici per i lavoratori in tutta l’azienda.

I dati memorizzati nel magazzino vengono caricati dai sistemi operativi (come marketing o vendite). I dati possono passare attraverso un archivio dati operativo e possono richiedere la pulizia dei dati per operazioni aggiuntive per garantire la qualità dei dati prima che vengano utilizzati nel DW per la segnalazione.

Estrazione, trasformazione, caricamento (ETL)

Il tipico data warehouse segue il seguente schema: estrazione, trasformazione, caricamento (ETL) utilizza staging, integrazione dati e livelli di accesso per ospitare le funzioni chiave.

Il livello di staging o il database di staging memorizza i dati grezzi estratti da ciascuno dei diversi sistemi di dati di origine. Il livello di integrazione integra i diversi set di dati trasformando i dati dal livello di staging che spesso memorizzano questi dati trasformati in un database ODS (Operating Data Store). I dati integrati vengono quindi spostati in un altro database, spesso chiamato database del data warehouse, in cui i dati sono organizzati in gruppi gerarchici, spesso chiamati dimensioni, in fatti e fatti aggregati. La combinazione di fatti e dimensioni è talvolta definita schema a stella. Il livello di accesso aiuta gli utenti a recuperare i dati.

La fonte principale dei dati viene pulita, trasformata, catalogata e resa disponibile per l’uso da parte di manager e altri professionisti del business per il data mining, l’elaborazione analitica online, ricerche di mercato e supporto decisionale. Tuttavia, i mezzi per recuperare e analizzare i dati, per estrarre, trasformare e caricare i dati e per gestire il dizionario dei dati sono considerati componenti essenziali di un sistema di data warehousing.
Molti riferimenti al data warehousing utilizzano questo contesto più ampio. Pertanto, una definizione ampliata per il data warehousing include strumenti di business intelligence, strumenti per estrarre, trasformare e caricare dati nel repository e strumenti per gestire e recuperare i metadati.

Posted in Business Intelligence e Warehousing.