Eliminazione dei silos di dati utilizzando un multi-cloud ibrido e query federate

L'emergere del cloud computing ha creato uno spostamento tettonico nel panorama digitale. Nuove architetture informatiche più flessibili, resilienti e scalabili sono diventate possibili con l'emergere di questa nuova tecnologia.

Prima dell'arrivo del COVID-19, le migrazioni cloud erano già in corso, ma la pandemia ha accelerato il cambiamento e reso essenziale il cloud computing. La flessibilità dell'architettura cloud consente alle organizzazioni di distribuire i processi di elaborazione e l'archiviazione dei dati in una varietà di ambienti, combinando e abbinando la piattaforma più adatta ai requisiti di elaborazione. Ciò include architetture che abbracciano risorse on-prem e risorse cloud pubbliche, o cloud ibridi, e progetti che bilanciano i lavori di elaborazione e i dati su più cloud pubblici in una configurazione multi-cloud. Oggi, l'80% delle organizzazioni sta implementando approcci cloud ibridi e l'89% utilizza il multi-cloud.

Questa adozione all'ingrosso del cloud computing ha cambiato le mentalità. Le architetture sono progettate per sfruttare le capacità uniche della connettività universale e della scalabilità istantanea. Le applicazioni non devono più essere costruite come programmi monolitici che vengono eseguiti su una singola macchina, ma come raccolte di codice che vengono eseguite in modo indipendente su diversi server e cloud per ottenere un risultato predeterminato. Questo approccio più granulare al computing ha creato ambienti molto più dinamici, generando nuove opportunità di innovazione.

Perché il multi-cloud ibrido strategico

L'adozione di un multi-cloud, cloud ibrido o entrambi in una strategia multi-cloud ibrida presenta numerosi vantaggi, tra cui opportunità di ottimizzare la gestione dei dati. I multi-cloud ibridi aiutano le organizzazioni a ridurre rischi e costi, migliorando al contempo le prestazioni e la conformità normativa.

Ridurre il rischio con una maggiore resilienza

Uno dei rischi più significativi per qualsiasi sistema è la possibilità che vada in crash. La resilienza del sistema è fondamentale per fornire un servizio adeguato ai clienti e alle parti interessate. Le strategie multi-cloud ibride offrono più opzioni per spostare i lavori di elaborazione e mantenere copie ridondanti dei database per fornire una maggiore ridondanza. Una nuova piattaforma è sempre pronta se un cloud o un server riscontra problemi.

Ridurre il rischio di conformità con la sovranità dei dati

La sovranità dei dati impone ai paesi il diritto di stabilire regole per i dati raccolti all'interno dei propri confini. Rimanere conformi a queste normative gestendo al contempo i dati in più paesi con regole univoche è una sfida. Alcuni paesi richiedono che i dati raccolti nel loro territorio vengano archiviati su server all'interno dei propri confini. Le architetture multi-cloud ibride consentono alle organizzazioni di mantenere i dati all'interno dei confini di un paese rendendoli accessibili alle applicazioni in tutto il mondo.

La flessibilità riduce il rischio

La capacità di spostare rapidamente i carichi di lavoro da un fornitore cloud a un altro impedisce che un fornitore abbia troppa influenza sui tuoi dati e sulle tue applicazioni. La flessibilità di spostare facilmente dati e lavori di elaborazione da on-prem al cloud o da un fornitore a un altro consente alle organizzazioni di ottimizzare i loro processi e sfruttare i punti di forza di ogni piattaforma. Ad esempio, parti di applicazioni legacy possono essere rifattorizzate per essere eseguite nel cloud per sfruttare le capacità del cloud mantenendo i dati legacy on-prem.

Prestazione

Per molte applicazioni, la velocità è fondamentale per garantire risultati aziendali ottimali. Ad esempio, dati finanziari di Wall Street o applicazioni di sicurezza sofisticate ed esperienze all'avanguardia per i clienti. La capacità di anticipare le esigenze di dati e posizionare i dati ad alta richiesta più vicino al server che esegue il processo di elaborazione riduce la latenza delle app. Le strategie multi-cloud ibride offrono più scelte su come e dove è possibile organizzare i dati per avvicinarli ai motori di elaborazione e/o all'utente finale. Le applicazioni non devono recuperare i dati dal centro della rete ogni volta che sono necessari. Con le strategie multi-cloud ibride, c'è più flessibilità nell'accesso a nuove risorse e nel ridimensionamento delle applicazioni. Spostare i dati più vicino agli utenti rende anche i dati più accessibili.

Sfide del multi-cloud ibrido

Le strategie multi-cloud ibride hanno consentito ai design e alle architetture delle applicazioni di cambiare in modo significativo. I contenitori Docker standardizzati e gli orchestratori come Kubernetes hanno standardizzato il livello di astrazione che consente al codice dell'applicazione di essere eseguito indipendentemente dall'infrastruttura. Questa tecnologia consente a qualsiasi parte di un'applicazione di essere eseguita in qualsiasi ambiente cloud. I dati sono molto più complessi e in continuo cambiamento, rendendo questo tipo di approccio molto più complicato.

I dati cambiano costantemente e sono molto meno mobili. Sebbene i dati possano essere replicati e specchiati, più copie di dati esistono, più è difficile mantenere la coerenza e sapere quale set di dati è più valido. Questa sfida è esacerbata dalla proliferazione del cloud.

Dispersione delle nuvole

La facilità di provisioning di una nuova applicazione cloud o SaaS ha portato alla proliferazione incontrollata del cloud. Shadow IT ha portato alla crescita di archivi dati non controllati in applicazioni SaaS non autorizzate, dando origine a database non connessi e isolati. Questa tendenza ha portato a una crescente complessità, rendendo difficile l'analisi dei dati in tutta l'organizzazione.

L'efficienza e i risparmi sui costi abilitati dal cloud vengono annullati dall'espansione incontrollata del cloud. La facilità di provisioning di una nuova app o cloud senza la governance appropriata sta portando a ridondanze, inefficienze e risorse inutilizzate. Le strategie multi-cloud ibride limitano la capacità di vedere e gestire l'intero patrimonio cloud di un'organizzazione, portando a sforamenti di costi.

Governance frammentata

La mancanza di una governance uniforme in una strategia multi-cloud ha anche implicazioni di sicurezza e accesso. Devono essere mantenute regole e policy di accesso univoche per gestire l'accesso nei multi-cloud ibridi. Ciò è complesso, poiché ogni cloud ha i suoi controlli sfumati. I professionisti dell'informatica devono comprendere le differenze di ogni cloud per mantenere una sicurezza e una governance adeguate. La mancanza di una governance uniforme rende difficile gestire regole di accesso sufficientemente granulari da supportare l'accesso ai dati richiesto dagli utenti autorizzati. I reparti IT ripiegano su regole di accesso più ampie e restrittive per semplificare questa sfida.

Sfide di modernizzazione delle applicazioni

La promessa di efficienza del cloud non sempre soddisfa le aspettative quando si modernizzano le applicazioni legacy. La migrazione dei database legacy sul cloud non è sempre compatibile con l'architettura cloud, limitando la possibilità di migrare intere applicazioni sul cloud, ostacolando la modernizzazione. Quando alcuni dati sono nel cloud mentre altri rimangono on-prem, accedere in modo efficiente a questi dati simultaneamente non è semplice, richiedendo chiamate API individuali. Molti nel settore si rendono conto che alcuni dati e applicazioni legacy potrebbero non arrivare mai sul cloud e rimarranno per sempre on-prem. Questo fatto richiede nuove strategie per incorporare queste applicazioni e database più vecchi in una strategia multi-cloud ibrida di successo.

Con i dati sparsi in tutto il cloud a causa dell'espansione incontrollata del cloud e dati bloccati in app e database legacy, l'accesso ai dati su architetture multi-cloud ibride non è sempre ottimale. Le query federate e i livelli di accesso virtualizzati possono aiutare a superare alcune di queste sfide.

Soluzione - Query federate e prodotti dati

Una query federata consente di estrarre dati da più database con una singola query. Ciò elimina la necessità di scrivere più query complesse e unire i risultati per creare un singolo set di dati. Basta scrivere una singola query SQL e i dati da più database possono essere estratti come se fossero un singolo database. I dati bloccati in vari archivi dati cloud e piattaforme SaaS dall'espansione del cloud possono essere accessibili e combinati attraverso questi silos di dati, favorendo un maggiore accesso ai dati e una maggiore comprensione del business in tutta l'organizzazione.

Una volta eseguite le query federate, i dati vengono immessi in un database virtuale. Questo livello di virtualizzazione separa la complessità del livello di elaborazione e della struttura del database dai dati effettivi. Questo livello funziona come un singolo punto di accesso in cui è possibile implementare un set unificato di regole di governance e protocolli di accesso, consentendo una visibilità e una gestione migliorate dei dati, indipendentemente dal fatto che siano archiviati in locale o in più cloud. Una minore complessità consente l'applicazione di regole di accesso granulari. Questo livello semplifica la gestione dei dati su diversi cloud astraendo i dati dai vari protocolli e controlli cloud. Invece di ricorrere a regole di accesso e governance universali, l'accesso può essere gestito con i dati al centro. Le limitazioni delle policy di sistema non definiscono più a quali dati gli utenti possono e non possono accedere.

Questo livello di dati federati fornisce anche la base per i prodotti di dati. Un nuovo, migliore modello di implementazione di un livello di controllo aggiuntivo che fornisce ai produttori di prodotti di dati e al gestore di dominio un maggiore controllo.

Ottimizzazione delle query su multi-cloud ibridi

Le query federate consentono molteplici opportunità per ottimizzare l'accesso ai dati e le architetture dei dati cloud. Quando i dati non devono più essere archiviati in un'unica posizione affinché un'app possa accedervi facilmente, altri fattori possono essere presi in considerazione quando si decide dove archiviare i dati. Con i costi e gli sprechi del cloud che sfuggono al controllo, questa flessibilità può essere una risorsa significativa per le strategie Fin-Ops.

Ad esempio, se hai un'applicazione legacy con un database che potrebbe non essere compatibile con il cloud o è troppo sensibile per essere archiviato nel cloud, è possibile implementare una strategia di database ibrido in cui alcuni dati dell'applicazione vengono archiviati nel cloud mentre altri dati rimangono on-prem. Con una query federata, è possibile accedere a ogni database come se fosse uno con una singola query SQL. Ciò può ottimizzare i costi di archiviazione e larghezza di banda.

L'esecuzione di database in parallelo può anche essere utile quando si migrano dati sensibili sul cloud. La migrazione di applicazioni legacy offre molti vantaggi, ma il processo può essere rischioso. C'è sempre la possibilità che le vecchie applicazioni non vengano eseguite correttamente sulla nuova piattaforma o che i dati possano essere compromessi. Molte organizzazioni eseguiranno lo stesso database in parallelo nel cloud e on-prem per ridurre il rischio di perdita di dati. Se si verifica un problema con i dati nel cloud, le query federate possono estrarre i dati dal database on-prem ridondante senza alcuna interruzione.

Ottimizzazione delle prestazioni delle query

I motori di query federati possono migliorare le prestazioni e ottimizzare automaticamente l'utilizzo delle risorse tramite connettori premium. I connettori ben costruiti che collegano i database al livello di virtualizzazione possono organizzare i processi ed eseguirli sulla piattaforma più appropriata. Noti come predicate push down, i connettori possono istruire determinate quantità di data wrangling da condurre sulla risorsa di elaborazione del database. Operazioni come filtraggio, aggregazione, ordinamento e eliminazione delle colonne possono essere condotte prima che il set di dati venga inserito nel livello di virtualizzazione. Questo processo può ridurre i costi di larghezza di banda poiché solo i set di dati accoppiati vengono estratti dal database. Riduce inoltre i tempi di query ed evita processi di elaborazione a valle.

Prodotto dati come contenitore

Come abbiamo detto prima, Docker e Kubernetes hanno permesso di impacchettare e utilizzare il codice applicativo da qualsiasi punto del cloud. Queste architetture cloud-native sono molto più efficienti, resilienti e preziose perché possono essere facilmente modificate. Nel mondo dei dati, i prodotti dati supportati dalla virtualizzazione e dalle query federate stanno emergendo come un livello di astrazione simile per i dati. I prodotti dati sono preconfezionati e progettati per essere intercambiabili tra vari strumenti di BI o piattaforme di modellazione. Sono in continuo miglioramento e i produttori di prodotti dati, simili agli sviluppatori di applicazioni, stanno raccogliendo e incorporando feedback per migliorare i loro prodotti.

L'emergere dell'architettura multi-cloud ibrida ha avuto un impatto significativo sullo sviluppo delle applicazioni e su come e dove vengono eseguiti i processi di elaborazione. Questa tendenza non ha avuto lo stesso livello di impatto sulla gestione dei dati a causa della natura e della sensibilità dei dati in continuo cambiamento. Una maggiore adozione di query federate, virtualizzazione, governance incentrata sui dati e prodotti dati apporta questa flessibilità alla gestione dei dati, rendendoli più agili e accessibili. Questa evoluzione sta guidando l'innovazione e maggiori approfondimenti nel processo decisionale.