Démantèlement des silos de données grâce à un cloud hybride multi-cloud et des requêtes fédérées

L'émergence du cloud computing a créé un changement tectonique dans le paysage numérique. De nouvelles architectures informatiques plus flexibles, résilientes et évolutives sont devenues possibles avec l'émergence de cette nouvelle technologie.

Avant l’arrivée de la COVID-19, les migrations vers le cloud étaient déjà bien avancées, mais la pandémie a accéléré le changement et rendu le cloud computing indispensable. La flexibilité de l’architecture cloud permet aux organisations de répartir les processus de calcul et le stockage des données dans une variété d’environnements, en combinant et en associant la plateforme la mieux adaptée aux besoins informatiques. Cela inclut des architectures qui couvrent les ressources sur site et les ressources du cloud public, ou les clouds hybrides, et des conceptions qui équilibrent les tâches informatiques et les données sur plusieurs clouds publics dans une configuration multicloud. Aujourd’hui, 80 % des organisations déploient des approches de cloud hybride et 89 % utilisent le multicloud.

L’adoption généralisée du cloud computing a fait évoluer les mentalités. Les architectures sont conçues pour tirer parti des capacités uniques de connectivité universelle et d’évolutivité instantanée. Les applications ne doivent plus être conçues comme des programmes monolithiques exécutés sur une seule machine, mais comme des collections de codes qui s’exécutent indépendamment sur différents serveurs et clouds pour atteindre un résultat prédéterminé. Cette approche plus granulaire de l’informatique a créé des environnements beaucoup plus dynamiques, générant de nouvelles opportunités d’innovation.

Pourquoi un multicloud hybride stratégique

L'adoption d'un cloud multicloud, d'un cloud hybride ou des deux dans une stratégie multicloud hybride présente de nombreux avantages, notamment des possibilités d'optimisation de la gestion des données. Les multiclouds hybrides aident les organisations à réduire les risques et les coûts tout en améliorant les performances et la conformité réglementaire.

Réduisez les risques grâce à une résilience accrue

L’un des risques les plus importants pour tout système est sa possibilité de panne. La résilience du système est primordiale pour fournir un service adéquat à vos clients et parties prenantes. Les stratégies multicloud hybrides offrent davantage d’options pour déplacer les tâches de calcul et conserver des copies redondantes des bases de données afin d’offrir une plus grande redondance. Une nouvelle plateforme est toujours prête si un cloud ou un serveur rencontre des problèmes.

Réduisez les risques de non-conformité grâce à la souveraineté des données

La souveraineté des données impose aux pays le droit de définir des règles pour les données collectées sur leur territoire. Il est difficile de se conformer à ces réglementations tout en gérant les données sur plusieurs pays avec des règles uniques. Certains pays exigent que les données collectées sur leur territoire soient stockées sur des serveurs situés sur leur territoire. Les architectures multicloud hybrides permettent aux organisations de conserver les données sur leur territoire tout en les rendant accessibles aux applications du monde entier.

La flexibilité réduit les risques

La possibilité de transférer rapidement les charges de travail d'un fournisseur de cloud à un autre évite qu'un fournisseur ait trop d'influence sur vos données et vos applications. La flexibilité de déplacer facilement les données et les tâches de calcul d'un site vers le cloud ou d'un fournisseur vers un autre permet aux organisations d'optimiser leurs processus et de tirer parti des atouts de chaque plateforme. Par exemple, des parties d'applications existantes peuvent être refactorisées pour s'exécuter dans le cloud afin de tirer parti des fonctionnalités du cloud tout en conservant les données existantes sur site.

Performance

Pour de nombreuses applications, la vitesse est essentielle pour garantir des résultats commerciaux optimaux. Par exemple, les données financières de Wall Street ou les applications de sécurité sophistiquées et les expériences client de pointe. La capacité à anticiper les besoins en données et à positionner les données à forte demande plus près du serveur exécutant la tâche de calcul réduit la latence des applications. Les stratégies multicloud hybrides offrent davantage de choix quant à la manière et à l'endroit où vous pouvez organiser vos données pour les rapprocher des moteurs de calcul et/ou de l'utilisateur final. Les applications n'ont pas besoin de récupérer les données du centre du réseau chaque fois qu'elles sont nécessaires. Avec les stratégies multicloud hybrides, il existe une plus grande flexibilité pour accéder à de nouvelles ressources et faire évoluer les applications. Le rapprochement des données des utilisateurs rend également les données plus accessibles.

Défis du multicloud hybride

Les stratégies multicloud hybrides ont permis de modifier considérablement les conceptions et les architectures des applications. Les conteneurs Docker standardisés et les orchestrateurs tels que Kubernetes ont standardisé la couche d'abstraction qui permet au code d'application de s'exécuter indépendamment de l'infrastructure. Cette technologie permet à n'importe quelle partie d'une application de s'exécuter dans n'importe quel environnement cloud. Les données sont beaucoup plus complexes et en constante évolution, ce qui rend ce type d'approche beaucoup plus compliqué.

Les données évoluent constamment et sont beaucoup moins mobiles. Bien que les données puissent être répliquées et mises en miroir, plus il existe de copies de données, plus il est difficile de maintenir la cohérence et de savoir quel ensemble de données est le plus valide. Ce défi est exacerbé par l'étalement du cloud.

Étalement des nuages

La facilité avec laquelle une nouvelle application cloud ou SaaS peut être mise en place a conduit à une prolifération du cloud. Le Shadow IT a conduit à la croissance de magasins de données non contrôlés dans des applications SaaS non autorisées, ce qui a donné lieu à des bases de données non connectées et cloisonnées. Cette tendance a entraîné une complexité croissante, rendant difficile l'analyse des données au sein d'une organisation.

L'efficacité et les économies de coûts permises par le cloud sont annulées par la prolifération du cloud. La facilité avec laquelle il est possible de provisionner une nouvelle application ou un nouveau cloud sans la gouvernance appropriée conduit à des redondances, des inefficacités et des ressources inutilisées. Les stratégies multicloud hybrides limitent la capacité d'une organisation à visualiser et à gérer l'ensemble de son parc cloud, ce qui entraîne des dépassements de coûts.

Une gouvernance fragmentée

L’absence de gouvernance uniforme dans une stratégie multicloud a également des répercussions sur la sécurité et l’accès. Des règles et des politiques d’accès uniques doivent être maintenues pour gérer l’accès dans les multiclouds hybrides. Cela est complexe, car chaque cloud dispose de ses propres contrôles nuancés. Les professionnels des technologies de l’information doivent comprendre les différences de chaque cloud pour maintenir une sécurité et une gouvernance appropriées. L’absence de gouvernance uniforme rend difficile la gestion de règles d’accès suffisamment granulaires pour prendre en charge l’accès aux données requis par les utilisateurs autorisés. Les services informatiques se rabattent sur des règles d’accès plus larges et plus restrictives pour simplifier ce défi.

Défis de la modernisation des applications

Les promesses d’efficacité du cloud ne répondent pas toujours aux attentes lors de la modernisation des applications existantes. La migration des bases de données existantes vers le cloud n’est pas toujours compatible avec l’architecture cloud, ce qui limite la capacité de migrer des applications entières vers le cloud et entrave la modernisation. Lorsque certaines données sont dans le cloud tandis que d’autres restent sur site, il n’est pas simple d’accéder efficacement à ces données simultanément, ce qui nécessite des appels d’API individuels. De nombreux acteurs du secteur se rendent compte que certaines données et applications existantes n’atteindront peut-être jamais le cloud et resteront éternellement sur site. Ce fait nécessite de nouvelles stratégies pour intégrer ces anciennes applications et bases de données dans une stratégie multicloud hybride réussie.

Les données étant dispersées dans le cloud en raison de la prolifération des clouds et des données bloquées dans des applications et bases de données héritées, l'accès aux données sur les architectures multicloud hybrides n'est pas toujours optimal. Les requêtes fédérées et les couches d'accès virtualisées peuvent aider à surmonter certains de ces défis.

Solution - Requêtes fédérées et produits de données

Une requête fédérée permet d'extraire des données de plusieurs bases de données avec une seule requête. Cela élimine le besoin d'écrire plusieurs requêtes complexes et de fusionner les résultats pour créer un seul ensemble de données. Il suffit d'écrire une seule requête SQL et les données de plusieurs bases de données peuvent être extraites comme s'il s'agissait d'une seule base de données. Les données bloquées dans divers magasins de données cloud et plateformes SaaS par la prolifération du cloud peuvent être consultées et combinées dans ces silos de données, ce qui améliore l'accès aux données et la visibilité de l'entreprise dans toute l'organisation.

Une fois les requêtes fédérées exécutées, les données sont introduites dans une base de données virtuelle. Cette couche de virtualisation sépare la complexité de la couche de calcul et de la structure de la base de données des données réelles. Cette couche fonctionne comme un point d'accès unique où un ensemble unifié de règles de gouvernance et de protocoles d'accès peut être mis en œuvre, permettant une visibilité et une gestion améliorées des données, qu'elles soient stockées sur site ou dans plusieurs clouds. Une complexité moindre permet d'appliquer des règles d'accès granulaires. Cette couche simplifie la gestion des données sur différents clouds en faisant abstraction des données des différents protocoles et contrôles cloud. Au lieu de recourir à des règles d'accès et à une gouvernance universelles, l'accès peut être géré avec les données au centre. Les limitations des politiques système ne définissent plus les données auxquelles les utilisateurs peuvent ou non accéder.

Cette couche de données fédérées fournit également la base des produits de données. Un nouveau modèle amélioré de mise en œuvre d'une couche de contrôle supplémentaire qui offre aux producteurs de produits de données et aux gestionnaires de domaine un meilleur contrôle.

Optimisation des requêtes sur les multi-clouds hybrides

Les requêtes fédérées offrent de multiples possibilités d'optimisation de l'accès aux données et des architectures de données cloud. Lorsque les données n'ont plus besoin d'être stockées à un seul endroit pour qu'une application puisse y accéder facilement, d'autres facteurs peuvent être pris en compte pour décider où stocker vos données. Alors que les coûts et le gaspillage du cloud deviennent incontrôlables, cette flexibilité peut être un atout important pour vos stratégies Fin-Ops.

Par exemple, si vous disposez d'une application héritée avec une base de données qui n'est peut-être pas compatible avec le cloud ou qui est trop sensible pour être stockée dans le cloud, une stratégie de base de données hybride peut être déployée dans laquelle certaines données d'application sont stockées dans le cloud tandis que d'autres données restent sur site. Avec une requête fédérée, chaque base de données est accessible comme si elle en était une avec une seule requête SQL. Cela peut optimiser les coûts de stockage et de bande passante.

L’exécution de bases de données en parallèle peut également être bénéfique lors de la migration de données sensibles vers le cloud. La migration d’applications héritées offre de nombreux avantages, mais le processus peut être risqué. Il existe toujours un risque que les anciennes applications ne fonctionnent pas correctement sur la nouvelle plateforme ou que les données soient compromises. De nombreuses organisations exécuteront la même base de données en parallèle dans le cloud et sur site pour réduire le risque de perte de données. Si un problème survient avec les données dans le cloud, les requêtes fédérées peuvent extraire les données de la base de données redondante sur site sans aucune interruption.

Optimisation des performances des requêtes

Les moteurs de requête fédérés peuvent améliorer les performances et optimiser automatiquement l'utilisation des ressources grâce à des connecteurs premium. Les connecteurs bien conçus qui connectent les bases de données à la couche de virtualisation peuvent organiser les processus et les exécuter sur la plate-forme la plus appropriée. Connus sous le nom de prédicat push down, les connecteurs peuvent ordonner à certaines quantités de traitement de données d'être effectuées sur la ressource de calcul de la base de données. Des opérations telles que le filtrage, l'agrégation, le tri et l'élagage des colonnes peuvent être effectuées avant que l'ensemble de données ne soit extrait dans la couche de virtualisation. Ce processus peut réduire les coûts de bande passante puisque seuls les ensembles de données appariés sont extraits de la base de données. Il réduit également les temps de requête et évite les processus de calcul en aval.

Produit de données en tant que conteneur

Comme nous l’avons mentionné précédemment, Docker et Kubernetes ont permis de conditionner et d’utiliser le code d’application depuis n’importe quel emplacement dans le cloud. Ces architectures cloud natives sont beaucoup plus efficaces, résilientes et précieuses, car elles peuvent être facilement modifiées. Dans le monde des données, les produits de données pris en charge par la virtualisation et les requêtes fédérées émergent comme une couche d’abstraction similaire pour les données. Les produits de données sont pré-conditionnés et conçus pour être interchangeables entre différents outils BI ou plateformes de modélisation. Ils s’améliorent constamment et les producteurs de produits de données, à l’instar des développeurs d’applications, collectent et intègrent les commentaires pour améliorer leurs produits.

L’émergence de l’architecture multicloud hybride a eu un impact considérable sur le développement des applications et sur la manière et le lieu d’exécution des tâches de calcul. Cette tendance n’a pas eu le même niveau d’impact sur la gestion des données en raison de la nature et de la sensibilité en constante évolution des données. L’adoption accrue des requêtes fédérées, de la virtualisation, de la gouvernance centrée sur les données et des produits de données apporte cette flexibilité à la gestion des données, les rendant plus agiles et plus accessibles. Cette évolution favorise l’innovation et une meilleure compréhension de la prise de décision.