En interrogeant des entreprises du monde entier, L’Economist Intelligence Unit a récemment révélé que pour une majorité d’entre elles, les données sont « essentielles » à la productivité. Il est donc logique pour la majeure partie des entreprises modernes de rechercher la meilleure façon de s’emparer de leurs données pour ensuite les analyser.
Mais quelle solution choisir ? Une large gamme de technologies et de types de déploiements s’offre à elles. Des entrepôts de données et écosystèmes Hadoop aux déploiements dans le Cloud, sur site et hybrides, le paysage des données est vaste et ses nombreuses technologies évoluent sans cesse.
Lorsque l’on évalue et sélectionne des outils de gestion des données pour son entreprise, il est important de comprendre les grandes tendances du marché. Cela permettra de garantir l’évolutivité des systèmes tout en tirant parti des innovations d’aujourd’hui dans le domaine de la gestion des données.
Trois tendances majeures sont à garder à l’esprit lorsqu’une entreprise cherche à développer sa stratégie de données :
1. Du local vers le Cloud : les données changent de centre de gravité.
Le « Cloud » se propage dans le secteur des technologies depuis quelque temps, mais la révolution du Cloud n’a atteint les données que depuis peu. Des plateformes telles qu’Amazon Web Services, Microsoft Azure et Google Cloud Platform permettent aux entreprises de capturer et stocker aisément leurs données dans des bases de données Cloud et dans des écosystèmes Hadoop.
Si l’on prend Tableau comme exemple, nous avons constaté une augmentation de 28 % de l’utilisation de données hébergées dans le Cloud dans Tableau Online au cours des 15 derniers mois. À la fin du premier trimestre de 2016, près de 70 % des données de nos clients étaient hébergées dans le Cloud.
La gravité des données indique leur force d’attraction sur les services et applications. Si les données résident dans le Cloud, par exemple, les utilisateurs souhaiteront sans doute que leurs outils de gestion des données (du traitement aux analyses) s’exécutent également dans le Cloud. Le centre de gravité des données est maintenant directement focalisé sur le Cloud, et cette focalisation ne fera que s’amplifier à l’avenir. Il est recommandé aux entreprises créant des écosystèmes de données de concentrer leurs efforts sur des flux de travail Cloud pour faire en sorte que leurs systèmes puissent faire face à ce changement de gravité des données.
2. Si les données migrent progressivement vers le Cloud, les technologies de données hybrides restent centrales pour l’activité des entreprises.
En déplaçant leurs activités dans le Cloud, les entreprises établies réalisent souvent que certaines de leurs données doivent rester sur site. Les exigences en matière de sécurité et de confidentialité, par exemple, devront sans doute être stockées derrière des pare-feu d’entreprise. Il peut arriver aussi que le déplacement vers le Cloud soit un processus lent et incrémentiel prenant plusieurs mois, voire des années. De tels scénarios révèlent le besoin de solutions hybrides.
Des bases de données hybrides peuvent être déployées à la fois dans le Cloud et sur le site de l’entreprise. S’il est impossible de déplacer toutes ses données dans le Cloud ou si un déplacement incrémentiel est préféré, les options hybrides offrent alors la flexibilité nécessaire pour faire le lien entre les données hébergées dans le Cloud et celles qui sont sur site.
Pour revenir à l’exemple précédent, les bases de données hybrides les plus utilisées dans Tableau Online sont SQL Server, MySQL et PostgreSQL. Au premier trimestre de 2016, ces trois bases de données représentaient plus de la moitié de toutes les sources de données utilisées par nos clients.
Incontestablement, les produits natifs du Cloud tels que Redshift et BigQuery gagnent de plus en plus de parts de marché. Il est cependant encore trop tôt pour voir émerger un vainqueur parmi toutes ces technologies. En dépit de la croissance constante, les sources de données natives du Cloud ne représentent qu’un quart de toutes les connexions utilisées dans Tableau Online. Les sources hybrides, en revanche, ne sont jamais descendues en-deçà de 60 %.
Gartner a récemment annoncé que ces solutions hybrides deviendraient la norme d’ici 2018. Pour les entreprises opérant une transition vers le Cloud, la technologie hybride est déjà la norme.
3. Dorénavant, le stockage de données ne se limite plus aux traditionnelles bases de données.
Avec l’avènement de l’Internet des Objets (ou IoT, Internet of Things), les données proviennent dorénavant de partout. Par conséquent, le paysage de capture et de stockage s’est étendu pour répondre aux exigences de flux de données nouveaux et variables.
Les outils de données hébergés dans le Cloud en particulier favorisent cette expansion avec des produits offerts « en tant que service ». Les nouveaux-venus tels que Snowflake repensent la mise à disposition de bases de données, tandis que les solutions hébergées telles qu’Amazon Elastic MapReduce ont étendu les fonctionnalités des écosystèmes Hadoop traditionnels.
Pour reprendre le même outil d’analyse dans le Cloud en tant qu’exemple, plus de 40 types de sources de données sont représentés dans Tableau Online. Même lorsque les sources basées sur des fichiers telles qu’Excel et les applications Web telles que Google Analytics sont exclues, 32 types distincts de bases de données et d’écosystèmes Hadoop sont représentés. Cette diversité illustre la gamme vaste et variée d’outils de données disponibles aujourd’hui.
Et cette gamme n’a pas fini de grandir ! D’après une étude de Gartner, les bouleversements accélèrent l’innovation dans les outils d’entreposage conçus explicitement pour l’analyse de données. Par conséquent, les entreprises doivent connecter leurs outils d’analyse pas seulement à une, mais à plusieurs sources de données réparties dans des bases de données, des écosystèmes Hadoop et des applications Web.
Pour tirer parti de ce rythme effréné d’innovation que connaissent les données, créer un flux de données qui donne la priorité à la flexibilité et au choix avant tout est un point essentiel.
Remarque : Les informations contenues dans cet article sont basées sur des données anonymes d’utilisation de Tableau Online. Elles excluent les sources de données basées sur des fichiers de type Excel et les applications Web d’entreprises telles que Salesforce.com et Google Analytics. Étant donné que nous représentons un outil hébergé dans le Cloud, les tendances risquent de représenter un parti pris en faveur du Cloud. Cela dit, les données sont un indicateur précis de tendances plus larges sur le marché.
___________
Edouard Beaucourt est Directeur régional France et Europe du Sud, Tableau