Data lake : le nouvel outil incontournable ?
Après la DMP, grande tendance de l'année 2015, place au "data lake". Que recouvre le concept et comment le déployer ? Le point avec l'agence Equancy.
Je m'abonneLa Data Management Platform (DMP) aura, sans conteste, été la tendance "buzz" de 2015 : quel concept prendra l'ascendant en 2016 ? Le cabinet de consulting Equancy mise sur le "data lake" - le réservoir de données -, considéré comme "le nouvel outil incontournable de la data science et de la business intelligence, lorsque les annonceurs ne parviennent pas à avoir une vision à 360° et à répondre aux besoins de connaissances clients". Plongée dans le data lake, avec Hervé Mignot, associé au cabinet Equancy.
Data lake, qu'est-ce que c'est ?
Le data lake provient de différents besoins, explique l'expert :
- Résoudre les problèmes de coûts et les manques d'efficacité des BI traditionnels.
- C'est la première brique du big data : le data lake permet de déployer des use cases "big data" rapidement.
- Contourner les limites des solutions de business intelligence embarquées des nouveaux outils de marketing, tels que la DMP et la personnalisation.
- Comprendre les comportements cross-canaux et rebondir en quasi temps réel sur ceux-ci.
- Collecter et analyser les données non structurées.
"Le data lake recueille toutes les données des campagnes passées et présentes pour la business intelligence et l'analytics", complète Hervé Mignot. Malgré ses points communs, le data lake n'est pas une DMP - et vice-versa.
Quels sont les avantages ?
Le data lake en possèderait de nombreux, selon Equancy. Plus rapide, l'outil est aussi plus flexible. "C'est un point central pour focaliser les données de l'entreprise, indique Hervé Mignot. Il est, de plus, plus facile d'intégrer de nouvelles sources de données que l'on stocke et que l'on peut analyser a posteriori, en fonction de ses besoins".
Autre avantage : la possibilité de commencer petit et de grandir, sans repartir à zéro. Mais, attention, le data lake n'est pas une source miraculeuse, prévient Hervé Mignot : "La réconciliation de données repose toujours sur des croisements d'identifiants".
Par quoi commencer ?
Quelle est la première étape du déploiement d'un data lake ? La détermination des cas d'usages est indispensable pour s'assurer de son utilité, à l'instar de la détection de l'attrition. Il s'agira, ensuite, de choisir son infrastructure, ainsi que son hébergement - interne ou externe.
La mise en place d'une équipe dédiée se révèle également incontournable, rattachée au marketing ou à la direction financière et composée de data engineers, de data scientists, de data architects, d'expert de la visualisation, de data stewards ou encore d'administrateurs.