BigData: de la Hype à la Loose ?

B
Le terme marketing fourre-tout

Le concept BigData rassemble les technologies de base de données, qui permettent un stockage et un traitement de volumes gargantuesques (voire infinis).
Ces volumes étaient impossibles à gérer il y a une quinzaine d’années, et nous étions bien obligés de faire preuve de trésors de malice pour gérer des flux continus de données.
Une base de données jusqu’en 2005 était comme un énorme fichier Excel, certes très capable, mais avec un nombre limité de lignes. Et un nombre limité de types de données.

Mais l’économie numérique se développant, les géants naissants purent financer (Google & Facebook notamment) le développement de nouveaux systèmes de gestion de données, virtuellement sans aucune limite maximale, afin de gérer notamment les milliards de milliards de logs/analytics/types de données inhérents au trafic croissant sur la toile.

Cela donna naissance à des solutions technologiques qui inondèrent les articles des tabloïds magazines informatiques.
Puis elles devinrent des nécessités, si ce n’est marketing, en tout cas budgétaires pour les entreprises (et leurs prestataires SSII). D’autant plus que ces solutions furent livrées au monde open-source au début des années 2010, permettant de fait leur démocratisation et leur déploiement massif (et hasardeux).

Les Mots clefs (qui sont aussi des produits)

Qui n’a pas entendu parler de Hadoop, de Cassandra et de leurs « écosystèmes » ?
Et depuis 2014/2015, pour appartenir à la crème de la crème, il faut dépasser les objectifs en:
– constituant un Data Lake (beaucoup de données de sources différentes, centralisées au sein d’une seule solution),
– investissant dans un DMP (Data Management Platform) pour trouver des « informations cachées » intéressantes dans ce « tas » de données

La promesse était fantastique: aller au delà du simple reporting sur les événements passés, par la découverte de corrélations statistiques, difficiles à comprendre mais « gisement de valeur »… en gros, on allait « prévoir l’avenir » par des algorithmes, de l’IA et du Machine Learning. Voire du Deep Learning. Et une once de poudre de perlimpinpin.
Magique, n’est-ce pas ?

« Toute technologie suffisamment avancée est indiscernable de la magie »
Arthur C. Clarke

C’est là que le buzz word trouva ses limites.

La réalité rattrape et dézingue la hype

En 2015, Forbes nous rappela que les entreprises allaient investir chacune entre 1.6 et 13.6 millions de $ dans des initiatives BigData. Et que cela concernait 80% des entreprises américaines, rien que ça.
En 2016, TechRepublic nous indiquait que ces initiatives pouvaient s’élever à des centaines de millions de $ par entreprise, notamment les plus grosses d’entre elles.
Wow, hype maximale !

En 2017, voilà que Gartner annonce que 60% des projets BigData sont des échecs et que 49% des équipes ne comprennent même pas le sens de leur projet.
Ouch, loose historique !

Cette réalité brute, ces échecs conséquents évaporent les fantasmes et laissent place à des questions on-ne-peut-plus rationnelles:
Ces technologies sont-elles trop complexes et/ou trop immatures ?
Les équipes techniques présentent-elles des compétences insuffisantes ?
Les métiers ont-ils des demandes dénuées de cohérence/pertinence ?
A-t-on cédé aux sirènes d’une mode, sans intérêt pour l’entreprise ?
A ce propos, qui génère tant de données qu’il faille concevoir et mettre en place de telles architectures conçues par et pour les fameux GAFA ?
La magie n’existe-t-elle que dans les contes de fée ?

Nous tenterons de répondre à ces questions dans les prochains billets.
Nous disséquerons le monde complexe du « BigData », pour en identifier les composantes et surtout leur orientation stratégique pour l’entreprise.
Avec des exemples d’architectures techniques, d’organisations modernes et de budgets raisonnables qui ont, eux, permis d’aboutir à des succès réels 🙂

Stay tuned !


Les références de ce billet:

2015
La hype selon Forbes
Les slides de l’étude Forbes
La Hype selon TechRepublic

2017
La Loose selon Gartner

About the author

chen
chen

Digital Strategist, CTO & Architecte Cloud