Le big data : gros coûts pour petits bénéfices ?

Publié par le

Tout le monde parle du big data, et les solutions logicielles envahissent le marché, Netezza d'IBM, Green Plum de EMC...marché lucratif pour les éditeurs mais est-ce uniquement cela ?

  • Imprimer

En fait sur le plan du praticien je suis content : le big data, c’est un moyen de traiter d’énormes fichiers sans se poser trop de questions sur la gestion du volume. Après, quand je vois le coût des solutions je calme un peu ma joie…..mais elles vont sûrement baisser.

Ensuite, confronté à la post rationalisation du coût, je me demande si ma bonne vieille pratique de l’échantillon pertinent et raisonné, pour mettre au point le modèle, puis du choix des variables retenues par le modèle pour le généraliser à toute la base, n’est pas finalement une « bonne vieille solution » simple et efficace.
C’est plus long, mais c’est moins cher !

Et quand pense à ce nouveau métier « Data Scientiste » et que je lis sa description sur les blogs spécialisés, je me dis que j’en suis un depuis des années sans le savoir, mais cela en jette !

Enfin quand je vois les outils d’analyse de données, qui se pluguent en front office sur les solutions de big data, je sais que tout le monde ne fera pas du big data analytique, même avec le plus puissant des serveurs, même sur internet où tout autre flux de donées avec Hadoop et autres langages évolués et logiciels intelligents.
Parce que les concepts pour analyser correctement les données ne sont pas dans les outils, ni dans la tuyauterie donc pas dans l’informatique, mais dans les statistiques, les mathématiques et les connaissances métiers.

J’ai surement un complexe avec le « big » de data. Pourtant, un serveur pour traiter toutes les données, au niveau le plus désagrégé, ce serait bien pratique quand même ; j’aimerais bien….

Qu’en pensez-vous ?

<p>Responsable du data mining et de la mod&eacute;lisation de SOCIO Logiciels, sp&eacute;cialiste du data mining, utilisateur des produits [...]...

Voir la fiche

La rédaction vous recommande

Sur le même sujet

Les bonnes pratiques de l'A/B testing
Data
Cabestan
Les bonnes pratiques de l'A/B testing

Les bonnes pratiques de l'A/B testing

Par Cabestan via Marketme

L'évaluation des retombées de vos campagnes emails est essentielle pour valider ou optimiser la pertinence de vos messages. L'A/B testing permet [...]

Les 3 piliers du marketing conversationnel
Data
Cabestan
Les 3 piliers du marketing conversationnel

Les 3 piliers du marketing conversationnel

Par Cabestan via Marketme

Le développement de la data et le recentrage sur les stratégies customer-centric pose un nouvel impératif : celui de (re)créer du sens en mettant [...]

Des données sur la donnée : je capitalise sur mon fichier clients !
Data
Data Company
Des données sur la donnée : je capitalise sur mon fichier clients !

Des données sur la donnée : je capitalise sur mon fichier clients !

Par Data Company via Marketme

Intégrer une conduite rigoureuse dans la collecte de données n’est pas en option ! De nombreuses contraintes et exigences émanent de ce périmètre. [...]