DossierLe big data
1 - Définition de Big Data : trois V : variété, volume, vélocité
Le Big Data est une notion parfois encore obscure qui inonde nos écrans depuis ces deux dernières années. Que se cache-t-il derrière cette expression anglophone sortie tout droit d'un film de science-fiction, caractérisée par ses 3V (Volume, Vélocité, Variété) ?
Commentaires laissés sur les réseaux sociaux ? Facebook ou Twitter, vidéos publiées sur YouTube ou Dailymotion, musique sur iTunes ou Deezer, paiements bancaires, emails, signaux GPS, carte SIM des appareils électroniques... : plus de 2,5 trillions d'octets de données transitent sur le web chaque jour, notamment grâce à la démocratisation du digital depuis l'ADSL et l'apparition des smartphones et tablettes (source : Le Nouvel Observateur).
Cet ensemble de données exponentiel représentait 1,2 zettaoctet (10 en 2010, puis 2,9 zettaoctets en 2012 et atteindrait les 40 zettaoctets en 2020 selon les spécialistes américains (Source : BPM et Gartner) qui ont ? en toute logique ? appelé le phénomène Big Data (traduire "Données volumineuses").
Big Data : unités de mesure
1 ko = 1 kilooctet = mille octets
1Mo = 1 mégaoctet = un million d'octets
1Go = 1 gigaoctet = un milliard d'octets
1 To = 1 téraoctet = un billion d'octets
1 Po = 1 pétaoctet = un billiard d'octets
1 Eo = 1 exaoctet = un trillion d'octets
1 Zo = 1 zettaoctet = un trilliard d'octets
Le Big Data se caractérise par la problématique des 3V :
- Vélocité : la vitesse à laquelle les données sont traitées simultanément
- Variété : l'origine variée des sources de données qui arrivent non structurées (formats, codes, langages différents...)
- Volume : le poids total des données collectées
Big Data : chiffres clés
12 zettaoctets de données ont été créés dans le monde en 2011
118 milliards d'emails sont envoyés chaque jour
235 téraoctets de données ont été collectés par The Library of Congress en avril 2011
30 fois plus de données seront générées d'ici 2020
Le télescope "Square kilometers away" produira plus d'1 téraoctet de données par minute en 2024
Twitter génère 7 téraoctets de données par jour
Facebook génère 10 téraoctets de données par jour
Facebook traite 50 milliards de photos
30 milliards de contenus sont échangés chaque mois sur Facebook
(Sources : EMC2, Le Monde, CNRS)