Tellement d’articles, de posts, de livres ont déjà paru sur le Big Data qu’il est à se demander si un texte de plus est encore bien utile. Pour autant, le vocabulaire employé est parfois si abscons qu’une approche sous l’angle charabia peut éventuellement contribuer à en compléter la description.
Big Data se traduit en bon français par le mot « mégadonnées »
Le terme « Big Data » a été popularisé par Gartner, société d’études et de conseil spécialisée dans les nouvelles technologies, il signifie « mégadonnées ». Méga, d’origine grecque, s’emploie comme suffixe pour attribuer le sens de « grand ». Nous parlons donc de beaucoup, beaucoup, beaucoup de données. Tellement nombreuses que les solutions techniques de stockage classique ne sont absolument plus adéquates. Pour pouvoir traiter et exploiter les mégadonnées, il va donc falloir construire des architectures spécifiques.
5V caractérisent les mégadonnées
Toujours en se référant à la définition de Gartner, on parle fréquemment des 5V du Big Data. Ces 5V sont tout simplement les caractéristiques principales des mégadonnées :
- 1er V pour Volume extrêmement élevé
- 2ème V pour Variété très large (des images, des dates, des flux, des fichiers…)
- 3ème V pour Valeur importante (pour assurer le développement d’une activité d’entreprise ou d’un service public)
- 4ème V pour Véracité (il est nécessaire de vérifier que les données retenues traduisent une situation réelle et juste)
- 5ème V pour Vitesse de propagation et de traitement hors du commun
Exploiter les mégadonnées nécessite la mise en place d’un « Data Lake »
Il s’agit littéralement d’un « Lac de Données », c’est-à-dire une sorte de dépôt, qui sert à la fois de stockage et de source d’information principale pour différentes applications. Les données stockées sont brutes et accessibles en lecture seule.
Le Big Data s’accompagne d’une cohorte de nouveaux métiers. On peut citer notamment le Data Scientist (expert en données capable de rendre lisible des données brutes, complexes et déstructurées). Il a la vision exhaustive des données de l’entreprise et pas seulement celles du marketing. A différencier du Data Analyste (spécialisé sur une typologie de données), du spécialiste Business Intelligence (aidant à mettre en place les outils d’informatique décisionnelle) et du Data Miner (statisticien spécialisé dans l’exploration des données et la création de modèles).
Pourquoi le marketeur doit-il décoder le charabia du Big Data ?
Sans devenir un expert technique, tout marketeur doit comprendre le jargon qui tourne autour du Big Data. En effet, connaître ce qui se cache derrière les mots lui permettra d’éviter l’enfumage interne provenant de sa propre DSI ou l’enfumage externe des prestataires de services prompts à vendre de la solution à tout crin. Il pourra d’autre part se poser les bonnes questions sur les données pertinentes à analyser sur son marché, sur la nécessité d’un traitement en temps réel, sur les compétences utiles pour assurer une montée en puissance, sur les priorités à retenir dans l’élaboration de la stratégie. Maîtriser l’approche et le charabia Big Data permettra au marketeur de rester une force de proposition crédible et motrice de l’entreprise.