Hadoop est la potion magique qu’on vous sert à toutes les sauces du Big Data et de l’entreprise numérique. Mais qu’est-ce que c’est en réalité ? Et surtout, qu’est-ce que ce n’est pas ? Hadoop, c’est quoi ? Au départ, c’est Apache Hadoop, une bibliothèque de logiciels open source utiles à construire un environnement distribué. Elle a un créateur : Doug Cutting (ci-contre) et la petite histoire dit que le nom vient du doudou éléphant de son fils. Mais son succès s’est entouré d’un certain nombre de mythes. En voici 12. Hadoop est un produit unique Hadoop, c’est du logiciel libre Hadoop se suffit à lui-même HDFS est un SGBD Hadoop, c'est du full SQL Hadoop et MapReduce forment un duo inséparable MapReduce est un outil d’analytique Hadoop est surtout un traitement de gros volumes Hadoop remplace un data warehouse Le Big Data ne peut pas vivre sans Hadoop Hadoop est gratuit Hadoop est surtout un produit d’analytique web Reprenons point par point: Résumé d’une tr...