Blog Widget by LinkWithin

22 sept. 2016

Solution Hadoop pour le Big Data, c'est quoi?


Et non, rien à voir avec l'équipe en charge de réprimander les vilains pirates qui téléchargent les albums de Louane! Explications...

Qu'est-ce que l'Hadoop?

L'Hadoop est un framework Open Source écrit en Java permettant de traiter des volumes de données pouvant atteindre plusieurs petaoctets. Ainsi, l'Hadoop fait partie du Big Data dans le domaine du cloud computing. Conçu en 2004, l'Hadoop est utilisé principalement par Yahoo pour pouvoir supporter l'historique de son moteur de recherche. De nombreux autres géants d'internet utilisent également l'Hadoop tels que Google, Linkedin, Twitter ou encore Facebook qui exploite actuellement le plus gros cluster au monde. Vous aurez compris que cela est alors très utile pour eux étant donné qu'ils ont besoin de traiter de gros volumes. 
Ainsi, Hadoop est un système permettant le traitement des données pour leur stockage mais également le traitement d'une très large quantité de données de manière simultanée.

Cluster Hadoop de chez Yahoo!

Pourquoi choisir Hadoop as a service ?


Hadoop as a service a l'avantage de proposer une solution de cloud computing de données en grande quantité à un tarif très avantageux mais également avec une accessibilité rapide et très facile. Le seul but étant de favoriser la croissance de l'entreprise en réduisant les coûts d'investissement dans des frameworks. La demande est élastique c'est à dire que vous payez en fonction de vos besoins, garantissant ainsi scalabilité et flexibilité. 

Hadoop as a service est très utilisé par de nombreuses entreprises car il propose un environnement quasiment sans limites pour pouvoir traiter vos données uniquement avec un matériel relativement basique. Hadoop permet ainsi d'examiner chaque fichier compris dans une base de données pour optimiser le traitement des données. Il est d'ailleurs devenu très à la mode ces derniers temps, dans les entreprises, pour se débarrasser de ses entrepôts d'archives encombrants et faisant perdre du temps pour les remplacer par des clusters Hadoop.

Les inconvénients d'Hadoop


Bien évidemment comme tous ses concurrents, haas possède également quelques inconvénients dans son utilisation. 

Par exemple cette technologie peut se montrer moins performante que d'autres sur des petits volumes de données (Haas ne conviendra pas aux entreprises dont le besoin est de traiter des données en petite quantité), ou ne pourra simplement pas être mise en œuvre si le traitement des données ne peut pas faire l'objet d'une parallélisation. Ces inconvénients peuvent se révéler sans importance pour de nombreuses entreprises, mais il est recommandé de se faire aider par un spécialiste en informatique pour vérifier que  Hadoop as a service est adapté à votre besoin et si tel est le cas, pour bénéficier d'un accompagnement sur la prise en main. En effet, si vous êtes seul, il vous faudra alors quelques temps pour pouvoir assimiler complètement la solution et réaliser une analyse de vos données.

2 commentaires :

  1. Sympa l'article, tu fais dans la vulgarisation maintenant ? :)

    RépondreSupprimer
    Réponses
    1. Ça m'arrive de temps en temps, notamment quand on entend parler de sujets qu'on ne finit par connaitre que de nom sans savoir réellement ce qui se cache derrière. Alors je creuse et je me dis que cette recherche peut profiter à d'autres ;)

      Supprimer