Différence entre les RDB et Hadoop

Différence entre les RDB et Hadoop

Le différence clé Entre les RDB et Hadoop est que le Le RDBMS stocke les données structurées pendant que les stores Hadoop stocke des données structurées, semi-structurées et non structurées.

Le RDBM est un système de gestion de base de données basé sur le modèle relationnel. Le Hadoop est un logiciel pour stocker des données et exécuter des applications sur des grappes de matériel de base.

CONTENU

1. Aperçu et différence clé
2. Qu'est-ce que le SBRM
3. Qu'est-ce que Hadoop
4. Comparaison côte à côte - RDBMS vs Hadoop sous forme tabulaire
5. Résumé

Qu'est-ce que le SBRM?

RDBMS signifie Système de gestion de base de données relationnel basé sur le modèle relationnel. Dans les SGBDR, les tables sont utilisées pour stocker les données, et les clés et les index aident à connecter les tables. Une table est une collection d'éléments de données, et ce sont les entités. Il contient des lignes et des colonnes. Les lignes représentent une seule entrée dans le tableau. Les colonnes représentent les attributs.

Par exemple, la base de données des ventes peut avoir des entités clients et produits.  Le client peut avoir des attributs tels que client_id, nom, adresse, téléphone_no. L'article peut avoir des attributs tels que Product_id, nom, etc. La clé principale de la table client est Customer_ID tandis que la clé principale de la table de produit est Product_id. Placer le produit_id dans le tableau client en tant que clé étrangère relie ces deux entités. De même, les tables sont également liées les unes aux autres.  Ils fournissent l'intégrité des données, la normalisation et bien d'autres.  Peu de SBRM communs sont MySQL, MSSQL et Oracle. Ils utilisent SQL pour interroger.

Qu'est-ce que Hadoop?

Le Hadoop est un cadre open source Apache écrit en java. Il aide à stocker et à traiter une grande quantité de données sur des grappes d'ordinateurs à l'aide de modèles de programmation simples. L'objectif principal de Hadoop est de stocker et de traiter les mégadonnées, qui fait référence à une grande quantité de données complexes. Le débit de Hadoop, qui est la capacité de traiter un volume de données dans un délai particulier, est élevé.

Il y a quatre modules dans l'architecture Hadoop. Ils sont Hadoop Common, Yarn, Hadoop Distributed File System (HDFS) et Hadoop Mapreduce. Le module commun contient les bibliothèques et les services publics Java. Il a également les fichiers pour démarrer Hadoop. Hadoop Yarn effectue la planification des travaux et la gestion des ressources en grappes.

De plus, le système de fichiers distribué Hadoop (HDFS) est le système de stockage Hadoop. Il utilise l'architecture maître-esclave. Le nœud maître est le namenode, et il gère les méta-données du système de fichiers. Les autres ordinateurs sont des nœuds esclaves ou des datanodes. Ils stockent les données réelles. D'un autre côté, Hadoop MapReduce fait le calcul distribué. Il a les algorithmes pour traiter les données. Dans le HDFS, le nœud maître a un tracker. Il exécute la carte réduit les travaux sur les nœuds esclaves. Il existe un suivi de tâche pour chaque nœud esclave pour terminer le traitement des données et renvoyer le résultat au nœud maître. Dans l'ensemble, le Hadoop fournit un stockage massif de données avec une puissance de traitement élevée.

Quelle est la différence entre le SBRM et Hadoop?

RDBMs vs Hadoop

RDBMS est un logiciel système pour créer et gérer des bases de données basées sur le modèle relationnel. Hadoop est une collection de logiciels open source qui relie de nombreux ordinateurs pour résoudre des problèmes impliquant une grande quantité de données et de calcul.
 Variété de données
SHADBS stocke les données structurées. Hadoop Stores Structurées, semi-structurées et non structurées.
Stockage de données
Les SGBDR stocke la quantité moyenne de données. Hadoop stocke une grande quantité de données que les SGBDR.
 Vitesse
Dans les SRDB, les lectures sont rapides. Dans Hadoop, les lectures et les écritures sont rapides.
Évolutivité
Le RDBM a une évolutivité verticale. Hadoop a une évolutivité horizontale.
Matériel
Les SGBDR utilisent des serveurs haut de gamme. Hadoop utilise du matériel de marchandise.
  Débit
Le débit SGBDR est plus élevé. Le débit Hadoop est plus bas.

Résumé - RDBMs vs Hadoop

Cet article a discuté de la différence entre le SBRM et Hadoop. La principale différence entre le RDBM et Hadoop est que le SGBDR stocke les données structurées tandis que les données Hadoop stocke structurées, semi-structurées et non structurées.

Référence:

1.Point de tutoriels. «Concepts SQL RDBM.», Tutorials Point, 8 janvier. 2018. Disponible ici  
2.Point de tutoriels. «Tutoriel Hadoop.», Tutorials Point, 8 janvier. 2018. Disponible ici  

Image gracieuseté:

1.'8552968000' par Intel Free Press (CC BY-SA 2.0) via Flickr