Ako sa v Hadoop dosahuje lokalizácia údajov?
Ako sa v Hadoop dosahuje lokalizácia údajov?

Video: Ako sa v Hadoop dosahuje lokalizácia údajov?

Video: Ako sa v Hadoop dosahuje lokalizácia údajov?
Video: Как использовать Hive в качестве менеджера проекта локализации 2024, Smieť
Anonim

Lokalizácia údajov v Hadoop . Vezmite si ukážkový príklad počtu slov, kde sa väčšina slov zopakovala 5 Lacov alebo viackrát. V takom prípade po fáze mapovača bude mať každý výstup mapovača slová v rozsahu 5 Lac. Tento úplný proces ukladania výstupu Mapper do LFS sa nazýva ako Lokalizácia údajov.

Vzhľadom na to, čo je lokalizácia údajov v Hadoop?

Koncepcia Údaje lokalita v Hadoop údaje lokalita v MapReduce sa vzťahuje na schopnosť presunúť výpočet bližšie k skutočnému miestu údajov sídli na uzle, namiesto toho, aby sa pohyboval vo veľkom údajov na výpočet. To minimalizuje preťaženie siete a zvyšuje celkovú priepustnosť systému.

Tiež, ako sa ukladajú veľké dáta? Väčšina ľudí automaticky spája HDFS alebo Hadoop Distributed File System s Hadoopom údajov sklady. HDFS ukladá informácie do klastrov, ktoré sa skladajú z menších blokov. Tieto bloky sú uložené vo fyzickom na mieste skladovanie jednotky, ako sú interné diskové jednotky.

Len tak, ako sú údaje uložené v Hadoop?

Na a Hadoop klaster, údajov v rámci HDFS a systému MapReduce sú umiestnené na každom počítači v klastri. Údaje je uložené v údajov blokov na DataNodes. HDFS ich replikuje údajov bloky, zvyčajne s veľkosťou 128 MB, a distribuuje ich tak, aby boli replikované v rámci viacerých uzlov v rámci klastra.

Ako sa ukladajú súbory v HDFS?

HDFS vystavuje a súbor systémový menný priestor a umožňuje, aby boli používateľské dáta uložené v súbory . Interne, a súbor je rozdelená do jedného alebo viacerých blokov a tieto bloky sú uložené v množine DataNodes. NameNode sa spustí súbor operácie menného priestoru systému, ako je otváranie, zatváranie a premenovanie súbory a adresárov.

Odporúča: