Čo je mapovač a redukcia v Hadoop?
Čo je mapovač a redukcia v Hadoop?

Video: Čo je mapovač a redukcia v Hadoop?

Video: Čo je mapovač a redukcia v Hadoop?
Video: Hadoop architecture | hdfs architecture | hadoop Учебник | hadoop architecture OnlineLearning... 2024, November
Anonim

Hlavnou výhodou MapReduce spočíva v tom, že je ľahké škálovať spracovanie údajov vo viacerých výpočtových uzloch. Pod MapReduce Primitívy spracovania údajov sa nazývajú mapovače a redukcie . Rozloženie aplikácie na spracovanie údajov na mapovače a redukcie je niekedy netriviálne.

Ak vezmeme do úvahy toto, čo je mapovač a redukcia?

MapReduce pozostáva z dvoch kľúčových funkcií: Mapper a Reducer . Mapper je funkcia, ktorá spracováva vstupné dáta. The mapovač spracováva údaje a vytvára niekoľko malých kúskov údajov.

čo je mapovač? A mapovač dokáže popísať údaj mapovač ako aj človek, ktorý tvorí geografické mapy. Povinnosti zemepisu mapovač alebo mapovací technik zahŕňajú zhromažďovanie a spracovanie geografických údajov na vytvorenie mapy oblasti.

Aké je týmto spôsobom použitie mapovača a redukcie v Hadoop?

Podľa The Apache Software Foundation je hlavným cieľom Mapa / Znížiť je rozdeliť súbor vstupných údajov na nezávislé časti, ktoré sa spracúvajú úplne paralelne. The Hadoop MapReduce framework triedi výstupy máp, ktoré sú potom vstupom do znížiť úlohy.

Aké je použitie mappera v Hadoop?

V behu Hadoop aplikácie zvyčajne implementujú Mapper a rozhrania Reducer na poskytovanie mapy (jednotlivé úlohy transformujúce vstupné záznamy na prechodné záznamy) a redukciu metód na redukciu súboru medziľahlých hodnôt, ktoré zdieľajú kľúč k menšiemu súboru hodnôt.

Odporúča: