Obsah:

Ako môžem zlepšiť výkon sqoopu?
Ako môžem zlepšiť výkon sqoopu?

Video: Ako môžem zlepšiť výkon sqoopu?

Video: Ako môžem zlepšiť výkon sqoopu?
Video: 3 cviky na zlepšenie výkonu vášho mozgu (Test mozgu - výkon - Ako funguje mozog) 2024, Smieť
Anonim

Na optimalizáciu výkon , sada a počet mapových úloh na hodnotu nižšiu ako a maximálny počet pripojení, že a databáza podporuje. Ovládanie a množstvo paralelizmu, že Sqoop sa použije na prenos údajov a hlavný spôsob ovládania a zaťažiť tvoj databázy.

Čo sa teda stane, ak sqoop zlyhá medzi procesom?

Typický Sqoop úloha, ktorá prijíma údaje zo zdrojovej databázy do HDFS, skopíruje údaje do cieľového adresára. Skopírovaný súbor bude vymazaný ak sqoop zlyhá bez dokončenia.

Niekto sa môže tiež opýtať, ako dosiahnete paralelizmus v sqoop? Ovládanie Paralelizmus . Sqoop importuje dáta paralelne z väčšiny databázových zdrojov. Pomocou argumentu -m alebo --num-mappers môžete určiť počet mapových úloh (paralelných procesov), ktoré sa majú použiť na vykonanie importu. Každý z týchto argumentov má celočíselnú hodnotu, ktorá zodpovedá stupňu paralelizmus zamestnať

Ako teda môžem zlepšiť výkon dotazu Hive?

Nižšie je uvedený zoznam postupov, ktoré môžeme dodržiavať pri optimalizácii Hive Queries

  1. Povoliť kompresiu v Hive.
  2. Optimalizovať spojenia.
  3. Vyhnite sa globálnemu triedeniu v úli.
  4. Povoliť nástroj Tez Execution Engine.
  5. Operátor optimalizácie LIMIT.
  6. Povoliť paralelné spustenie.
  7. Povoliť prísny režim Mapreduce.
  8. Single Reduce for Multi Group BY.

Ako funguje sqoop split?

Môže sa použiť na zvýšenie výkonu importu dosiahnutím väčšej paralelnosti. Sqoop vytvára rozdelí na základe hodnôt v konkrétnom stĺpci tabuľky, ktorý je určený -- rozdeliť -by užívateľom prostredníctvom príkazu import. Ak nie je k dispozícii, na vytvorenie sa použije primárny kľúč vstupnej tabuľky rozdelí.

Odporúča: