Čo je DistCp v Hadoop?
Čo je DistCp v Hadoop?

Video: Čo je DistCp v Hadoop?

Video: Čo je DistCp v Hadoop?
Video: What is HDFS | Name Node vs Data Node | Replication factor | Rack Awareness | Hadoop🐘🐘Framework 2024, Smieť
Anonim

DistCp (distribuovaná kópia) je nástroj, ktorý sa používa na veľké kopírovanie medzi/v rámci klastra. Používa sa MapReduce na uskutočnenie jej distribúcie, spracovania a obnovy chýb a podávania správ. Rozšíri zoznam súborov a adresárov o vstup do mapových úloh, z ktorých každá skopíruje oddiel súborov špecifikovaný v zdrojovom zozname.

Podobne sa možno pýtať, prepisuje Distcp?

Tiež by som to mal upresniť a vysvetliť distcp - prepísať bude prepísať súbor bez ohľadu na to, či sa veľkosť zhoduje alebo nie. Týmto sa aktualizujú všetky súbory v hdfs-nn2, ktorých veľkosť sa nezhoduje s veľkosťou hdfs-nn1, a tiež sa odstránia všetky nadbytočné súbory.

Podobne, čo je príkaz Hadoop FS? Systém súborov ( FS ) škrupina zahŕňa rôzne mušľovité príkazy ktoré priamo interagujú s Hadoop Distribuovaný súborový systém ( HDFS ), ako aj iné súborové systémy, ktoré Hadoop podpory, ako napríklad Local FS , HFTP FS , S3 FS , a ďalšie.

Ako týmto spôsobom prenesiem dáta z jedného Hdfs do iného Hdfs?

Hadoop fs cp – Najjednoduchšie spôsob kopírovania údajov z jedného do zdrojového adresára ďalší . Použi hadoop fs -cp [zdroj] [cieľ]. Hadoop fs copyFromLocal – Need to kopírovať údaje z lokálneho súborového systému do HDFS ? Použi hadoop fs -copyFromLocal [zdroj] [cieľ].

Ako skopírujem klaster z jedného klastra do druhého?

Kopírovanie súborov medzi klastre . Môžeš kopírovať súbory alebo adresárov medzi rôznymi klastre pomocou príkazu hadoop distcp. Musíte uviesť poverenia súbor v tvojom kopírovať žiadať tak zdroj zhluk môže overiť, že ste autentifikovaní pre zdroj zhluk a cieľ zhluk.

Odporúča: