Čo je AWS MapReduce?
Čo je AWS MapReduce?

Video: Čo je AWS MapReduce?

Video: Čo je AWS MapReduce?
Video: Scaling your Analytics with Amazon Elastic MapReduce (BDT301) | AWS re:Invent 2013 2024, December
Anonim

Amazon Elastické MapReduce (EMR) je Amazon Web Services ( AWS ) nástroj na spracovanie a analýzu veľkých dát. Amazon EMR spracováva veľké dáta cez klaster virtuálnych serverov Hadoop na Amazon Elastic Compute Cloud (EC2) a Amazon Simple Storage Service (S3).

Ako týmto spôsobom funguje AWS EMR?

Služba spúšťa zákazníkom špecifikovaný počet inštancií Amazon EC2, ktorý pozostáva z jedného hlavného a viacerých ďalších uzlov. Amazon EMR v týchto inštanciách spúšťa softvér Hadoop. Hlavný uzol rozdeľuje vstupné dáta do blokov a distribuuje spracovanie blokov do ostatných uzlov.

Okrem vyššie uvedeného, aký je rozdiel medzi ec2 a EMR? Na rozdiel od EMR , EC2 nekategorizuje podriadené uzly na jadro a uzly úloh. To zvyšuje riziko straty údajov HDFS v prípade odstránenia/straty uzla. EC2 používa knižnice Apache (s3a) na prístup k údajom na s3. Na druhej strane, EMR používa proprietárny kód AWS na rýchlejší prístup k s3.

Okrem toho, je AWS EMR plne riadený?

Amazon Elastické MapReduce ( EMR ) je a plne riadený Platforma Hadoop a Spark od Amazon Webová služba ( AWS ). s EMR , AWS zákazníci môžu rýchlo vytvoriť viacuzlové klastre Hadoop na spracovanie veľkých dátových záťaží.

Používa AWS Hadoop?

Amazon webové služby používa open-source Apache Hadoop distribuovanú výpočtovú technológiu, ktorá uľahčuje prístup k veľkému množstvu výpočtového výkonu na vykonávanie úloh náročných na dáta. Hadoop , open-source verziu Google MapReduce, už používajú spoločnosti ako Yahoo a Facebook.

Odporúča: