Prečo je Hadoop lacnejší?
Prečo je Hadoop lacnejší?

Video: Prečo je Hadoop lacnejší?

Video: Prečo je Hadoop lacnejší?
Video: Hadoop In 5 Minutes | What Is Hadoop? | Introduction To Hadoop | Hadoop Explained |Simplilearn 2024, November
Anonim

Hadoop je relatívne lacný

Cena za terabajt na implementáciu a Hadoop klaster je lacnejšie než sú náklady na jeden terabajt na nastavenie páskového zálohovacieho systému. Poskytnuté, a Hadoop prevádzka systému stojí viac, pretože všetky diskové jednotky s údajmi sú na rozdiel od páskových jednotiek online a napájané.

Je týmto spôsobom Hadoop nákladovo efektívny?

Hadoop ponúka škálovateľné, náklady - efektívne a vysoko dostupné riešenie pre ukladanie a spracovanie veľkých dát. Použitie nechránenej fyzickej vrstvy výrazne znižuje závislosť od technológie. Ponúka tiež možnosť elastického dimenzovania pri nasadení na virtuálnych strojoch alebo dokonca v cloude IAAS.

Navyše, prečo je iskra lepšia ako Hadoop? Apache Spark – Spark je bleskovo rýchly klastrový výpočtový nástroj. Apache Spark spúšťa aplikácie až 100x rýchlejšie v pamäti a 10x rýchlejšie na disku než Hadoop . Kvôli zníženiu počtu cyklov čítania/zápisu na disk a ukladaniu medziľahlých údajov v pamäti Spark to umožňuje.

Ak vezmeme do úvahy toto, koľko stojí Hadoop?

Pre podnikovú triedu Hadoop klaster, odporúča sa server Intel strednej triedy. Tieto zvyčajne náklady 4 000 až 6 000 USD na uzol s kapacitou disku od 3 TB do 6 TB v závislosti od požadovaného výkonu. To znamená uzol náklady je približne 1 000 až 2 000 USD za TB. HDFS nemá žiadne fyzické obmedzenia týkajúce sa veľkosti súborov.

Prečo je Hadoop rýchlejší?

Dôvod, prečo je Spark rýchlejšie než Hadoop je, že Spark spracováva všetko v pamäti. Môže tiež použiť disk na dáta, ktoré sa všetky nezmestia do pamäte.

Odporúča: