Čo je formát údajov o parketách?
Čo je formát údajov o parketách?

Video: Čo je formát údajov o parketách?

Video: Čo je formát údajov o parketách?
Video: Полное руководство по Google Forms - универсальный инструмент для опросов и сбора данных онлайн! 2024, Smieť
Anonim

Apache Parkety je bezplatný a open source zameraný na stĺpce údajov skladovanie formát ekosystému Apache Hadoop. Je kompatibilný s väčšinou údajov spracovateľské rámce v prostredí Hadoop. Poskytuje efektívne údajov schémy kompresie a kódovania so zvýšeným výkonom na zvládnutie komplexných údajov hromadne.

Jednoducho, aký je formát parketového súboru?

Parkety , otvorený zdroj formát súboru pre Hadoop. Parkety ukladá vnorené dátové štruktúry v plochom stĺpci formát . V porovnaní s tradičným prístupom, kde sa údaje ukladajú riadkovo orientovaným prístupom, parkety je efektívnejší z hľadiska úložiska a výkonu.

Ďalej, na čo sa parkety používajú? Parkety je formát súboru s otvoreným zdrojovým kódom dostupný pre akýkoľvek projekt v ekosystéme Hadoop. Apache Parkety je navrhnutý pre efektívny a zároveň výkonný plochý stĺpcový formát ukladania údajov v porovnaní so súbormi založenými na riadkoch, ako sú súbory CSV alebo TSV.

Okrem toho, ako formát parkiet ukladá údaje?

ÚDAJE BLOK Každý blok v parkety súbor je uložené vo forme radových skupín. takže, údajov v parkety súbor je rozdelený do viacerých skupín riadkov. Tieto skupiny riadkov zase pozostávajú z jedného alebo viacerých častí stĺpcov, ktoré zodpovedajú stĺpcu v údajov nastaviť. The údajov pre každý kus stĺpca napísaný vo forme stránok.

Je parketa ľudsky čitateľná?

ORC, Parkety , a Avro sú tiež strojové čitateľný binárne formáty, čo znamená, že súbory vyzerajú ako nezmysel ľudí . Ak potrebuješ človek - čitateľný formát ako JSON alebo XML, potom by ste pravdepodobne mali prehodnotiť, prečo v prvom rade používate Hadoop.

Odporúča: