Apache Parchet este un format de stocare a datelor "columnare", care a fost creat special pentru Apache Hadoop familie de proiecte.
Parchet, se recomandă să fie utilizat cu date de mari dimensiuni, în principal, deoarece foloseste un sistem de compresie a datelor complexe, bazându-se pe o serie de algoritmi optimizate de înregistrare pentru mărunțirea și re-asamblare.
Acest lucru permite ca datele să fie defalcate, organizate într-un format imbricate și reasamblate de fiecare dată când interogate.
Formatul de parchet poate fi utilizat și în afara ecosistemului Hadoop, fiind special conceput pentru a fi cât agnostic cât posibil, să lucreze cu orice tip de cadru de prelucrare a datelor și a modelului de stocare a datelor.
< strong> Ce este nou în această versiune:
- Redenumire pachete și Maven coordonatele la org.apache
- Adăugați statistici conținând codificarea la ColumnMetaData li>
- Streaming cumpătare API
- Noi tipuri logice
Ce este nou în versiunea 2.3.0:
- Redenumire pachete și Maven coordonatele la org.apache
- Adăugați statistici conținând codificarea la ColumnMetaData li>
- Streaming cumpătare API
- Noi tipuri logice
Limitări :
- Proiectul este încă în curs de dezvoltare în magazia Incubator Apache și s-ar putea schimba drastic de la versiunea la versiunea.
Comentariile nu a fost găsit