Apache porc a dus la Apache Hadoop proiectului și este unul dintre modulele sale că, atunci când se ocupă de furnizarea unui mod de a analiza datele pe care le tratat și depozitat.
Porc folosește un limbaj de interogare personalizat numit "latină de porc", care este incredibil de ușor de învățat și sprijină ambele stiluri relaționale și funcționale.
Acest lucru înseamnă că puteți folosi ca un limbaj SQL clasic beneficiază de date se alătură și filtre, sau puteți utiliza caracteristicile sale MapReduce, de cartografi date și reductoare.
În mod implicit Apache porc a fost menit să fie folosit în interiorul instalațiilor Hadoop, dar versiunile mai noi lăsați-l să ruleze separat printr-un JVM separat
Ce este nou în această versiune:.
- motoare de execuție Pluggable (pentru a permite rula porc pe motoarele non-MapReduce în viitor)
- -Auto locală mod (la locuri de muncă cu dimensiuni mici de date de intrare pentru a rula în proces)
- Recuperare de optimizare (pentru a îmbunătăți interactiveness de grunt)
- contoare fixe locale-mode
- Suport pentru cache borcan nivel de utilizator
- Suport pentru lista neagră și de listă albă comenzile de porc
- Mai multe remedieri de performanță și caracteristici debuggability
- câteva modificări de interfață non-înapoi compatibile au fost introduse în această versiune pentru a face munca de porc cu motoare non-MapReduce
Ce este nou în versiunea 0.14.0:
- motoare de execuție Pluggable (pentru a permite rula pe non porc motoare -mapreduce în viitor)
- -Auto locală mod (la locuri de muncă cu dimensiuni mici de date de intrare pentru a rula în proces)
- Recuperare de optimizare (pentru a îmbunătăți interactiveness de grunt)
- contoare fixe locale-mode
- Suport pentru cache borcan nivel de utilizator
- Suport pentru lista neagră și de listă albă comenzile de porc
- Mai multe remedieri de performanță și caracteristici debuggability
- câteva modificări de interfață non-înapoi compatibile au fost introduse în această versiune pentru a face munca de porc cu motoare non-MapReduce
Ce este nou în versiunea 0.11.0:
- Această versiune include DateType datatype, RANK, CUBE și Operatorii de pachet, UDF-uri Groovy, estimarea reductor personalizate, tupluri pe bază de schemă și integrare HCatalog DDL.
Ce este nou în versiunea 0.9.1:.
- Această versiune funcționează cu Hadoop 0,20
Ce este nou în versiunea 0.6:
- Adaugat Zebra ca un proiect contrib. Vezi http://wiki.apache.org/pig/zebra
- Adaugat UDFContext, oferă FDU o modalitate de a trece de informatii din fata spre spate end și oferă acces la UDFS JobConf în backend.
- Adaugat plecat exterior alătura pentru fragment reprodusă alăture.
- Adăugat posibilitatea de a seta prioritatea de locuri de muncă de la Pig Latin.
- îmbunătățită multi-interogare de a lucra cu alătură, în unele cazuri.
- Manager memorie refăcut pentru a reduce semnificativ aeriene GC și de eșecuri Heap Din.
- interfață Adăugat Acumulator pentru FDU.
- Peste 100 de bug-uri și îmbunătățiri remedieri.
Cerințe :
- 1.6.x Java sau mai mare
- Apache Hadoop 0.20.x sau mai mare
Comentariile nu a fost găsit