Apache Pig har gett upphov till från Apache Hadoop projekt och är en av dess moduler som där ansvarar för att ge ett sätt att analysera de uppgifter som den bearbetas och lagras.
Pig använder ett anpassat frågespråk kallas "Piglatin" som är otroligt lätt att lära sig och stöder både relationella och funktionella stilar.
Detta innebär att du kan använda den som en klassisk SQL-språket gynnas uppgifter går och filter, eller så kan du använda sina MapReduce funktioner, data mappers och förminsknings.
Som standard Apache Pig var tänkt att användas inom Hadoop installationer, men nyare versioner gör det möjligt att köra separat via en separat JVM
Vad är nytt i den här versionen.
- Plugg utförande motorer (för att möjliggöra gris kör på icke-MapReduce motorer i framtiden)
- Auto-lokal mod (till jobb med små indata storlek för att köras i processen)
- Hämta optimering (för att förbättra interactiveness av grunt)
- Fasta mätare för lokal-mode
- Stöd för användarnivå burk cache
- Stöd för svartlistning och vitlistning gris kommandon
- Flera prestandafixar och debuggability funktioner
- Några icke-bakåt kompatibla modifieringar gränssnitt har införts i den här utgåvan för att svin arbete med icke-MapReduce motorer
Vad är nytt i version 0.14.0:
- Plugg utförande motorer (för att möjliggöra gris kör på icke -mapreduce motorer i framtiden)
- Auto-lokal mod (till jobb med små indata storlek för att köras i processen)
- Hämta optimering (för att förbättra interactiveness av grunt)
- Fasta mätare för lokal-mode
- Stöd för användarnivå burk cache
- Stöd för svartlistning och vitlistning gris kommandon
- Flera prestandafixar och debuggability funktioner
- Några icke-bakåt kompatibla modifieringar gränssnitt har införts i den här utgåvan för att svin arbete med icke-MapReduce motorer
Vad är nytt i version 0.11.0:
- Den här versionen innehåller DateType datatyp, RANK, CUBE och Samlad operatörer, Groovy UDFS, anpassade Reducer uppskattning, schemabaserade tupler och HCatalog DDL integration.
Vad är nytt i version 0.9.1:.
- Den här versionen fungerar med Hadoop 0,20
Vad är nytt i version 0.6:
- Lade Zebra som contrib projekt. Se http://wiki.apache.org/pig/zebra
- Lade UDFContext ger UDF ett sätt att passera information från framsidan till baksidan slut och ger UDFS tillgång till JobConf i backend.
- Lade vänster yttre koppling för fragment replikera gå med.
- Lade förmåga att sätta prioritet jobb från Piglatin.
- Förbättrad multi-query för att arbeta med går i vissa fall.
- Omarbetad minne manager att avsevärt minska GC Overhead och Utav Heap fel.
- Lade Ackumulator gränssnitt för UDF.
- Över 100 buggfixar och förbättringar.
Krav :
- Java 1.6.x eller högre
- Apache Hadoop 0.20.x eller senare
Kommentarer hittades inte