Apache Hive

Software skärmdump:
Apache Hive
Mjukvaruinformation:
Version: 1.2.1 Uppdaterad
Ladda upp dagen: 21 Jul 15
Licens: Gratis
Popularitet: 30

Rating: nan/5 (Total Votes: 0)

Apache Hive utvecklades först som en Apache Hadoop delprojekt för att ge Hadoop administratörer med en lättanvänd, kunnig frågespråk för sina data.
På grund av detta, var Hive utvecklades från början för att arbeta med stora mängder information för varje fråga och är perfekt anpassad för storskaliga databaser och affärsmiljöer.
Verktyg ingår för lätt lastning, extrahera och omvandla data, medan anpassade datastrukturer kan påtvingas ett brett spektrum av dataformat.
Eftersom det är en Hadoop relaterat projektet HDFS och HBase projekt stöds också automatiskt.
HiveQL är förmodligen den bästa delen av projektet, vilket ger en enkel, innovativ och effektiv frågespråk, samtidigt kunna hantera kartografer och förminsknings i situationer där det ursprungliga SQL-syntax inte kan få önskad data.

Vad är nytt i den här versionen:

  • Stöd okorrelerade delfrågor i WHERE
  • Lägg NULL Definieras som att radformat specifikation
  • Ccreate / drop-databasen ska fylla in- / utgångar och kontrollera samtidighet och användarbehörighet
  • Support specificerar omfattning och precision med Hive decimal typ
  • Varde Tez
  • En explodera funktion som innehåller objektets position i arrayen
  • Lägg till char datatyp
  • Skapa samla UDF och göra utvärderare återanvändbara
  • Utöka rekord författare och ORC läsare / författare gränssnitt för att ta fram statistik
  • Genomföra statistik ger ORC författare och läsare gränssnitt
  • Kommentera bikupa operatör träd med statistik från metastore
  • Ange rand nivå kolumnstatistiken i ORC
  • fråga stöd: tillåta stapling av delfrågor
  • fråga stöd: tillåt delfråga uttryck i att ha klausul
  • fråga stöd: fler tester
  • Native Parkett Support i Hive
  • Hive ska kunna hoppa över sidhuvud och sidfot rader vid läsning datafil för en tabell
  • Lägg DATE, TIMESTAMP, DECIMAL, CHAR, VARCHAR typer stöder i HCat
  • Använd kart gå antydan till cache delresultat
  • Lägg UDF för att beräkna avståndet mellan geografiska koordinater

Vad är nytt i version 1.2.0:

  • Stöd okorrelerade delfrågor i WHERE
  • Lägg NULL Definieras som att radformat specifikation
  • Ccreate / drop-databasen ska fylla in- / utgångar och kontrollera samtidighet och användarbehörighet
  • Support specificerar omfattning och precision med Hive decimal typ
  • Varde Tez
  • En explodera funktion som innehåller objektets position i arrayen
  • Lägg till char datatyp
  • Skapa samla UDF och göra utvärderare återanvändbara
  • Utöka rekord författare och ORC läsare / författare gränssnitt för att ta fram statistik
  • Genomföra statistik ger ORC författare och läsare gränssnitt
  • Kommentera bikupa operatör träd med statistik från metastore
  • Ange rand nivå kolumnstatistiken i ORC
  • fråga stöd: tillåta stapling av delfrågor
  • fråga stöd: tillåt delfråga uttryck i att ha klausul
  • fråga stöd: fler tester
  • Native Parkett Support i Hive
  • Hive ska kunna hoppa över sidhuvud och sidfot rader vid läsning datafil för en tabell
  • Lägg DATE, TIMESTAMP, DECIMAL, CHAR, VARCHAR typer stöder i HCat
  • Använd kart gå antydan till cache delresultat
  • Lägg UDF för att beräkna avståndet mellan geografiska koordinater

Vad är nytt i version 1.1.0:

  • Stöd okorrelerade delfrågor i WHERE
  • Lägg NULL Definieras som att radformat specifikation
  • Ccreate / drop-databasen ska fylla in- / utgångar och kontrollera samtidighet och användarbehörighet
  • Support specificerar omfattning och precision med Hive decimal typ
  • Varde Tez
  • En explodera funktion som innehåller objektets position i arrayen
  • Lägg till char datatyp
  • Skapa samla UDF och göra utvärderare återanvändbara
  • Utöka rekord författare och ORC läsare / författare gränssnitt för att ta fram statistik
  • Genomföra statistik ger ORC författare och läsare gränssnitt
  • Kommentera bikupa operatör träd med statistik från metastore
  • Ange rand nivå kolumnstatistiken i ORC
  • fråga stöd: tillåta stapling av delfrågor
  • fråga stöd: tillåt delfråga uttryck i att ha klausul
  • fråga stöd: fler tester
  • Native Parkett Support i Hive
  • Hive ska kunna hoppa över sidhuvud och sidfot rader vid läsning datafil för en tabell
  • Lägg DATE, TIMESTAMP, DECIMAL, CHAR, VARCHAR typer stöder i HCat
  • Använd kart gå antydan till cache delresultat
  • Lägg UDF för att beräkna avståndet mellan geografiska koordinater

Vad är nytt i version 1.0.0:

  • Stöd okorrelerade delfrågor i WHERE
  • Lägg NULL Definieras som att radformat specifikation
  • Ccreate / drop-databasen ska fylla in- / utgångar och kontrollera samtidighet och användarbehörighet
  • Support specificerar omfattning och precision med Hive decimal typ
  • Varde Tez
  • En explodera funktion som innehåller objektets position i arrayen
  • Lägg till char datatyp
  • Skapa samla UDF och göra utvärderare återanvändbara
  • Utöka rekord författare och ORC läsare / författare gränssnitt för att ta fram statistik
  • Genomföra statistik ger ORC författare och läsare gränssnitt
  • Kommentera bikupa operatör träd med statistik från metastore
  • Ange rand nivå kolumnstatistiken i ORC
  • fråga stöd: tillåta stapling av delfrågor
  • fråga stöd: tillåt delfråga uttryck i att ha klausul
  • fråga stöd: fler tester
  • Native Parkett Support i Hive
  • Hive ska kunna hoppa över sidhuvud och sidfot rader vid läsning datafil för en tabell
  • Lägg DATE, TIMESTAMP, DECIMAL, CHAR, VARCHAR typer stöder i HCat
  • Använd kart gå antydan till cache delresultat
  • Lägg UDF för att beräkna avståndet mellan geografiska koordinater

Vad är nytt i version 0.8.1:

  • Verktyg för att möjliggöra enkel dataextrakt / förändra / last (ETL).
  • En mekanism för att införa struktur på en mängd olika dataformat.
  • Åtkomst till filer som lagras antingen direkt i Apache HDFS (TM) eller i andra system datalagrings såsom Apache HBase (TM).
  • Query utförande via MapReduce.

Vad är nytt i version 0.8.0:

  • Verktyg för att möjliggöra enkel dataextrakt / förändra / last (ETL)
  • En mekanism för att införa struktur på en mängd olika dataformat
  • Åtkomst till filer som lagras antingen direkt i Apache HDFS (TM) eller i andra system datalagrings såsom Apache HBase (TM)
  • Query utförande via MapReduce

Vad är nytt i version 0.7.1:

  • Bugs:
  • undantag på fönster när du använder JDBC-drivrutin. & quot; IOException. Det går inte att hitta den angivna sökvägen & quot;
  • Schema skaparskripten är ofullständiga, eftersom de lämnar ut tabeller som är specifika för DataNucleus.
  • Förbättringar:
  • Förbättra diverse felmeddelanden.
  • Retur korrekta större / mindre versionsnummer för JDBC Hive Driver.
  • Lägg till genomförande HivePreparedStatement baserat på aktuell HIVE stöds datatyp.
  • Uppgifter:
  • Hive i Maven.
  • Ange Metastore uppgradera manus och standard scheman för PostgreSQL.

Vad är nytt i version 0.7.0:

  • Ny funktion:
  • Bemyndigande infrastruktur för Hive
  • Genomföra indexering i Hive
  • Lägg reflektera () UDF för reflekterande åkallan av Java metoder
  • Hive TypeInfo / ObjectInspector att stödja unionen (förutom struct, array och karta)
  • Genomföra GenericUDF str_to_map
  • Patch att stödja HAVING i Hive
  • Spåra fogarna som håller på att omvandlas för att kartlägga-gå automatiskt
  • Samtals frekvens och varaktighet statistik för HiveMetaStore via JMX
  • Underhåll lastAccessTime i metastore
  • Förbättring:
  • Ge möjlighet att exportera en HEADER
  • Stöd för distinkt val på två eller flera kolumner
  • Beskriv utökad tabell / partition utgång är kryptisk
  • Saknas några JDBC funktioner som getTables, getColumns och HiveResultSet.get * metoder baserade på kolumnnamnet.
  • Tapping loggar från barnprocesser
  • Support filter pushdown mot främmande tabeller
  • Byt beroenden på HBase föråldrat API
  • Lägg queryid medan låsning
  • Uppdatera transident_lastDdlTime endast om det inte anges
  • Lägg till mer felsökningsinformation för bikupa låsning
  • HiveInputFormat eller CombineHiveInputFormat alltid synkronisera block av RCFile två gånger
  • Visa tiden den lokala uppgiften tar
  • Skapa en ny zookeeper exempel när försöker igen lås, och mer info om debug
  • Lägg en möjlighet att köra uppgiften att kontrollera karta gå med möjlighet i icke-lokal mod
  • Mer felsökning för att låsa
  • Lägg till ett alternativ i dynamiska partition insatser för att kasta ett fel om 0 partitioner skapas
  • Bugs:
  • & quot; LOAD DATA LOKAL INPATH & quot; misslyckas när bordet redan innehåller en fil med samma namn
  • NULL inte hanteras korrekt ansluta
  • HiveInputFormat.getInputFormatFromCache & quot; svalor & quot; orsaka undantag när du kastar IOExcpetion
  • Lägg till framsteg i ansluter och groupby
  • Enkla UDAFs med mer än en parameter krasch på tom rad fråga
  • UDF fältet () fungerar inte
  • Dynamiska skilje skär kvar tomma filer rengjorda i Hadoop 0.17 lokal mod
  • Lift motverka uppdatering när RunningJob.getCounters () returnerar null

Vad är nytt i version 0.5.0:.

  • Låt användaren ange serde för egna skript
  • Lägg till UDF unhex.
  • Ta bort lzocodec import från FileSinkOperator.
  • Driver NullPointerException när du ringer getResults utan att först sammanställa.
  • Prestanda förbättring för RCFile och ColumnarSerDe i Hive.

Liknande mjukvara

Tinkerer
Tinkerer

13 Apr 15

Blueplate
Blueplate

10 Feb 16

jQuery GridManager
jQuery GridManager

13 Apr 15

Gizzard
Gizzard

13 May 15

Annan programvara för utvecklare Apache Software Foundation

Apache JMeter
Apache JMeter

12 Apr 15

Apache Lens
Apache Lens

10 Dec 15

Apache FOP
Apache FOP

13 May 15

Apache HBase
Apache HBase

9 Apr 16

Kommentarer till Apache Hive

Kommentarer hittades inte
Kommentar
Slå på bilder!