Apache Parquet

Software skärmdump:
Apache Parquet
Mjukvaruinformation:
Version: 2.3.1 Uppdaterad
Ladda upp dagen: 9 Feb 16
Licens: Gratis
Popularitet: 39

Rating: nan/5 (Total Votes: 0)

Apache Parkett är en "kolonn" datalagring format som specifikt skapats för Apache Hadoop familjen projekt.

Parquet rekommenderas att användas med stora datamängder, främst eftersom det använder en komplex datakomprimeringssystem, att förlita sig på en rad optimerade rekord fragmentering och återmonterings algoritmer.

Detta tillåter att data delas upp, organiserade i en kapslad format, och återmonteras när efterfrågas.

Parquet-format kan också användas utanför Hadoop ekosystemet, varvid särskilt utformade för att vara så agnostic som möjligt, som arbetar med någon typ av ram databehandling och datalagring modell.

< strong> Vad är nytt i den här versionen:

  • Byt namn paket och maven koordinater att org.apache
  • Lägg kodnings statistik för att ColumnMetaData
  • Streaming sparsamhet API
  • Nya logiska typer

Vad är nytt i version 2.3.0:

  • Byt namn paket och maven koordinater att org.apache
  • Lägg kodnings statistik för att ColumnMetaData
  • Streaming sparsamhet API
  • Nya logiska typer

Begränsningar :

  • Projektet är fortfarande under utveckling i Apache Incubator förvaret och kan förändras drastiskt från version till version.

Liknande mjukvara

RavenDB
RavenDB

4 Jun 15

PyRedisAdmin
PyRedisAdmin

13 May 15

Gizzard
Gizzard

13 May 15

Annan programvara för utvecklare Apache Software Foundation

Apache Rave
Apache Rave

13 Apr 15

Apache MRQL
Apache MRQL

1 Mar 15

Apache Giraph
Apache Giraph

13 Apr 15

Kommentarer till Apache Parquet

Kommentarer hittades inte
Kommentar
Slå på bilder!