Apache Parquet

Software skärmdump:
Apache Parquet
Mjukvaruinformation:
Version: 2.3.1 Uppdaterad
Ladda upp dagen: 9 Feb 16
Licens: Gratis
Popularitet: 159

Rating: nan/5 (Total Votes: 0)

Apache Parkett är en "kolonn" datalagring format som specifikt skapats för Apache Hadoop familjen projekt.

Parquet rekommenderas att användas med stora datamängder, främst eftersom det använder en komplex datakomprimeringssystem, att förlita sig på en rad optimerade rekord fragmentering och återmonterings algoritmer.

Detta tillåter att data delas upp, organiserade i en kapslad format, och återmonteras när efterfrågas.

Parquet-format kan också användas utanför Hadoop ekosystemet, varvid särskilt utformade för att vara så agnostic som möjligt, som arbetar med någon typ av ram databehandling och datalagring modell.

< strong> Vad är nytt i den här versionen:

  • Byt namn paket och maven koordinater att org.apache
  • Lägg kodnings statistik för att ColumnMetaData
  • Streaming sparsamhet API
  • Nya logiska typer

Vad är nytt i version 2.3.0:

  • Byt namn paket och maven koordinater att org.apache
  • Lägg kodnings statistik för att ColumnMetaData
  • Streaming sparsamhet API
  • Nya logiska typer

Begränsningar :

  • Projektet är fortfarande under utveckling i Apache Incubator förvaret och kan förändras drastiskt från version till version.

Liknande mjukvara

BIKE
BIKE

13 May 15

Reportable
Reportable

1 Mar 15

pycassa
pycassa

28 Feb 15

MonetDB
MonetDB

1 Oct 15

Annan programvara för utvecklare Apache Software Foundation

Apache Qpid
Apache Qpid

12 Apr 15

Apache Neethi
Apache Neethi

13 Apr 15

Apache BVal
Apache BVal

9 Apr 16

Kommentarer till Apache Parquet

Kommentarer hittades inte
Kommentar
Slå på bilder!