Apache Parkett är en "kolonn" datalagring format som specifikt skapats för Apache Hadoop familjen projekt.
Parquet rekommenderas att användas med stora datamängder, främst eftersom det använder en komplex datakomprimeringssystem, att förlita sig på en rad optimerade rekord fragmentering och återmonterings algoritmer.
Detta tillåter att data delas upp, organiserade i en kapslad format, och återmonteras när efterfrågas.
Parquet-format kan också användas utanför Hadoop ekosystemet, varvid särskilt utformade för att vara så agnostic som möjligt, som arbetar med någon typ av ram databehandling och datalagring modell.
< strong> Vad är nytt i den här versionen:
- Byt namn paket och maven koordinater att org.apache
- Lägg kodnings statistik för att ColumnMetaData li>
- Streaming sparsamhet API
- Nya logiska typer
Vad är nytt i version 2.3.0:
- Byt namn paket och maven koordinater att org.apache
- Lägg kodnings statistik för att ColumnMetaData li>
- Streaming sparsamhet API
- Nya logiska typer
Begränsningar :
- Projektet är fortfarande under utveckling i Apache Incubator förvaret och kan förändras drastiskt från version till version.
Kommentarer hittades inte