Mjukvaruinformation:
Version: 1.2.0 / 1.3.0-rc1 Uppdaterad
Ladda upp dagen: 10 Feb 16
Licens: Gratis
Popularitet: 272
DataFu utvecklades på Linkedin och är skriven helt i Java.
DataFu innehåller funktioner / bibliotek för att arbeta med:
- Statistik
- Uppskattning
- Provtagning
- Sessions
- Link analys
- Ställ verksamhet
- lös
DataFu är perfekt för data mining och statistiska tillämpningar som arbetar på toppen av Hadoop eller Pig databaser.
Dessa funktioner tillåter utvecklare att dra full nytta av alla de data som lagras i en Hadoop eller Pig databas utan att behöva ta itu med massiva systemkraven för att göra det.
Vad är nytt i den här versionen.
- Par UDF för obundet slumpmässigt urval med ersättning
- Fler beroenden nu förpackade i DataFu så färre JAR beroenden krävs.
- SetDifference UDF för beräkning inställd skillnad (t ex A-B eller A-B-C).
Vad är nytt i version 1.2.0:
- Par UDF för obundet slumpmässigt urval med ersättning.
- Fler beroenden nu förpackade i DataFu så färre JAR beroenden krävs.
- SetDifference UDF för beräkning inställd skillnad (t ex A-B eller A-B-C).
Vad är nytt i version 1.1.0.
- Lade SHA hash UDF
- InUDF och AssertUDF till för gris 0,12 kompatibilitet. Dessa är de samma som i och hävda.
- SimpleRandomSample, som genomför en skalbar obundet slumpmässigt urval algoritm.
Kommentarer hittades inte