Arch är en öppen källkod förlängning av Apache Nutch (en populär, mycket skalbar allmänt ändamål sökmotor) för intranätsökning. Inte nöjd med företagets sökmotor? Inte överraskande, mycket få människor är. Så vitt vi vet finns det inga intranät motorer som arbetar liksom Googles globala webbsökning gör. Det finns en grundläggande orsak till detta: de algoritmer som används av Google på den globala webben (eller liknande) inte fungerar nästan lika bra på intranät för bristen på statistiska uppgifter. Arch (äntligen!) Löser detta problem. Den använder en ny metod för att leverera höga sökresultat precision som fungerar bra. Tror inte det? Blind verktyg testutvärdering ingår. Du kan distribuera Arch och jämföra dess prestanda till din nuvarande sökmotor och / eller Google (på den publika delen av din webbplats) med en blindtest metodik.
Förutom den utmärkta sökkvalitet har Arch många funktioner som är kritiska för företagsmiljöer:
- Säkerhet på dokumentnivå. Användarna kan hitta endast dokument som de har behörighet att se.
- Billig indexuppdateringar. Arch kan hålla index uppdaterade och undvika regelbundet komplett anläggning söks igen.
- 24/7 antal tillgängliga. Det finns alltid en fungerande index tillgängliga, även om en genomsökning misslyckas.- Stöd för samtidig indexering och söka flera webbplatser, med förmåga att söka och administrera en webbplats separat, om det behövs. Dynamisk lägga till och borttagning av webbplatser är lätt.
- Ett automatiskt genererade webbplatskatalogen.
- Låg stöd kostnad gång sättas in.
- Dubbla gränssnitt (PHP och Java) för enkel distribution och anpassning.
- Faceted sök "out of the box".
- En omfattande och utbyggbar uppsättning parsers för att analysera en mängd olika filformat: HTML, PHP, PDF, MS Office, Open Office, etc.
- En modulär, plugin-baserad arkitektur som lätt kan anpassas och utvidgas.
- Källkoden är inkluderad.
- Hög prestanda och skalbarhet. Arch kan köras på datorn kluster till index mycket stora datamängder
Vad är nytt i den här versionen.
Version 1.9.2: förbättrad dokument tolkning, portas på Nutch 1,9 .
Vad är nytt i version 1.7.
Extra säkerhet scanning, portas på Nutch 1,7
Krav
Java 1.7, Cygwin
Kommentarer hittades inte