Apache Tika 1.4

Apache Tika är ett open source verktyg som syftar till att upptäcka och extrahera metadata, samt strukturerad textinnehåll från flera dokument, med hjälp av något annat än befintliga parser bibliotek.Apache Tika stöder följande dokumentformat: Hypertext...