PdfParser är en öppen källkod, bärbar, gratis, plattformsoberoende, webbaserat och fristående bibliotek programvara som består av flera verktyg för att extrahera data från PDF (Portable Document Format) files.Features på glanceIt har utvecklats i en sådan sätt att den kan lasta och tolka rubriker och objekt, utdrag metadatainformation (beskrivning, författare eller nyckelord) stöder komprimerade PDF-dokument, samt utdrag text från beställda sidor.
Dessutom stöder programmet olika charset kodningar (Mac OS Roman och Windows Ansi), det är helt kompatibel med standarderna PSR-0 och PSR-1, och kompatibla med Composer. Dessutom kan den hantera oktala och hexa innehåll kodningar i textsektioner.
Tyvärr, för närvarande, den PdfParser bibliotek programvara stöder inte säkra PDF-dokument. Därför, om du vill tolka PDF-filer som har krypterats eller lösenordsskyddade, du vann & rsquoen; t kunna göra det med den här software.Getting började med PdfParserThe PdfParser programvara har utformats för att köras på en webbserver. Det & rsquo; s PHP-bibliotek, så det kommer att kräva PHP 5.3 eller senare installerat på din server. Den härrör från TCPDF parser bibliotek programvara.
Installera PdfParser är ganska lätt uppgift, eftersom paketet kan hämtas automatiskt på servern med hjälp av Composer kommandoraden programmet. Därför måste du först lägga programvaran till din composer.json fil och sedan använda & lsquo; kompositör uppdatering smalot / pdfparser & rsquo; kommandot för att hämta den.
Som nämnts, kan PdfParser också användas som en fristående bibliotek. För detta måste du ta sin källkod från GitHub, kör sedan & lsquo; kompositör uppdatering & rsquo; kommando för att automatiskt ladda ner några beroenden och generera autoload.php filen. Mer information finns på projektets & rsquoen; s hemsida (se länk nedan) .Under huven och stödde drifts systemsLooking under huven på PdfParser, kan vi märka att programmet är skrivet i språket på serversidan programmerings PHP. Detta innebär att den kan användas på alla operativsystem, som stöder både 32-bitars och 64-bitars instruktionsuppsättning arkitekturer
Vad är nytt i den här versionen:.
- Merge pull förfrågan # 41 från scotam / fråga-33
- Fix för Objektklasser returneras som teckensnitt
Vad är nytt i version 0.9.20:
- Denna version fixar några buggar i pars (teckensnitt, säkrade filer, osv.).
- behov TCPDF beroendet uppdateras.
Vad är nytt i version 0.9.19:
- Denna version fast xobject textutvinning och lagt till text fallback om utebliven typsnitt.
Krav :
- PHP
Kommentarer hittades inte