screen-skrapan projektet är ett verktyg som används för att extrahera data från webbplatser. Du kan använda skärm skrapa för följande ändamål:
· Data Mining och Extraction
· Data Migration
· Application Integration
· Business Intelligence
· Web Task Automation
· Portal Komponenter
· Meta-Söka
· Arkivering
Skärmen-skrapa Programmet består av två primära delar:
· Workbench: Ett grafiskt användargränssnitt ger ett intuitivt förhållningssätt som tillåter dig att utse sidor och specifika bitar av information som ska extraheras.
· Server: Efter att ha använt arbetsbänken för att utse de data som ska skrapas, kan screen-scraper köras i en server-läge, ungefär som en databas. Externa program kan sedan ansluta till screen-skrapa, som kommer att dra data från de utsedda webbplatser, sedan återlämna dem till det anropande programmet. Till exempel kan du bygga en webbaserad applikation med hjälp av Active Server Pages (ASP) eller PHP som åberopar screen-skrapan för att söka efter produkter som finns på en extern webbplats i realtid webben.
Dessutom kan screen-scraper startas i en icke-grafiskt läge från kommandoraden, så att det kan schemaläggas eller åberopas on-demand.
skärm-skrapa kan automatisera många av de uppgifter som normalt krävs vid skrapning data från webbsidor, såsom tracking cookies, logga in på webbsidor, och korsar sökresultatsidorna.
Beroende på programmeringsspråk och plattformar du helst föredrar, kommer sannolikt att vara bekant för dig screen-skrapan. screen-skrapa innehåller ett internt skriptmotor som stöder:
· VBScript
· JScript
· Perl
· Tolkad Java
· JavaScript
· Python
När åberopar skärm-skrapa externt gör ditt val ur följande språk:
· Java
· PHP
· Något COM-baserade (till exempel Active Server Pages, Visual Basic och Visual C ++)
· .NET (Både Microsoft-baserade och Mono)
· Cold Fusion
Vad är nytt i den här versionen:
· Flera buggfixar och mindre funktioner har lagts till, inklusive automatisk säkerhetskopiering av databasen, förbättrad HTML rendering och HTML strippa, fastställande ett fel som orsakade kopiera skript för att visas ibland på import, och om fastställande av flera fel i samband med internationella teckenuppsättningar och icke- ASCII-tecken.
Mjukvaruinformation:
Kommentarer hittades inte