LanguageTool

Software skärmdump:
LanguageTool
Mjukvaruinformation:
Version: 2.9 Uppdaterad
Ladda upp dagen: 14 Apr 15
Utvecklare: Daniel Naber
Licens: Gratis
Popularitet: 18

Rating: nan/5 (Total Votes: 0)

LanguageTool är ett open source korrekturläsning program för att hitta fel som vanliga stavningskontroll verktyg inte kan upptäcka. Det är en regelbaserad stil och grammatikkontroll som hittar fel som en regel definieras i sina XML konfigurationsfiler, till exempel blanda upp & ldquo; deras & rdquo; med & ldquo;. Det & rdquo;


Detekterar olika grammatik problem

Programmet kan också upptäcka olika grammatiska problem och kommer med stöd för över 20 språk, inklusive engelska, tyska, polska, franska, spanska, svenska, grekiska, kinesiska, danska, japanska, isländska, portugisiska och brasiliansk portugisiska.
Dessutom har det en enkel att använda, enkelt och okomplicerat grafiskt användargränssnitt som gör att vem som helst att klistra in text som måste stava kontrolleras. Det kan kontrollera texten på klippbordet, tag text, klippa / kopiera / klistra in text, och uppehålla sig i systemfältet.


Upptäcker ett brett spektrum av problem

I dialogrutan Alternativ kan du aktivera vilken typ av problem ansökan kan upptäcka, inklusive dålig stil, grammatikfel, slang, skiljetecken fel, eventuella stavfel, redundanta fraser, vanligen förvirrade ord, kollokationer, kapitalisering, semantik, samt som icke-standardfraser.


LanguageTool för Libre och Open

Förutom att vara ett fristående program, är LanguageTool också tillgänglig som en förlängning för två av de mest populära och kraftfulla öppen källkod kontor sviter, Libreoffice och Apache OpenOffice.org, så att användarna kan korrekturläsa sina texter genom att högerklicka på utvalda fraser eller stycken.


LanguageTool för Mozilla Firefox

Dessutom är programmet också tillgänglig för nedladdning som en add-on för världen och rsquoen; s mest populära open-source webbläsare i världen, Mozilla Firefox. Den kräver ingen omstart och placerar en liten knapp på verktygslisten, så att du kan korrekturläsa markerat text från webbplatser eller formulär.


Under huven och tillgänglighet

Ansökan är skriven helt i programmeringsspråket Java, vilket innebär att det & rsquo; s plattformsoberoende programvara, utformad för att fungera med alla GNU / Linux-distribution, samt BSD, Solaris, Microsoft Windows och Mac OS X operativsystem system, där Java Runtime Environment är installerad.

Vad är nytt i den här versionen:

  • katalanska:
  • uppdaterad POS tag ordbok
  • lagt till nya regler
  • fasta falsklarm
  • Engelska:
  • lagt till några regler och fasta några falsklarm
  • lagt till många nya stilregler bidragit med Heikki Lehvaslaiho. Eftersom dessa kan orsaka falsklarm, är de inte aktiverade som standard. Du kan aktivera dem genom att slå på alla regler i den nya "Plain English" kategori.
  • Esperanto:
  • lagt till några nya regler
  • franska
  • uppdaterad POS tag ordbok och hunspell ordbok Dicollecte-5,3
  • Tysk:
  • lagt till några nya regler och fasta falsklarm
  • Lade till en ny regel som kontrollerar för ämnes verb avtal. För nu är det bara fall med "ist", "sind", "krig", och "Waren" stöds. Exempel på fel som upptäcks: ". Der Hund sind SCHA & para; n ',' Die Autos ist schnell." För att göra denna regel arbete, är fraser nu förenas i disambiguation.xml: till exempel "Mann" i uttrycket "ein Mann" kommer bara att behålla sin nominativ läsning (SUB: NOM: SIN: MAS), medan det brukade också ackusativ och dativ avläsningar (SUB: AKK: SIN: MAS, SUB: DAT: SIN: MAS). (Https://github.com/languagetool-org/languagetool/issues/233)
  • Italienska:
  • förbättrat några regler
  • polska:
  • lagt till flera nya regler
  • Portugisen:
  • tillsatta / förbättrade flera regler
  • 3695 sammansatta ord (före reformen) - den största fri databas
  • ryska:
  • sattes och förbättrade regler
  • ukrainska:
  • stora lexikon uppdatering
  • nya grammatiska regler
  • ny enkel ersätta regeln för mjuka förslag
  • disambiguator förbättringar
  • förening taggning och stavning förbättringar
  • initialer tagg förbättringar

  • Tokenizing förbättringar
  • menings och ord
  • förbättrad hantering av stres symbol och mjuka bindestreck
  • Bitext regler:
  • lagt till en enkel regel för att kontrollera om översättningar slutar med samma skiljetecken som originalet (detta inkluderar bara.?! Tecken).
  • är det nu möjligt att lägga till externa bitext regelfiler på kommandoraden genom att använda
  • -bitextrule alternativ. Sökvägen måste vara absolut. Anm. Detta gör det möjligt att använda bitext regler även för språk som inte har några bitext regler som ingår som standard
  • Stavning:
  • De nya filerna på /hunspell/spelling.txt kan användas för att lägga accepterade ord i stavningskontrollen som också beaktas när man skapar förslag för felstavade ord. Detta liknar de /hunspell/ignore.txt filer, vilken lista accepterade ord som * inte * används när du skapar förslag för felstavade ord.
  • API:
  • JLanguageTool.activateDefaultPatternRules () och JLanguageTool.activateDefaultFalseFriendRules () har tagits bort - alla mönsterregler och falska vänner regler (om ett andra språk anges) nu aktiveras automatiskt när konstruktören av JLanguageTool kallas. Om du behöver en pjäs utan XML-baserade mönster regler förlänga ditt språk klass (t.ex. "English") med en som skriver över getPatternRules () metoden och returnerar en tom lista där.
  • ManualTagger.lookup () har ersatts av ManualTagger.tag () efter att ha Tagen sedan den senaste versionen
  • Alla statiska metoder och fält från klass "Språk" har flyttats till den nya klassen "språk". För nu, de metoder / områden i klass Språk finns fortfarande, men har föråldrat.
  • LanguageIdentifierTools har tagits bort. Använd LanguageIdentifier istället.
  • Removed (standard) ResourceDataBroker.setResourceDir () och setRulesDir () eftersom dessa kan ställas in med konstruktören
  • saneras upp klass skribent, t.ex. avlägsna getRemark ()
  • Category.setDefaultOff () har tagits bort, kan detta ställas in via konstruktör nu
  • Omdöpt klasser: o.lt.rules.patterns.Element = & gt; o.lt.rules.patterns.PatternToken o.lt.rules.patterns.ElementMatcher = & gt; o.lt.rules.patterns.PatternTokenMatcher
  • Andra små API cleanups som inte bör påverka de gemensamma användningsfall, t.ex. IncorrectExample.getCorrections () avkastning och unmodifiable lista nu, avlägsnande av föråldrade metoder.
  • Embedded server:
  • XML flyr har fastställts, detta kan leda till ogiltiga XML-dokument som ska returneras
  • nya konfigurationsfilen alternativet maxWorkQueueSize "som låter dig ställa in den maximala storleken på begäran kö - Om det blir större än detta, kommer begäran avslås (503 service tillgänglig)
  • Servern svarar nu med mer specifika HTTP-statuskoder på dessa feltillstånd: 413 Begär Entity för stort - om texten överstiger maximal textstorlek 503 Tjänst Ej - om kontroll överskrider maximal kontroll tid
  • GUI:
  • Den fristående GUI kan nu ta en vanlig textfil som ett argument, kommer den här filen sedan laddas vid start (Github fråga # 232).
  • Command-line:
  • Det är nu möjligt att lägga till en extern regel fil när du ringer LanguageTool från kommandoraden. Använd --rulefile att lägga till en fil. Om filnamnet har ett format som innehåller ett språknamn, kommer det att användas tillsammans med andra regler; Annars kommer den att ersätta reglerna. Du kan också läsa in en extern fil med falska vänner med hjälp av options --falsefriends. Filnamnet ska vara en absolut sökväg, och falska vänner filer alltid till de som är laddade för språket. (Github fråga # 192)
  • Regel syntax:
  • En regel kan nu ha ett enda exempel mening så länge som den har en "korrigering" attribut - det kan spara lite redundans om den enda rätta meningen är densamma som den felaktiga meningen med korrigeringen. Innan en regel behövs minst två exempelmeningar.
  • "exempel" inslag: type = "fel" är nu frivilligt om det finns en "korrigering" attribut. Den "korrigering" attribut innebär att meningen är felaktig.
  • "exempel" inslag: type = "rätt" är nu frivilligt. Nej "typ" attribut och ingen "korrigering" attribut innebär att meningen är korrekt.
  • Inre:
  • Vi har bytt från Apache Tika med language-detektor (https://github.com/optimaize/language-detector) för automatisk identifiering av textspråk. Det bör vara snabbare och resultat bör vara mer tillförlitlig. Upptäckt av asturiska och galiciska måste inaktiveras eftersom kvaliteten upptäckt var för låg och påverkas också upptäckt av spanska.
  • Fixat en regression som gjorde det omöjligt att läsa in externa regelfiler i GUI.

Vad är nytt i version 2.8:

  • asturiska:
  • bort beroendet av hunspell, använder nu Morfologik för stavningskontroll
  • Breton:
  • sattes och förbättrat några regler
  • katalanska:
  • uppdaterad ordbok
  • sattes och förbättrade regler
  • fasta falsklarm
  • nederländska:
  • tillsatta och förbättrade många regler
  • Engelska:
  • några nya regler (tack vare Nick Hough)
  • uppdaterat tagger och synthesizer ordböcker, fastställande fråga # 202
  • nytt filter som ska användas för att matcha partofspeech av delar av ord, till exempel:. I * Detta kommer bara att hålla matcher för ord som börjar med "i" och där en del efter den "i" är ett adjektiv (POS tagg "JJ"). "No: 1" är det symboliska läget, det vill säga här den första (och enda) matchning betecknas
  • .
  • franska:
  • sattes och förbättrat några regler
  • Tysk:
  • sattes och förbättrat några regler
  • polska:
  • sattes och förbättrade flera regler
  • sattes och förbättrad falska vänner med engelska
  • Portugisen:
  • tillsatta / förbättrade flera regler
  • spanska:
  • bort beroendet av hunspell, använder nu Morfologik för stavningskontroll
  • Omformate regler fil
  • Lades fler regler
  • tagalog:
  • bort beroendet av hunspell, använder nu Morfologik för stavningskontroll
  • strecket tecknet ("") är en avgränsare nu när tokenizing texten
  • ryska:
  • sattes och förbättrade regler
  • lagt till några falska vänner regler (ryska / engelska)
  • ukrainska:
  • många nya regler (inklusive avtal med substantiv, tidsuttryck etc)
  • regeln täckning förbättring
  • ordbok uppdatering (stora förbättringar för egennamn och vokativ)
  • nya tag och härska att varna om alternativ stavning
  • läggas ordfrekvens information för att förbättra stavningsförslag
  • några nya disambiguator regler
  • Regel Syntax:
  • ... nu kan läggas till en rulegroup att påverka alla regler i denna grupp
  • Om du utvecklar dina egna regler som inte ingår i LT kan du nu lägga till externa = "ja" till dina kategorier för att förhindra att regeln länk till community.languagetool.org från att visas i vår fristående GUI (länken inte skulle fungera för regler som inte ingår i huvuddistributionen av LT). (Github fråga # 223)
  • Om en regel grupp anger default = "off", reglerna inne i regel gruppen kan inte ange default = "på" / "off".
  • API:
  • Borttagna klasser och metoder som hade Borttagen sedan 2,7 eller längre
  • Embedded server:
  • De konfigurationsfil alternativ "requestLimit" och "requestLimitPeriodInSeconds" kan nu även användas för HTTP-servern (inte bara för HTTPS-server)
  • Ny konfigurationsfil alternativet trustXForwardForHeader ": ställa in detta till" true "om du kör servern bakom en omvänd proxy och vill begäran gränsen för att arbeta med de ursprungliga IP-adresser som tillhandahålls av" Xforwardedfor "HTTP-huvudet, vanligtvis av proxy. Om du kör bakom en proxy men inte den här egenskapen till true, kan en användare använda alla förfrågningar så att andra användare kommer också att få ett felmeddelande på grund av begäran gränsen.
  • Fix respons efter det att tidsfristen läge: ... var ibland tom, förvirrande texten checka in Wordpress
  • Bitext reglerna inte inaktiverades ordentligt, även om de anges med en ordentlig parameter för servern; nu är det fast
  • Fixat problem med felaktiga positioner för vissa bitext regler (fråga # 218)
  • GUI:
  • En ny inställning "errorColors" har lagts till i languagetool.cfg konfigurationsfilen. Den kan användas för att ställa in bakgrundsfärg för fel. Till exempel, errorColors = typografiska: # b8b8ff, stil: kommer # ffb8b8 visa "typografiska" fel med en blå bakgrund och "stil" fel med en röd bakgrund i den övre delen av LT fönstret. "Typografiska" och "stil" är de typer som anges i grammar.xml som "type = ...". Det finns inget användargränssnitt ännu att konfigurera dessa färger. Observera att du bara ska redigera languagetool.cfg filen när LT inte körs.
  • Inre:
  • Buggfix: regler inom en regel gruppen hade inte aktiveras om en tidigare regel från samma rulegroup används default = "off"
  • Uttrycker inte ignoreras längre av stavningskontrollen bara för att de förekommer i regel förslag. Om du vill att stavningskontrollen att ignorera ord globalt, lägg dem med hunspell / ignore.txt. Att ignorera dem beroende på sammanhanget, lägga till en "ignore_spelling regeln att disambiguation.xml.
  • En fil "hunspell / prohibit.txt" kan nu användas för att markera ord som stavfel, även om stavningskontrollen normalt skulle acceptera dem. Detta är användbart för att förbättra LanguageTool stavningskontrollen utan att vänta på uppströms checker uppdateras. Den "prohibit.txt" fil är motsatsen till "ignore.txt ', vilket bringar stavningskontrollen att ignorera ord.
  • partofspeech taggaren för de flesta språk kan nu utökas genom att lägga till poster i filen org / languagetool / resurs / XX / added.txt (XX är språkkoden). Formatet är "fullform baseform postag", tre kolumner åtskilda av flikar. Detta gör det enklare för användare (och utvecklare) att förlänga POS taggaren, eftersom de inte behöver exportera, ändra och återskapa den binära ordbok för varje förändring.

Vad är nytt i version 2.7:

  • Breton:
  • sattes och förbättrade regler
  • Ny regel som kontrollerar om en veckodag motsvarar ett datum, t.ex. identifierar "Gwener 28a nämligen Eost 2014", som denna dag inte är en fredag.
  • katalanska:
  • sattes och förbättrade regler
  • fasta falsklarm
  • nederländska:
  • tillsatta och förbättrade många regler
  • bytte till Morfologik baserad stavningskontroll
  • -Engelska:
  • Vill du vara en del av det team som utvecklar världens mest kraftfulla Open Source korrekturläsning verktyg? Vi letar efter en ansvarig för de engelska reglerna i LanguageTool. Se http://wiki.languagetool.org/tasks-for-language-maintainers för mer information.
  • Alla engelska ordböcker har utökats till att innehålla ord frekvens klasser för att förbättra stavningskontrollens förslag (datafrekvensen är hämtad från https://github.com/mozilla-b2g/gaia/tree/master/apps/keyboard/js / IME / latin / ordböcker, som för andra språk som redan använder denna funktion).
  • Bättre förslag på engelska elever: oregelbundna verb, substantiv och adjektiv nu har oftast en bättre förslag. Till exempel "thinked" antyder tänkte "föreslår" kvinna "" kvinnor ".
  • Fler felstavningar ge förslag nu, t.ex. "Garentee" (garanti), "tacksam" (tacksamma). Detta kan orsaka en prestanda minskning med ~ 10% (mer för texter med en massa okända ord).
  • Ny regel som kontrollerar om en veckodag motsvarar ett datum, t.ex. upptäcker "Måndag, 7 oktober, 2014", som denna dag inte är en måndag. Denna regel kommer endast att fungera om den upptäcker datumformat som används. Hittills har dessa format som stöds: * "Måndag, 7 oktober, 2014" * "MÅNDAG 7 oktober, 2014" * "Måndag 7 Oktober, 2014" * "måndag, 7 oktober, 2014" * (detta fungerar även med en förkortad vecka dagar som Mo eller Mon för måndag)
  • Esperanto:
  • Ny regel som kontrollerar om en veckodag motsvarar ett datum, t.ex. identifierar "Vendredon la 28-an de AAgusto 2014", som denna dag inte är en fredag.
  • franska:
  • uppdaterad POS tag ordbok och hunspell ordbok Dicollecte-5,2
  • lagt till en synt - avtalet regeln kan nu lägga fram förslag för vissa fel
  • tillsatta / förbättrade flera regler
  • Ny regel som kontrollerar om en veckodag motsvarar ett datum, t.ex. identifierar "vendredi 28/08/2014", som denna dag inte är en fredag.
  • Tysk:
  • Fixat ett sällsynt NullPointerException och en ArrayIndexOutOfBoundsException
  • Fixat flera falsklarm
  • Annan och förbättrade regler
  • Ny regel som söker efter meningar utan ett verb (avstängd som standard på grund av risken för falsklarm)
  • Ny regel som kontrollerar om en veckodag motsvarar ett datum, t.ex. upptäcker "Dienstag, 2014/09/29", som denna dag inte är en tisdag.
  • Prestandaförbättringar för förslag stavningskontroll
  • persiska:
  • sattes initialt stöd för persiska (farsi)
  • polska:
  • sattes och förbättrat vissa regler
  • ny regel som kontrollerar om en veckodag motsvarar ett datum
  • Portugisen:
  • tillsatta / förbättrade flera regler
  • lagt många dussintals sammansatta ord
  • ryska:
  • lagt till nya regler
  • fixa Sourcefunktionsförfrågan # 38 (kontrollera olika citattecken)
  • lagt till några falska vänner regler (ryska / engelska)
  • ny regel som kontrollerar om en veckodag motsvarar ett datum, t.ex. Upptäcker "ÐонеÐ'еÐ"NŒÐ½Ð¸Ðº, 30 N ?? & ETH, och mikro; & ETH; & frac12; N & sbquo; N ?? & ETH; & plusmn; N & euro; N ?? 2014 & ETH; & sup3 ;. ", som denna dag inte är en måndag
  • .
  • expanderade ryska föreningen regel med nya ord från postag ordbok
  • spanska:
  • Lagt till nya POS kategori Z (för stavade nummer, t.ex. "uno", "dos", ...)
  • stavat nummer kan nu upptäckas och hanteras både i disambiguation och regler.
  • Fast några felaktiga lemman i POS ordboken.
  • Inkom Hybrid chunker-disambiguator.
  • Tamil:
  • Inkom inledande stöd för tamil. Om teckensnittet för Tamil inte visas korrekt på din dator och du använder Windows, kan du behöva tillämpa arbetet kring beskrivs här: https://bugs.openjdk.java.net/browse/JDK-8008572
  • ukrainska:
  • stor uppdatering för POS ordbok (fixar och nya ord)
  • några POS tag döptes för konsekvens; nya tillägg för förkortningar och sällsynta ord
  • många nya regler och korrigeringar för befintliga regler
  • ny regel som kontrollerar om en veckodag motsvarar ett datum, t.ex. identifierar "& ETH; & ETH; & frac34; & ETH; & frac12; & ETH; & micro; & ETH;" N & ETH, "& ETH; & frac34; & ETH; & ordm ;, 7 & ETH, och para; & ETH; & frac34; & ETH; & sup2; 2014 ", som denna dag inte är en måndag
  • token normalisering prestandaförbättring
  • Libreoffice integration:
  • Inte förvirrad av fotnoter i Libreoffice 4.3 och senare (nu ger oss fotnots positioner som metadata, så att vi kan bortse från dem).
  • API:
  • Stora prestandaförbättringar för multi-tråd användningsfall, där JLanguageTool blir skapas per tråd, men språk föremål (t.ex. "tyska") får skapas endast en gång. Overhead för att skapa JLanguageTool bör nu vara mycket lägre.
  • Borttagna flera klasser och metoder som hade Borttagen sedan version 2.6
  • Removed DutchSpellerRule - använd MorfologikDutchSpellerRule istället
  • Undertecknandet av Language.getRelevantRules () har ändrats
  • De JLanguageTool och MultiThreadedJLanguageTool konstruktörer inte förklara att kasta en IOException längre
  • WhitespaceRule har bytt namn till MultipleWhitespaceRule (WhitespaceRule fortfarande finns men har föråldrat)
  • Borttagen några metoder vars synlighet kommer att minska (t.ex. från allmänheten skyddas)
  • MorfologikSpellerRule.getRuleMatch (String, int) har bytt namn till MorfologikSpellerRule.getRuleMatches (String, int)
  • RuleMatch konstruktör kastar nu ett undantag om toPosition är inte större än fromPosition
  • infört ett nytt abstrakt klass TextLevelRule som sträcker artikel och som kan användas för regler som omfattar mer än enstaka meningar.
  • kommandoraden:
  • Aktivera och inaktivera särskilda regler samtidigt är nu tillåtet. För att testa endast vissa regler (inaktivera alla andra), som tidigare gjort med "--enable LIST_OF_RULES", nu använda "--enabledonly --enable LIST_OF_RULES" (eller "-eo -e LIST_OF_RULES").
  • Embedded server:
  • Två nya alternativ kan ställas in i egenskapsfilen för att göra LanguageTool tillbaka samma XML-format som efter tidsfristens utgång (ATD). På så sätt kan användas som en drop-in ersättning för ATD: * läge - "LanguageTool" eller "AfterTheDeadline" * afterTheDeadlineLanguage - kod standardspråk, om läget är inställt på "AfterTheDeadline" OBSERVERA: "AfterTheDeadline" -läge bör övervägas experimentell för nu.
  • det nya alternativet "maxCheckThreads" tillåter att ställa in maximalt antal trådar som arbetar på begäran parallellt. Standardvärdet är 10, som det brukade vara.
  • Internals:
  • Ny abstrakt regel AbstractDateCheckFilter som gör det möjligt att kontrollera om en veckodag och datum match. Till exempel "Tisdag 29 september, 2014" kunde detekteras, som den 29 september, är 2014 egentligen inte en tisdag. Detta använder nya experimentella RuleFilter gränssnitt som kan anropas från XML med det nya elementet "filter". "Filter" tar dessa attribut: "klass": det fullt kvalificerade namnet på en Java-klass som implementerar RuleFilter, t.ex. "org.languagetool.rules.de.DateCheckFilter" "args": en sträng som "år: 1 månad: 2 dag: 3 Weekday: 4", det vill säga ett utrymme separerad lista över nyckel / värde-par, där x blir löst till mönstrets symboliskt värde (som i elementet "message")
  • Föreningen regeln ignorerar nu token som har immuniserats i disambiguation.xml
  • "filter" åtgärder på disambiguator nu endast tillämpas på POS-taggar som matchar POS taggen ges. Om de inte stämmer överens, är regeln tillämpas inte.
  • Om du utvidgning av XML-regler som beskrivs i http://wiki.languagetool.org/tips-and-tricks#toc2 de externa regeln och disambiguation filer kan nu finnas på en lösenordsskyddad server genom att ange en URL så här: http: // användare: password@example.org/path/user-rules.xml
  • tankstreck ("a & euro;" ") är nu en tokenizing tecken för alla språk
  • Ny funktion:
  • språkbruk modeller
  • LanguageTool kan nu utnyttja ngram uppgifter. ngram uppgifter är information om hur ofta fraser förekommer i ett språk. För närvarande använder denna fraser längd 3.
  • Uppgifterna används av en engelsk regel att hitta homofon fel, som att blanda upp grov / kurs eller stil / flare. LanguageTool hade några regler av detta slag innan, men den nya regeln stöder nu omkring 900 av dessa ordpar / set.
  • De uppgifter som behövs för detta är enorma (7 GB för engelska) och därmed inte en del eller LanguageTool.
  • Data (engelska för nu) och mer dokumentation finns på http://wiki.languagetool.org/finding-errors-using-big-data
  • Använda ngrams gör LanguageTool något långsammare när data lagras på en SSD.
  • Om inte lagras på en SSD, kan prestandan drastiskt minska.
  • Använd nya --languagemodel alternativ med kommandoraden klienten för att aktivera regeln som använder uppgifterna. Denna möjlighet är ännu inte tillgängligt för fristående GUI.

Vad är nytt i version 2.4.1:

  • Uppdaterad Morfologik bibliotek till 1.8.3 för att åtgärda långsam förslag i stavningskontrollen, vilket påverkade åtminstone en-US

Vad är nytt i version 2.4:

  • Breton:
  • SRX meningen tokenization
  • läggas / förbättrat några regler
  • fasta några falsklarm
  • fast felaktiga förslag tack vare tillsatta tester på korrigeringar
  • katalanska:
  • tillsatta / förbättrade flera regler
  • fasta falsklarm
  • gjorda tillägg och fixar till tagger ordboken
  • bort några ord från syntes ordbok (se filterarchaic.txt)
  • lagt frekvensdata till tagger ordlistan; frekvens ordlistan kommer från Gaia projektet, med Apache-licensen, version 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries).
  • Engelska:
  • läggas / förbättrat några regler
  • fasta några falsklarm
  • franska:
  • tillsatta / förbättrade flera regler
  • fasta några falsklarm
  • Tysk:
  • tillsatta / förbättrade flera regler
  • lagt till en synthesizer avtalet regeln kan nu lägga fram förslag för vissa fel (inte alla förslag är korrekta, men)
  • polska:
  • läggas / förbättrade flera regler, särskilt för bindestreck och bindestreck användning
  • lagt frekvensinformation för stavningskontroll lexikon; frekvens ordlistan kommer från Gaia projektet, med Apache-licensen, version 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries).
  • fasta några falsklarm
  • Portugisen:
  • läggas / förbättrade flera regler (den innehåller nu könsregler "en" / "o")
  • nu har 3400+ sammansatta ord
  • JAR-filen har bytt namn till languagetool.jar, från tidigare languagetoolstandalone.jar att undvika förvirring om vad som fristående "betyder i detta sammanhang (github fråga # 29)
  • för språk med många regler (som franska eller tyska) prestanda på långa texter har ökat med ca 2030%
  • fix för threadsafety (kan orsaka hänga i MultiWordChunker)
  • fixat en bugg där klump anteckningar inte testades i grupper
  • fix: 1 och hade inte utvärderats i ...
  • fixat en bugg i enandet mekanism som kastas några av de matchande tolkningar i förtid
  • lagt till stöd för klump anteckningar i disambiguator, och fast en bugg i filtrerings tokens med klump kommentarer
  • uppdaterade Morfologik bibliotek till 1.8.2 (buggfixar, striktare ingångs sanity kontroll, lägga frekvensdata till ordböcker)
  • lade till möjligheten att inkludera frekvensdata till taggging eller stavningslexikon. Den förväntade format frekvens ordlistor är en i Gaia projektet, med Apache-licensen, version 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries)
  • nya kommandoraden för att exportera och skapa binära ordböcker:
  • org.languagetool.dev.DictionaryExporter
  • org.languagetool.dev.POSDictionaryBuilder
  • Libreoffice / Openoffice integration:
  • lagt till en lösning för felaktig meningen upptäckt för det fall att en fotnot dök upp efter en mening fullt stopp (Sourceforge bugg # 191)
  • fristående GUI:
  • Dialogrutan öppnas av "More ..." post i snabbmenyn av ett fel kommer nu också visar korrekta och felaktiga exempelmeningar
  • API:
  • SentenceTokenizer är nu ett gränssnitt, genomförandet har flyttats till RegexSentenceTokenizer, men detta är föråldrat och SRXSentenceTokenizer bör användas i stället
  • Vissa metoder från org.languagetool.tools.StringTools har flyttats till org.languagetool.gui.Tools klassen i languagetoolguicommons projektet
  • LanguageToolListener.languageToolEventOccured () har bytt namn till LanguageToolListener.languageToolEventOccurred ()
  • är org.languagetool.tools.SymbolLocator inte offentligt längre (bör inte påverka någon)
  • bort DanishSentenceTokenizer som hade föråldrad under tre år
  • Rule.getCorrectExamples () och Rule.getIncorrectExamples () inte returnera null längre men en tom lista om det inte finns några exempel. Följaktligen anser setCorrectExamples () och setIncorrectExamples () inte acceptera null längre.
  • Rule.getId () kan returnera en sträng nu, inte bara ASCIIonly strängar (faktiskt detta har varit fallet tidigare då ASCIIonly begränsningen aldrig verkställas och endast nämns i javadoc)
  • languagetoolwikipedia: alternativ kommandoraden för att kontrollera en Wikipedia dump har förenklats. Kommandot kan nu kallas så här: java burk languagetoolwikipedia.jar checkdata l en f enwiki20130621pagesarticles.xml Ring bara "java burk languagetoolwikipedia.jar checkdata" för att få ett användningsmeddelande. Mer än en fil kan anges med f alternativet. Dessutom till Wikipedia XML dumpar, CSV-filer från Tatoeba (http://tatoeba.org) nu också stöds, måste de filtreras först att innehålla endast det aktuella språket.

Vad är nytt i version 2.3:

  • Breton:
  • läggas / förbättrat några regler
  • fasta falsklarm
  • uppdaterad POS ordbok från apertium (SVN r47282)
  • katalanska:
  • lagt till stöd för språkkod ca-ES-Valencia (katalanska Valencia), som skall användas i Libre 4.2.0
  • lagt till en enkel ersätta regel med hundratals ersättnings förslag
  • tillsatta / förbättrade flera regler
  • fasta falsklarm
  • Kines:
  • lagt till en lösning för en StringIndexOutOfBoundsException (http://sourceforge.net/p/languagetool/bugs/186/)
  • Engelska:
  • sattes ersättningsmönster för stavningskontrollen att komma med förslag bättre (erbjuder nu "lärde" för "lärde")
  • läggas / förbättrat några regler
  • franska:
  • läggas / förbättrat några regler
  • fasta falsklarm
  • uppdaterad POS tag ordbok och hunspell ordbok Dicollecte-4.12
  • Tysk:
  • tillsatta / förbättrade flera regler
  • Portugisen:
  • läggas / förbättrat några regler
  • nu har 3300+ sammansatta ord
  • ukrainska:
  • tillsatta / förbättrade flera regler
  • källkoden har flyttats till github: https://github.com/languagetool-org/languagetool
  • LanguageTool kräver Java 7 nu
  • LanguageTool utnyttjar flera trådar nu för text kontroll på modern hårdvara, förbättra prestanda (detta påverkar den fristående versionen kommandoraden version och Libreoffice / Openoffice förlängning)
  • Regel syntax:
  • preliminärt stöd för nya min / max attribut som gör det möjligt att matcha ett element som visas visst antal gånger. Till exempel: foo matchar ingenting eller "foo", dvs "foo" är valfritt foo kommer att matcha "foo" eller "foo foo" foo kommer att matcha ingenting "foo", eller "foo foo" Använd max = "- 1" att tillåta obegränsat händelser. För min endast 0 eller 1 stöds (1 är standard).
  • stöd för eller-uttalanden. Till exempel: en internt och i run-time, en regel som innehåller eller-uttalanden omvandlas till flera regler utan eller-uttalanden
  • .
  • Engelska nu har en chunker att upptäcka, bland annat, singular och plural substantiv bitar. Detta dokumenteras på http://wiki.languagetool.org/using-chunks
  • fristående version:
  • Den fristående versionen stryker nu fel med en röd (stavfel) eller blå (andra fel) linje (Panagiotis Minos)
  • Kom ihåg valet till nästa start
  • språk
  • Förbättrad fönster och dialog placering i en flerskärms inställning
  • inbäddade server: använder standardporten (8081) igen om startas utan argument
  • uppdaterat morfologik träds biblioteket till version 1.7.1 för att möjliggöra bättre förslag, inklusive korrekt hantering av diakritiska tecken och ersättningsmönster (ekvivalenter MAP och REP funktioner i hunspell ordböcker)
  • Openoffice / Libreoffice integration:
  • fix: "Om" dialogen fungerade inte i Apache Openoffice 4.0
  • fix: landspecifika regler (som för brittisk engelska) fungerade inte
  • API:
  • I klass Språk har getCountryVariants () bytt namn till getCountries (), och en ny metod getVariant har lagts till.
  • Vissa metoder har föråldrat
  • Vissa metoder har flyttats från Verktyg klass (languagetool-core) till den nya CommandLineTools klass (languagetool-command)










Vad är nytt i version 2.2:



Vad är nytt i version 2.1:





Vad är nytt i version 2.0:







Krav :

  • Java 2 Standard Edition Runtime Environment

Annan programvara för utvecklare Daniel Naber

Jwordsplitter
Jwordsplitter

21 Jan 15

LanguageTool
LanguageTool

21 Jan 15

Kommentarer till LanguageTool

Kommentarer hittades inte
Kommentar
Slå på bilder!