Package org.languagetool

Examples of org.languagetool.JLanguageTool$TextCheckCallable$LineColumnPosition


public class HunspellRuleTest {

  @Test
  public void testRuleWithGerman() throws Exception {
    final HunspellRule rule = new HunspellRule(TestTools.getMessages("German"), new GermanyGerman());
    final JLanguageTool langTool = new JLanguageTool(new German());
    commonGermanAsserts(rule, langTool);
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Der äußere Übeltäter.")).length)// umlauts
    assertEquals(1, rule.match(langTool.getAnalyzedSentence("Der äussere Übeltäter.")).length);
    // ignore URLs:
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Unter http://foo.org/bar steht was.")).length);
    assertEquals(1, rule.match(langTool.getAnalyzedSentence("dasdassda http://foo.org/bar steht was.")).length);
    assertEquals(1, rule.match(langTool.getAnalyzedSentence("Unter http://foo.org/bar steht dasdassda.")).length);
  }
View Full Code Here


  }

  @Test
  public void testRuleWithAustrianGerman() throws Exception {
    final HunspellRule rule = new HunspellRule(TestTools.getMessages("German"), new AustrianGerman());
    final JLanguageTool langTool = new JLanguageTool(new German());
    commonGermanAsserts(rule, langTool);
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Der äußere Übeltäter.")).length)// umlauts
    assertEquals(1, rule.match(langTool.getAnalyzedSentence("Der äussere Übeltäter.")).length);
  }
View Full Code Here

  }

  @Test
  public void testRuleWithSwissGerman() throws Exception {
    final HunspellRule rule = new HunspellRule(TestTools.getMessages("German"), new SwissGerman());
    final JLanguageTool langTool = new JLanguageTool(new German());
    commonGermanAsserts(rule, langTool);
    assertEquals(1, rule.match(langTool.getAnalyzedSentence("Der äußere Übeltäter.")).length)// ß not allowed in Swiss
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Der äussere Übeltäter.")).length)// ss is used instead of ß
  }
View Full Code Here

  @Ignore("just for internal performance testing, thus ignored by default")
  @Test
  public void testPerformance() throws Exception {
    final List<Language> allLanguages = Language.getAllLanguages();
    for (Language language : allLanguages) {
      final JLanguageTool langTool = new JLanguageTool(language);
      //final HunspellRule rule = new HunspellRule(TestTools.getMessages("German"), language);
      langTool.check("warmup")// make sure everything is initialized when actually testing
      langTool.check("anotherwarmup");
      final long startTime = System.currentTimeMillis();
      langTool.check("fdfds fdfdsa fdfdsb fdfdsc fdfdsd fdfdse fdfdsf fdfds fdfdsa fdfdsb fdfdsc fdfdsd fdfdse fdfdsf");
      //String[] w = {"foo", "warmup", "Rechtschreipreform", "Theatrekasse", "Zoobesuck", "Handselvertreter", "Mückenstick", "gewönlich", "Traprennen", "Autoverkehrr"};
      //final AnalyzedSentence analyzedSentence = langTool.getAnalyzedSentence("fdfds fdfdsa fdfdsb fdfdsc fdfdsd fdfdse fdfdsf");
      //rule.match(analyzedSentence);
      final long endTime = System.currentTimeMillis();
      System.out.println((endTime-startTime) + "ms for " + language);
View Full Code Here

public class KhmerSpaceBeforeRuleTest extends TestCase {

    public void testSpaceBeforeRule() throws IOException {
        final Khmer language = new Khmer();
        KhmerSpaceBeforeRule rule = new KhmerSpaceBeforeRule(TestTools.getEnglishMessages(), language);
        JLanguageTool langTool = new JLanguageTool(language);
        // correct sentences:
        assertEquals(0, rule.match(langTool.getAnalyzedSentence("គាត់​បាន​ទៅ ដើម្បី​ទិញ​ម្ហូប។")).length);
        assertEquals(0, rule.match(langTool.getAnalyzedSentence("ខ្ញុំ និង​គាត់។")).length);
        assertEquals(0, rule.match(langTool.getAnalyzedSentence("គាត់​ចង់​បាន ពីព្រោះ​គាត់​អត់​មាន។")).length);

        // incorrect sentences:
        assertEquals(1, rule.match(langTool.getAnalyzedSentence("គាត់​បាន​ទៅ​ដើម្បី​ទិញ​ម្ហូប។")).length);
        assertEquals(1, rule.match(langTool.getAnalyzedSentence("ខ្ញុំ​និង​គាត់។")).length);
        assertEquals(1, rule.match(langTool.getAnalyzedSentence("គាត់​ចង់​បាន​ពីព្រោះ​គាត់​អត់​មាន។")).length);
    }
View Full Code Here

public class KhmerWordRepeatRuleTest extends TestCase {

    public void testWordRepeatRule() throws IOException {
        final Khmer language = new Khmer();
        KhmerWordRepeatRule rule = new KhmerWordRepeatRule(TestTools.getEnglishMessages(), language);
        JLanguageTool langTool = new JLanguageTool(language);
        // correct sentences:
        assertEquals(0, rule.match(langTool.getAnalyzedSentence("នេះ​ហើយៗ​នោះ។")).length);
        assertEquals(0, rule.match(langTool.getAnalyzedSentence("គាត់​ហើយ ហើយ​ខ្ញុំ។")).length);

        // incorrect sentences:
        assertEquals(1, rule.match(langTool.getAnalyzedSentence("នេះ​ហើយ​ហើយ​នោះ។")).length);
        assertEquals(1, rule.match(langTool.getAnalyzedSentence("ខ្ញុំ​និង​និង​គាត់។")).length);
    }
View Full Code Here

    assertTrue(rule.supportsLanguage(new German()));
  }

  public void testRule() throws IOException {
    CaseRule rule = new CaseRule(null);
    JLanguageTool langTool = new JLanguageTool(new German());

    // correct sentences:
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Ein einfacher Satz zum Testen.")).length);
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Das Laufen fällt mir leicht.")).length);
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Das Winseln stört.")).length);
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Das schlägt nicht so zu Buche.")).length);
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Dirk Hetzel ist ein Name.")).length);
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Sein Verhalten war okay.")).length);
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Hier ein Satz. \"Ein Zitat.\"")).length);
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Hier ein Satz. 'Ein Zitat.'")).length);
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Hier ein Satz. «Ein Zitat.»")).length);
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Hier ein Satz. »Ein Zitat.«")).length);
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Hier ein Satz. (Noch einer.)")).length);
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Hier geht es nach Tel Aviv.")).length);
    assertEquals(0, langTool.check("Karten werden vom Auswahlstapel gezogen. […] Der Auswahlstapel gehört zum Inhalt.").size());
//     assertEquals(1, langTool.check("Karten werden vom Auswahlstapel gezogen. [...] Der Auswahlstapel gehört zum Inhalt.").size());
    // "NIL" reading in Morphy that used to confuse CaseRule:
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Ein Menschenfreund.")).length);
    // works only thanks to addex.txt:
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Der Nachfahre.")).length);
    // both can be correct:
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Hier ein Satz, \"Ein Zitat.\"")).length);
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Hier ein Satz, \"ein Zitat.\"")).length);
    // Exception 'Le':
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Schon Le Monde schrieb das.")).length);
    // unknown word:
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("In Blubberdorf macht man das so.")).length);

    // sentences that used to trigger an error because of incorrect compound tokenization:
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Das sind Euroscheine.")).length);
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("John Stallman isst.")).length);
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Das ist die neue Gesellschafterin hier.")).length);
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Das ist die neue Dienerin hier.")).length);
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Das ist die neue Geigerin hier.")).length);
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Die ersten Gespanne erreichen Köln.")).length);
   
    // used to trigger error because of wrong POS tagging:
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Die Schlinge zieht sich zu.")).length);
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Die Schlingen ziehen sich zu.")).length);
   
    // used to trigger error because of "abbreviation"
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Sie fällt auf durch ihre hilfsbereite Art. Zudem zeigt sie soziale Kompetenz.")).length);
   
    // TODO: nach dem Doppelpunkt wird derzeit nicht auf groß/klein getestet:
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Das ist es: kein Satz.")).length);
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Das ist es: Kein Satz.")).length);

    // incorrect sentences:
    assertEquals(1, rule.match(langTool.getAnalyzedSentence("Ein Einfacher Satz zum Testen.")).length);
    assertEquals(1, rule.match(langTool.getAnalyzedSentence("Das Winseln Stört.")).length);
    assertEquals(1, rule.match(langTool.getAnalyzedSentence("Sein verhalten war okay.")).length);
    assertEquals(1, langTool.check("Karten werden vom Auswahlstapel gezogen. Auch […] Der Auswahlstapel gehört zum Inhalt.").size());
//     assertEquals(2, langTool.check("Karten werden vom Auswahlstapel gezogen. Auch [...] Der Auswahlstapel gehört zum Inhalt.").size());
  }
View Full Code Here

  private JLanguageTool langTool;
 
  @Override
  public void setUp() throws IOException {
    rule = new CatalanUnpairedBracketsRule(TestTools.getEnglishMessages(), new Catalan());
    langTool = new JLanguageTool(new Catalan());
  }
View Full Code Here

    final RuleMatch[] matches = rule.match(langTool.getAnalyzedSentence(sentence));
    assertEquals(1, matches.length);
  }
 
  public void testMultipleSentences() throws IOException {
    final JLanguageTool tool = new JLanguageTool(new Catalan());
    tool.enableRule("CA_UNPAIRED_BRACKETS");

    List<RuleMatch> matches;
    matches = tool
        .check("Aquesta és una sentència múltiple amb claudàtors: "
            + "[Ací hi ha un claudàtor. Amb algun text.] i ací continua.\n");
    assertEquals(0, matches.size());
    matches = tool
        .check("\"Sóc la teva filla. El corcó no et rosegarà més.\"\n\n");
    assertEquals(0, matches.size());
    matches = tool
        .check("\"Sóc la teva filla. El corcó no et rosegarà més\".\n\n");
    assertEquals(0, matches.size());
    matches = tool
        .check("Aquesta és una sentència múltiple amb claudàtors: "
            + "[Ací hi ha un claudàtor. Amb algun text. I ací continua.\n\n");
    assertEquals(1, matches.size());
   
    matches = tool
        .check("«Els manaments diuen: \"No desitjaràs la dona del teu veí\"»");
    //assertEquals(0, matches.size());
           
    // now with a paragraph end inside - we get two alarms because of paragraph
    // resetting
    matches = tool
        .check("Aquesta és una sentència múltiple amb parèntesis "
            + "(Ací hi ha un parèntesi. \n\n Amb algun text.) i ací continua.");
    assertEquals(2, matches.size());
  }
View Full Code Here

//     assertEquals(2, langTool.check("Karten werden vom Auswahlstapel gezogen. Auch [...] Der Auswahlstapel gehört zum Inhalt.").size());
  }

  public void testSubstantivierteVerben() throws IOException {
    CaseRule rule = new CaseRule(null);
    JLanguageTool langTool = new JLanguageTool(new German());

    // correct sentences:
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Das fahrende Auto.")).length);
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Das können wir so machen.")).length);
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Denn das Fahren ist einfach.")).length);
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Das Fahren ist einfach.")).length);
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Das Gehen fällt mir leicht.")).length);
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Das Ernten der Kartoffeln ist mühsam.")).length);
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Entschuldige das späte Weiterleiten.")).length);
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Ich liebe das Lesen.")).length);
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Das Betreten des Rasens ist verboten.")).length);
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Das haben wir aus eigenem Antrieb getan.")).length);
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Das haben wir.")).length);
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Das haben wir schon.")).length);
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Das lesen sie doch sicher in einer Minute durch.")).length);
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Das lesen Sie doch sicher in einer Minute durch!")).length);

    // Source of the following examples: http://www.canoo.net/services/GermanSpelling/Amtlich/GrossKlein/pgf57-58.html
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Das Lesen fällt mir schwer.")).length);
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Sie hörten ein starkes Klopfen.")).length);
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Wer erledigt das Fensterputzen?")).length);
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Viele waren am Zustandekommen des Vertrages beteiligt.")).length);
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Die Sache kam ins Stocken.")).length);
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Das ist zum Lachen.")).length);
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Euer Fernbleiben fiel uns auf.")).length);
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Uns half nur noch lautes Rufen.")).length);
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Die Mitbewohner begnügten sich mit Wegsehen und Schweigen.")).length);
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Sie wollte auf Biegen und Brechen gewinnen.")).length);
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Er klopfte mit Zittern und Zagen an.")).length);
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Ich nehme die Tabletten auf Anraten meiner Ärztin.")).length);
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Sie hat ihr Soll erfüllt.")).length);
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Dies ist ein absolutes Muss.")).length);
    assertEquals(0, rule.match(langTool.getAnalyzedSentence("Das Lesen fällt mir schwer.")).length);

    // incorrect sentences:
    assertEquals(1, rule.match(langTool.getAnalyzedSentence("Das fahren ist einfach.")).length);
    assertEquals(1, rule.match(langTool.getAnalyzedSentence("Denn das fahren ist einfach.")).length);
    assertEquals(1, rule.match(langTool.getAnalyzedSentence("Denn das laufen ist einfach.")).length);
    assertEquals(1, rule.match(langTool.getAnalyzedSentence("Denn das essen ist einfach.")).length);
    assertEquals(1, rule.match(langTool.getAnalyzedSentence("Denn das gehen ist einfach.")).length);
    // TODO: detect all the cases not preceded with 'das'
  }
View Full Code Here

TOP

Related Classes of org.languagetool.JLanguageTool$TextCheckCallable$LineColumnPosition

Copyright © 2018 www.massapicom. All rights reserved.
All source code are property of their respective owners. Java is a trademark of Sun Microsystems, Inc and owned by ORACLE Inc. Contact coftware#gmail.com.