import org.languagetool.rules.RuleMatch;
public class JLanguageToolTest extends TestCase {
public void testPolish() throws IOException {
final Polish polish = new Polish();
JLanguageTool tool = new JLanguageTool(polish);
assertEquals("[PL]", Arrays.toString(polish.getCountries()));
List<RuleMatch> matches = tool.check("To jest całkowicie prawidłowe zdanie.");
assertEquals(0, matches.size());
matches = tool.check("To jest jest problem.");
assertEquals(1, matches.size());
//no error thanks to disambiguation
assertEquals(0, tool.check("Mają one niemałe znaczenie.").size());
assertEquals(0, tool.check("Często wystarczy obrócić na wspak wyroki świata, aby trafnie osądzić jakąś osobę.").size());
//with immunization
assertEquals(0, tool.check("A teraz każcie mi dać jaki bądź posiłek.").size());
assertEquals(0, tool.check("Kiedym wóz zobaczył, byłbym przysiągł, że wielka przygoda mnie czeka.").size());
//with antipatterns: "wymaluj" in "wypisz wymaluj" is immunized locally for punctuation mistakes,
//so it should get no match
assertEquals(0, tool.check("Jurek wygląda wypisz wymaluj babcia.").size());
//but it should get a match with word repetitions:
assertEquals(1, tool.check("Jurek wygląda wypisz wypisz wymaluj babcia.").size());
assertEquals(1, tool.check("Jurek wygląda wypisz wymaluj wymaluj babcia.").size());
//check for a weird unification bug:
assertEquals(0, tool.check("Zawarł w niej, oprócz swojej twórczości, wybrane epigramaty czterdziestu ośmiu innych greckich poetów i poetek.").size());
//checking on pattern rules now...
tool.activateDefaultPatternRules();
//now this should be immunized:
assertEquals(0, tool.check("Nudne brednie tak zamąciły głowę chłopu, że klął na czym ziemia stoi, zmuszonym będąc słuchać tego wszystkiego.").size());
//but this "chcąc, nie chcąc" immunized only by an antipattern
assertEquals(1, tool.check("Chcąc, nie chcąc zjadłem pstrąga.").size());
//this rule is by default off
matches = tool.check("Był on bowiem pięknym strzelcem bowiem.");
assertEquals(0, matches.size());
tool.enableDefaultOffRule("PL_WORD_REPEAT");
matches = tool.check("Był on bowiem pięknym strzelcem bowiem.");
assertEquals(1, matches.size());
tool.activateDefaultPatternRules();
matches = tool.check("Premier drapie się w ucho co i rusz.");
assertEquals(1, matches.size());
// Polish rule has no effect with English error but will get spelling activated:
matches = tool.check("I can give you more a detailed description");
assertEquals(6, matches.size());
tool.setListUnknownWords(true);
matches = tool.check("This is not a Polish text.");
assertEquals(3, matches.size());
assertEquals("[., Polish, This, is, text]", tool.getUnknownWords().toString());
//check positions relative to sentence ends
matches = tool.check("To jest tekst.\nTest 1. To jest linia w której nie ma przecinka.");
assertEquals(17, matches.get(0).getColumn());
//with a space...
matches = tool.check("To jest tekst. \nTest 1. To jest linia w której nie ma przecinka.");
assertEquals(16, matches.get(0).getColumn());
matches = tool.check("To jest tekst. Test 1. To jest linia w której nie ma przecinka.");
assertEquals(32, matches.get(0).getColumn());
//recheck with the -b mode...
polish.getSentenceTokenizer().setSingleLineBreaksMarksParagraph(true);
tool = new JLanguageTool(polish);
tool.activateDefaultPatternRules();
matches = tool.check("To jest tekst.\nTest 1. To jest linia w której nie ma przecinka.");
assertEquals(17, matches.get(0).getColumn());
//with a space...