Examples of org.apache.lucene.analysis.core.LowerCaseTokenizer | massapi.com

Home Package Class Method

Package org.apache.lucene.analysis.core

Examples of org.apache.lucene.analysis.core.LowerCaseTokenizer

org.apache.lucene.analysis.core.LowerCaseTokenizer
LowerCaseTokenizer performs the function of LetterTokenizer and LowerCaseFilter together. It divides text at non-letters and converts them to lower case. While it is functionally equivalent to the combination of LetterTokenizer and LowerCaseFilter, there is a performance advantage to doing the two tasks at once, hence this (redundant) implementation.
Note: this does a decent job for most European languages, but does a terrible job for some Asian languages, where words are not separated by spaces.

You must specify the required {@link Version} compatibility when creating{@link LowerCaseTokenizer}:

    };


    private static final class PorterStemAnalyzer extends Analyzer {
        @Override
        protected TokenStreamComponents createComponents(String fieldName, Reader reader) {
            Tokenizer source = new LowerCaseTokenizer(Constants.VERSION, reader);
            return new TokenStreamComponents(source, new PorterStemFilter(source));
        }

View Full Code Here

        super(index, indexSettings, name, settings);
    }


    @Override
    public Tokenizer create() {
        return new LowerCaseTokenizer();
    }

View Full Code Here

0 1 2 3

Related Classes of org.apache.lucene.analysis.core.LowerCaseTokenizer

com.github.rnewson.couchdb.lucene.util.PorterStemAnalyzer

org.apache.lucene.analysis.br.TestBrazilianStemmer

org.apache.lucene.analysis.core.LowerCaseTokenizerFactory

org.apache.lucene.analysis.de.TestGermanAnalyzer

org.apache.lucene.analysis.util.TestCharTokenizers

org.elasticsearch.index.analysis.LowerCaseTokenizerFactory

org.hibernate.search.testsupport.analyzer.BarAnalyzer

org.hibernate.search.testsupport.analyzer.FooAnalyzer

Copyright © 2018 www.massapicom. All rights reserved.

All source code are property of their respective owners. Java is a trademark of Sun Microsystems, Inc and owned by ORACLE Inc. Contact coftware#gmail.com.