Examples of org.apache.lucene.analysis.cn.smart.WordTokenizer

Package org.apache.lucene.analysis.cn.smart

Examples of org.apache.lucene.analysis.cn.smart.WordTokenizer

org.apache.lucene.analysis.cn.smart.WordTokenizer

    wordSegment = new WordSegmenter();
  }


  public TokenStream tokenStream(String fieldName, Reader reader) {
    TokenStream result = new SentenceTokenizer(reader);
    result = new WordTokenizer(result, wordSegment);
    // result = new LowerCaseFilter(result);
    // 不再需要LowerCaseFilter，因为SegTokenFilter已经将所有英文字符转换成小写
    // stem太严格了, This is not bug, this feature:)
    result = new PorterStemFilter(result);
    if (stopWords != null) {

View Full Code Here

TOP

Related Classes of org.apache.lucene.analysis.cn.smart.WordTokenizer

org.apache.lucene.analysis.cn.SmartChineseAnalyzer

All source code are property of their respective owners. Java is a trademark of Sun Microsystems, Inc and owned by ORACLE Inc. Contact coftware#gmail.com.