Package railo.runtime.search.lucene2.analyzer

Source Code of railo.runtime.search.lucene2.analyzer.SpanishAnalyzer

package railo.runtime.search.lucene2.analyzer;


import java.io.Reader;

import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.TokenStream;
import org.apache.lucene.analysis.snowball.SnowballAnalyzer;


/**
* <p>Analyzer for Spanish language</p>
* <p><a href="SpanishAnalyzer.java.html"><i>View Source</i></a></p>
* <p/>
*
* @author Andrey Grebnev <a href="mailto:andrey.grebnev@blandware.com">&lt;andrey.grebnev@blandware.com&gt;</a>
* @version $Revision: 1.2 $ $Date: 2005/02/24 19:51:22 $
*/
public final class SpanishAnalyzer extends Analyzer {

  private static SnowballAnalyzer analyzer;

  private String SPANISH_STOP_WORDS[] = {

    "un", "una", "unas", "unos", "uno", "sobre", "todo", "tambien", "tras",
    "otro", "algun", "alguno", "alguna",

    "algunos", "algunas", "ser", "es", "soy", "eres", "somos", "sois", "estoy",
    "esta", "estamos", "estais",

    "estan", "en", "para", "atras", "porque", "por que", "estado", "estaba",
    "ante", "antes", "siendo",

    "ambos", "pero", "por", "poder", "puede", "puedo", "podemos", "podeis",
    "pueden", "fui", "fue", "fuimos",

    "fueron", "hacer", "hago", "hace", "hacemos", "haceis", "hacen", "cada",
    "fin", "incluso", "primero",

    "desde", "conseguir", "consigo", "consigue", "consigues", "conseguimos",
    "consiguen", "ir", "voy", "va",

    "vamos", "vais", "van", "vaya", "bueno", "ha", "tener", "tengo", "tiene",
    "tenemos", "teneis", "tienen",

    "el", "la", "lo", "las", "los", "su", "aqui", "mio", "tuyo", "ellos",
    "ellas", "nos", "nosotros", "vosotros",

    "vosotras", "si", "dentro", "solo", "solamente", "saber", "sabes", "sabe",
    "sabemos", "sabeis", "saben",

    "ultimo", "largo", "bastante", "haces", "muchos", "aquellos", "aquellas",
    "sus", "entonces", "tiempo",

    "verdad", "verdadero", "verdadera", "cierto", "ciertos", "cierta",
    "ciertas", "intentar", "intento",

    "intenta", "intentas", "intentamos", "intentais", "intentan", "dos", "bajo",
    "arriba", "encima", "usar",

    "uso", "usas", "usa", "usamos", "usais", "usan", "emplear", "empleo",
    "empleas", "emplean", "ampleamos",

    "empleais", "valor", "muy", "era", "eras", "eramos", "eran", "modo", "bien",
    "cual", "cuando", "donde",

    "mientras", "quien", "con", "entre", "sin", "trabajo", "trabajar",
    "trabajas", "trabaja", "trabajamos",

    "trabajais", "trabajan", "podria", "podrias", "podriamos", "podrian",
    "podriais", "yo", "aquel", "mi",

    "de", "a", "e", "i", "o", "u"};

  /**
   * Creates new instance of SpanishAnalyzer
   */
  public SpanishAnalyzer() {
    analyzer = new SnowballAnalyzer("Spanish", SPANISH_STOP_WORDS);
  }

  public SpanishAnalyzer(String stopWords[]) {
    analyzer = new SnowballAnalyzer("Spanish", stopWords);
  }

  @Override
    public TokenStream tokenStream(String fieldName, Reader reader) {
    return analyzer.tokenStream(fieldName, reader);
  }
}
TOP

Related Classes of railo.runtime.search.lucene2.analyzer.SpanishAnalyzer

TOP
Copyright © 2018 www.massapi.com. All rights reserved.
All source code are property of their respective owners. Java is a trademark of Sun Microsystems, Inc and owned by ORACLE Inc. Contact coftware#gmail.com.