.getAttribute(CharTermAttribute.class);
OffsetAttribute offsetAtt = tokenizer
.getAttribute(OffsetAttribute.class);
String w = "";
while (tokenizer.incrementToken()) {
String word = new String(termAtt.buffer(), 0, termAtt.length());
// int s = offsetAtt.startOffset();
// int e = offsetAtt.endOffset();
w = word;
}
long segs = System.currentTimeMillis() - start;