RussianAnalyzer (Lucene 3.0.3 API)

Overview

Package

Class

Use

Tree

Deprecated

Index

Help

PREV CLASS NEXT CLASS

FRAMES NO FRAMES

SUMMARY: NESTED | FIELD | CONSTR | METHOD

DETAIL: FIELD | CONSTR | METHOD

org.apache.lucene.analysis.ru
Class RussianAnalyzer

java.lang.Object
  org.apache.lucene.analysis.Analyzer
      org.apache.lucene.analysis.ru.RussianAnalyzer

All Implemented Interfaces:: Closeable

public final class RussianAnalyzer
extends org.apache.lucene.analysis.Analyzer
extends org.apache.lucene.analysis.Analyzer

Analyzer for Russian language.

Supports an external list of stopwords (words that will not be indexed at all). A default set of stopwords is used unless an alternative list is specified.

Field Summary

Fields inherited from class org.apache.lucene.analysis.Analyzer
`overridesTokenStreamMethod`

Constructor Summary
`RussianAnalyzer(org.apache.lucene.util.Version matchVersion)`
`RussianAnalyzer(org.apache.lucene.util.Version matchVersion, Map<?,?> stopwords)` Deprecated. use `RussianAnalyzer(Version, Set)` instead
`RussianAnalyzer(org.apache.lucene.util.Version matchVersion, Set<?> stopwords)` Builds an analyzer with the given stop words
`RussianAnalyzer(org.apache.lucene.util.Version matchVersion, String... stopwords)` Deprecated. use `RussianAnalyzer(Version, Set)` instead

Method Summary
`org.apache.lucene.analysis.TokenStream`	`reusableTokenStream(String fieldName, Reader reader)` Returns a (possibly reused) `TokenStream` which tokenizes all the text in the provided `Reader`.
`org.apache.lucene.analysis.TokenStream`	`tokenStream(String fieldName, Reader reader)` Creates a `TokenStream` which tokenizes all the text in the provided `Reader`.

Methods inherited from class org.apache.lucene.analysis.Analyzer
`close, getOffsetGap, getPositionIncrementGap, getPreviousTokenStream, setOverridesTokenStreamMethod, setPreviousTokenStream`

Methods inherited from class java.lang.Object
`clone, equals, finalize, getClass, hashCode, notify, notifyAll, toString, wait, wait, wait`

Constructor Detail

RussianAnalyzer

public RussianAnalyzer(org.apache.lucene.util.Version matchVersion)

RussianAnalyzer

public RussianAnalyzer(org.apache.lucene.util.Version matchVersion,
                       String... stopwords)

Deprecated. use RussianAnalyzer(Version, Set) instead

Builds an analyzer with the given stop words.

RussianAnalyzer

public RussianAnalyzer(org.apache.lucene.util.Version matchVersion,
                       Set<?> stopwords)

Builds an analyzer with the given stop words

Parameters:: matchVersion - lucene compatibility version; stopwords - a stopword set

RussianAnalyzer

public RussianAnalyzer(org.apache.lucene.util.Version matchVersion,
                       Map<?,?> stopwords)

Deprecated. use RussianAnalyzer(Version, Set) instead

Builds an analyzer with the given stop words. TODO: create a Set version of this ctor

Method Detail

tokenStream

public org.apache.lucene.analysis.TokenStream tokenStream(String fieldName,
                                                          Reader reader)

Creates a TokenStream which tokenizes all the text in the provided Reader.

Specified by:: tokenStream in class org.apache.lucene.analysis.Analyzer

Returns:: A TokenStream built from a RussianLetterTokenizer filtered with RussianLowerCaseFilter, StopFilter, and RussianStemFilter

reusableTokenStream

public org.apache.lucene.analysis.TokenStream reusableTokenStream(String fieldName,
                                                                  Reader reader)
                                                           throws IOException

Returns a (possibly reused) TokenStream which tokenizes all the text in the provided Reader.

Overrides:: reusableTokenStream in class org.apache.lucene.analysis.Analyzer

Returns:: A TokenStream built from a RussianLetterTokenizer filtered with RussianLowerCaseFilter, StopFilter, and RussianStemFilter
Throws:: IOException

Overview

Package

Class

Use

Tree

Deprecated

Index

Help

PREV CLASS NEXT CLASS

FRAMES NO FRAMES

SUMMARY: NESTED | FIELD | CONSTR | METHOD

DETAIL: FIELD | CONSTR | METHOD

org.apache.lucene.analysis.ru Class RussianAnalyzer

RussianAnalyzer

RussianAnalyzer

RussianAnalyzer

RussianAnalyzer

tokenStream

reusableTokenStream

org.apache.lucene.analysis.ru
Class RussianAnalyzer