org.apache.lucene.analysis.core (Lucene 9.0.0 common API)

Basic, general-purpose analysis components.

Class Summary
Class	Description
DecimalDigitFilter	Folds all Unicode digits in `[:General_Category=Decimal_Number:]` to Basic Latin digits (`0-9`).
DecimalDigitFilterFactory	Factory for `DecimalDigitFilter`.
FlattenGraphFilter	Converts an incoming graph token stream, such as one from `SynonymGraphFilter`, into a flat form so that all nodes form a single linear chain with no side paths.
FlattenGraphFilterFactory	Factory for `FlattenGraphFilter`.
KeywordAnalyzer	"Tokenizes" the entire stream as a single token.
KeywordTokenizer	Emits the entire input as a single token.
KeywordTokenizerFactory	Factory for `KeywordTokenizer`.
LetterTokenizer	A LetterTokenizer is a tokenizer that divides text at non-letters.
LetterTokenizerFactory	Factory for `LetterTokenizer`.
LowerCaseFilter	Normalizes token text to lower case.
LowerCaseFilterFactory	Factory for `LowerCaseFilter`.
SimpleAnalyzer	An `Analyzer` that filters `LetterTokenizer` with `LowerCaseFilter`
StopAnalyzer	Filters `LetterTokenizer` with `LowerCaseFilter` and `StopFilter`.
StopFilter	Removes stop words from a token stream.
StopFilterFactory	Factory for `StopFilter`.
TypeTokenFilter	Removes tokens whose types appear in a set of blocked types from a token stream.
TypeTokenFilterFactory	Factory class for `TypeTokenFilter`.
UnicodeWhitespaceAnalyzer	An Analyzer that uses `UnicodeWhitespaceTokenizer`.
UnicodeWhitespaceTokenizer	A UnicodeWhitespaceTokenizer is a tokenizer that divides text at whitespace.
UpperCaseFilter	Normalizes token text to UPPER CASE.
UpperCaseFilterFactory	Factory for `UpperCaseFilter`.
WhitespaceAnalyzer	An Analyzer that uses `WhitespaceTokenizer`.
WhitespaceTokenizer	A tokenizer that divides text at whitespace characters as defined by `Character.isWhitespace(int)`.
WhitespaceTokenizerFactory	Factory for `WhitespaceTokenizer`.

Package org.apache.lucene.analysis.core