ArabicLetterTokenizer (Lucene 3.6.1 API)

java.lang.Object
- org.apache.lucene.util.AttributeSource
- - org.apache.lucene.analysis.TokenStream
  - - org.apache.lucene.analysis.Tokenizer
    - - org.apache.lucene.analysis.CharTokenizer
      - org.apache.lucene.analysis.LetterTokenizer
        
        org.apache.lucene.analysis.ar.ArabicLetterTokenizer

All Implemented Interfaces:

Closeable

Deprecated.
(3.1) Use StandardTokenizer instead.
```
@Deprecated
public class ArabicLetterTokenizer
extends LetterTokenizer
```
Tokenizer that breaks text into runs of letters and diacritics.
The problem with the standard Letter tokenizer is that it fails on diacritics. Handling similar to this is necessary for Indic Scripts, Hebrew, Thaana, etc.

You must specify the required Version compatibility when creating ArabicLetterTokenizer:
- As of 3.1, CharTokenizer uses an int based API to normalize and detect token characters. See isTokenChar(int) and CharTokenizer.normalize(int) for details.

Nested Class Summary
- Nested classes/interfaces inherited from class org.apache.lucene.util.AttributeSource
  AttributeSource.AttributeFactory, AttributeSource.State

Field Summary
- Fields inherited from class org.apache.lucene.analysis.Tokenizer
  input

Constructor Summary

Constructors
Constructor and Description
`ArabicLetterTokenizer(AttributeSource.AttributeFactory factory, Reader in)` Deprecated. use `ArabicLetterTokenizer(Version, AttributeSource.AttributeFactory, Reader)` instead. This will be removed in Lucene 4.0.
`ArabicLetterTokenizer(AttributeSource source, Reader in)` Deprecated. use `ArabicLetterTokenizer(Version, AttributeSource, Reader)` instead. This will be removed in Lucene 4.0.
`ArabicLetterTokenizer(Reader in)` Deprecated. use `ArabicLetterTokenizer(Version, Reader)` instead. This will be removed in Lucene 4.0.
`ArabicLetterTokenizer(Version matchVersion, AttributeSource.AttributeFactory factory, Reader in)` Deprecated. Construct a new ArabicLetterTokenizer using a given `AttributeSource.AttributeFactory`. * @param matchVersion Lucene version to match See above
`ArabicLetterTokenizer(Version matchVersion, AttributeSource source, Reader in)` Deprecated. Construct a new ArabicLetterTokenizer using a given `AttributeSource`.
`ArabicLetterTokenizer(Version matchVersion, Reader in)` Deprecated. Construct a new ArabicLetterTokenizer.

Method Summary

Methods
Modifier and Type Method and Description

protected boolean isTokenChar(int c)
Deprecated.

Allows for Letter category or NonspacingMark category
- Methods inherited from class org.apache.lucene.analysis.CharTokenizer
  end, incrementToken, isTokenChar, normalize, normalize, reset
- Methods inherited from class org.apache.lucene.analysis.Tokenizer
  close, correctOffset
- Methods inherited from class org.apache.lucene.analysis.TokenStream
  reset
- Methods inherited from class org.apache.lucene.util.AttributeSource
  addAttribute, addAttributeImpl, captureState, clearAttributes, cloneAttributes, copyTo, equals, getAttribute, getAttributeClassesIterator, getAttributeFactory, getAttributeImplsIterator, hasAttribute, hasAttributes, hashCode, reflectAsString, reflectWith, restoreState, toString
- Methods inherited from class java.lang.Object
  clone, finalize, getClass, notify, notifyAll, wait, wait, wait

Methods
Modifier and Type	Method and Description
`protected boolean`	`isTokenChar(int c)` Deprecated. Allows for Letter category or NonspacingMark category

- Constructor Detail
  - ArabicLetterTokenizer
```
public ArabicLetterTokenizer(Version matchVersion,
                     Reader in)
```
    Deprecated.
    
    Construct a new ArabicLetterTokenizer.
    
    Parameters:
    matchVersion - Lucene version to match See above
    in - the input to split up into tokens
  - ArabicLetterTokenizer
```
public ArabicLetterTokenizer(Version matchVersion,
                     AttributeSource source,
                     Reader in)
```
    Deprecated.
    
    Construct a new ArabicLetterTokenizer using a given AttributeSource.
    
    Parameters:
    matchVersion - Lucene version to match See above
    source - the attribute source to use for this Tokenizer
    in - the input to split up into tokens
  - ArabicLetterTokenizer
```
public ArabicLetterTokenizer(Version matchVersion,
                     AttributeSource.AttributeFactory factory,
                     Reader in)
```
    Deprecated.
    
    Construct a new ArabicLetterTokenizer using a given AttributeSource.AttributeFactory. * @param matchVersion Lucene version to match See above
    
    Parameters:
    factory - the attribute factory to use for this Tokenizer
    in - the input to split up into tokens
  - ArabicLetterTokenizer
```
@Deprecated
public ArabicLetterTokenizer(Reader in)
```
    Deprecated. use ArabicLetterTokenizer(Version, Reader) instead. This will be removed in Lucene 4.0.
    
    Construct a new ArabicLetterTokenizer.
  - ArabicLetterTokenizer
```
@Deprecated
public ArabicLetterTokenizer(AttributeSource source,
                                Reader in)
```
    Deprecated. use ArabicLetterTokenizer(Version, AttributeSource, Reader) instead. This will be removed in Lucene 4.0.
    
    Construct a new ArabicLetterTokenizer using a given AttributeSource.
  - ArabicLetterTokenizer
```
@Deprecated
public ArabicLetterTokenizer(AttributeSource.AttributeFactory factory,
                                Reader in)
```
    Deprecated. use ArabicLetterTokenizer(Version, AttributeSource.AttributeFactory, Reader) instead. This will be removed in Lucene 4.0.
    
    Construct a new ArabicLetterTokenizer using a given AttributeSource.AttributeFactory.
- Method Detail
  - isTokenChar
```
protected boolean isTokenChar(int c)
```
    Deprecated.
    
    Allows for Letter category or NonspacingMark category
    
    Overrides:
    
    isTokenChar in class LetterTokenizer
    
    See Also:
    LetterTokenizer.isTokenChar(int)

Class ArabicLetterTokenizer

Nested Class Summary

Nested classes/interfaces inherited from class org.apache.lucene.util.AttributeSource

Field Summary

Fields inherited from class org.apache.lucene.analysis.Tokenizer

Constructor Summary

Method Summary

Methods inherited from class org.apache.lucene.analysis.CharTokenizer

Methods inherited from class org.apache.lucene.analysis.Tokenizer

Methods inherited from class org.apache.lucene.analysis.TokenStream

Methods inherited from class org.apache.lucene.util.AttributeSource

Methods inherited from class java.lang.Object

Constructor Detail

ArabicLetterTokenizer

ArabicLetterTokenizer

ArabicLetterTokenizer

ArabicLetterTokenizer

ArabicLetterTokenizer

ArabicLetterTokenizer

Method Detail

isTokenChar