pylucene 3.5.0-3
[pylucene.git] / lucene-java-3.5.0 / lucene / contrib / analyzers / common / src / test / org / apache / lucene / analysis / es / TestSpanishAnalyzer.java
1 package org.apache.lucene.analysis.es;
2
3 /**
4  * Licensed to the Apache Software Foundation (ASF) under one or more
5  * contributor license agreements.  See the NOTICE file distributed with
6  * this work for additional information regarding copyright ownership.
7  * The ASF licenses this file to You under the Apache License, Version 2.0
8  * (the "License"); you may not use this file except in compliance with
9  * the License.  You may obtain a copy of the License at
10  *
11  *     http://www.apache.org/licenses/LICENSE-2.0
12  *
13  * Unless required by applicable law or agreed to in writing, software
14  * distributed under the License is distributed on an "AS IS" BASIS,
15  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
16  * See the License for the specific language governing permissions and
17  * limitations under the License.
18  */
19
20 import java.io.IOException;
21 import java.util.HashSet;
22 import java.util.Set;
23
24 import org.apache.lucene.analysis.Analyzer;
25 import org.apache.lucene.analysis.BaseTokenStreamTestCase;
26
27 public class TestSpanishAnalyzer extends BaseTokenStreamTestCase {
28   /** This test fails with NPE when the 
29    * stopwords file is missing in classpath */
30   public void testResourcesAvailable() {
31     new SpanishAnalyzer(TEST_VERSION_CURRENT);
32   }
33   
34   /** test stopwords and stemming */
35   public void testBasics() throws IOException {
36     Analyzer a = new SpanishAnalyzer(TEST_VERSION_CURRENT);
37     // stemming
38     checkOneTermReuse(a, "chicana", "chican");
39     checkOneTermReuse(a, "chicano", "chican");
40     // stopword
41     assertAnalyzesTo(a, "los", new String[] {});
42   }
43   
44   /** test use of exclusion set */
45   public void testExclude() throws IOException {
46     Set<String> exclusionSet = new HashSet<String>();
47     exclusionSet.add("chicano");
48     Analyzer a = new SpanishAnalyzer(TEST_VERSION_CURRENT, 
49         SpanishAnalyzer.getDefaultStopSet(), exclusionSet);
50     checkOneTermReuse(a, "chicana", "chican");
51     checkOneTermReuse(a, "chicano", "chicano");
52   }
53   
54   /** blast some random strings through the analyzer */
55   public void testRandomStrings() throws Exception {
56     checkRandomData(random, new SpanishAnalyzer(TEST_VERSION_CURRENT), 10000*RANDOM_MULTIPLIER);
57   }
58 }