X-Git-Url: https://git.mdrn.pl/pylucene.git/blobdiff_plain/a2e61f0c04805cfcb8706176758d1283c7e3a55c..aaeed5504b982cf3545252ab528713250aa33eed:/lucene-java-3.4.0/lucene/contrib/analyzers/common/src/java/org/apache/lucene/analysis/pt/PortugueseStemmer.java

diff --git a/lucene-java-3.4.0/lucene/contrib/analyzers/common/src/java/org/apache/lucene/analysis/pt/PortugueseStemmer.java b/lucene-java-3.4.0/lucene/contrib/analyzers/common/src/java/org/apache/lucene/analysis/pt/PortugueseStemmer.java
deleted file mode 100644
index de0e497..0000000
--- a/lucene-java-3.4.0/lucene/contrib/analyzers/common/src/java/org/apache/lucene/analysis/pt/PortugueseStemmer.java
+++ /dev/null
@@ -1,102 +0,0 @@
-package org.apache.lucene.analysis.pt;
-
-/**
- * Licensed to the Apache Software Foundation (ASF) under one or more
- * contributor license agreements.  See the NOTICE file distributed with
- * this work for additional information regarding copyright ownership.
- * The ASF licenses this file to You under the Apache License, Version 2.0
- * (the "License"); you may not use this file except in compliance with
- * the License.  You may obtain a copy of the License at
- *
- *     http://www.apache.org/licenses/LICENSE-2.0
- *
- * Unless required by applicable law or agreed to in writing, software
- * distributed under the License is distributed on an "AS IS" BASIS,
- * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
- * See the License for the specific language governing permissions and
- * limitations under the License.
- */
-
-import java.util.Map;
-
-/**
- * Portuguese stemmer implementing the RSLP (Removedor de Sufixos da Lingua Portuguesa)
- * algorithm. This is sometimes also referred to as the Orengo stemmer.
- * 
- * @see RSLPStemmerBase
- */
-public class PortugueseStemmer extends RSLPStemmerBase {
-  private static final Step plural, feminine, adverb, augmentative, noun, verb, vowel;
-  
-  static {
-    Map<String,Step> steps = parse(PortugueseStemmer.class, "portuguese.rslp");
-    plural = steps.get("Plural");
-    feminine = steps.get("Feminine");
-    adverb = steps.get("Adverb");
-    augmentative = steps.get("Augmentative");
-    noun = steps.get("Noun");
-    verb = steps.get("Verb");
-    vowel = steps.get("Vowel");
-  }
-  
-  /**
-   * @param s buffer, oversized to at least <code>len+1</code>
-   * @param len initial valid length of buffer
-   * @return new valid length, stemmed
-   */
-  public int stem(char s[], int len) {
-    assert s.length >= len + 1 : "this stemmer requires an oversized array of at least 1";
-    
-    len = plural.apply(s, len);
-    len = adverb.apply(s, len);
-    len = feminine.apply(s, len);
-    len = augmentative.apply(s, len);
-    
-    int oldlen = len;
-    len = noun.apply(s, len);
-    
-    if (len == oldlen) { /* suffix not removed */
-      oldlen = len;
-      
-      len = verb.apply(s, len);
-      
-      if (len == oldlen) { /* suffix not removed */
-        len = vowel.apply(s, len);
-      }
-    }
-    
-    // rslp accent removal
-    for (int i = 0; i < len; i++) {
-      switch(s[i]) {
-        case 'Ã ':
-        case 'Ã¡':
-        case 'Ã¢':
-        case 'Ã£':
-        case 'Ã¤':
-        case 'Ã¥': s[i] = 'a'; break;
-        case 'Ã§': s[i] = 'c'; break;
-        case 'Ã¨':
-        case 'Ã©':
-        case 'Ãª':
-        case 'Ã«': s[i] = 'e'; break;
-        case 'Ã¬':
-        case 'Ã­':
-        case 'Ã®':
-        case 'Ã¯': s[i] = 'i'; break;
-        case 'Ã±': s[i] = 'n'; break;
-        case 'Ã²':
-        case 'Ã³':
-        case 'Ã´':
-        case 'Ãµ':
-        case 'Ã¶': s[i] = 'o'; break;
-        case 'Ã¹':
-        case 'Ãº':
-        case 'Ã»':
-        case 'Ã¼': s[i] = 'u'; break;
-        case 'Ã½':
-        case 'Ã¿': s[i] = 'y'; break;
-      }
-    }
-    return len;
-  }
-}