add --shared
[pylucene.git] / lucene-java-3.4.0 / lucene / contrib / analyzers / common / src / resources / org / apache / lucene / analysis / pt / portuguese.rslp
1 #  Steps file for the RSLP stemmer.
2
3 # Step 1: Plural Reduction
4 {  "Plural", 3, 1, {"s"},
5   # bons -> bom 
6   {"ns",1,"m"},
7   # balões -> balão
8   {"ões",3,"ão"},
9   # capitães -> capitão
10   {"ães",1,"ão",{"mães"}},
11   # normais -> normal
12   {"ais",1,"al",{"cais","mais"}},
13   # papéis -> papel
14   {"éis",2,"el"},
15   # amáveis -> amável
16   {"eis",2,"el"},
17   # lençóis -> lençol
18   {"óis",2,"ol"},
19   # barris -> barril
20   {"is",2,"il",{"lápis","cais","mais","crúcis","biquínis","pois","depois","dois","leis"}},
21   # males -> mal
22   {"les",3,"l"},
23   # mares -> mar
24   {"res",3,"r", {"árvores"}},
25   # casas -> casa
26   {"s",2,"",{"aliás","pires","lápis","cais","mais","mas","menos","férias","fezes","pêsames","crúcis","gás","atrás","moisés","através","convés","ês","país","após","ambas","ambos","messias", "depois"}}};
27
28 # Step 2: Adverb Reduction
29 {  "Adverb", 0, 0, {},
30   # felizmente -> feliz
31   {"mente",4,"",{"experimente"}}};
32   
33 # Step 3: Feminine Reduction
34 {  "Feminine", 3, 1, {"a","ã"},
35   # chefona -> chefão
36   {"ona",3,"ão",{"abandona","lona","iona","cortisona","monótona","maratona","acetona","detona","carona"}},
37   # vilã -> vilão
38   {"ã",2,"ão",{"amanhã","arapuã","fã","divã"}},
39   # professora -> professor
40   {"ora",3,"or"},
41   # americana -> americano
42   {"na",4,"no",{"carona","abandona","lona","iona","cortisona","monótona","maratona","acetona","detona","guiana","campana","grana","caravana","banana","paisana"}},
43   # sozinha -> sozinho
44   {"inha",3,"inho",{"rainha","linha","minha"}},
45   # inglesa -> inglês
46   {"esa",3,"ês",{"mesa","obesa","princesa","turquesa","ilesa","pesa","presa"}},
47   # famosa -> famoso
48   {"osa",3,"oso",{"mucosa","prosa"}},
49   # maníaca -> maníaco
50   {"íaca",3,"íaco"},
51   # prática -> prático
52   {"ica",3,"ico",{"dica"}},
53   # cansada -> cansado
54   {"ada",2,"ado",{"pitada"}},
55   # mantida -> mantido
56   {"ida",3,"ido",{"vida","dúvida"}},
57   {"ída",3,"ido",{"recaída","saída"}},
58   # prima -> primo
59   {"ima",3,"imo",{"vítima"}},
60   # passiva -> passivo
61   {"iva",3,"ivo",{"saliva","oliva"}},
62   # primeira -> primeiro
63   {"eira",3,"eiro",{"beira","cadeira","frigideira","bandeira","feira","capoeira","barreira","fronteira","besteira","poeira"}}};
64
65 # Step 4: Augmentative/Diminutive Reduction
66 {  "Augmentative", 0, 1, {},
67   # cansadíssimo -> cansad
68   {"díssimo",5},
69   # amabilíssimo -> ama
70   {"abilíssimo",5},
71   # fortíssimo -> fort
72   {"íssimo",3},
73   {"ésimo",3},
74   # chiquérrimo -> chiqu
75   {"érrimo",4},
76   # pezinho -> pe
77   {"zinho",2},
78   # maluquinho -> maluc
79   {"quinho",4,"c"},
80   # amiguinho -> amig
81   {"uinho",4},
82   # cansadinho -> cansad
83   {"adinho",3},
84   # carrinho -> carr
85   {"inho",3,"",{"caminho","cominho"}},
86   # grandalhão -> grand
87   {"alhão",4},
88   # dentuça -> dent
89   {"uça",4},
90   # ricaço -> ric
91   {"aço",4,"",{"antebraço"}},
92   {"aça",4},
93   # casadão -> cans
94   {"adão",4}, 
95   {"idão",4},
96   # corpázio -> corp
97   {"ázio",3,"",{"topázio"}},
98   # pratarraz -> prat
99   {"arraz",4},
100   {"zarrão",3},
101   {"arrão",4},
102   # bocarra -> boc
103   {"arra",3},
104   # calorzão -> calor
105   {"zão",2,"",{"coalizão"}},
106   # meninão -> menin
107   {"ão",3,"",{"camarão","chimarrão","canção","coração","embrião","grotão","glutão","ficção","fogão","feição","furacão","gamão","lampião","leão","macacão","nação","órfão","orgão","patrão","portão","quinhão","rincão","tração","falcão","espião","mamão","folião","cordão","aptidão","campeão","colchão","limão","leilão","melão","barão","milhão","bilhão","fusão","cristão","ilusão","capitão","estação","senão"}}};
108
109 # Step 5: Noun Suffix Reduction
110 {  "Noun", 0, 0, {},
111   # existencialista -> exist
112   {"encialista",4},
113   # minimalista -> minim
114   {"alista",5},
115   # contagem -> cont
116   {"agem",3,"",{"coragem","chantagem","vantagem","carruagem"}},
117   # gerenciamento -> gerenc
118   {"iamento",4},
119   # monitoramento -> monitor
120   {"amento",3,"",{"firmamento","fundamento","departamento"}},
121   # nascimento -> nasc
122   {"imento",3},
123   {"mento",6,"",{"firmamento","elemento","complemento","instrumento","departamento"}},
124   # comercializado -> comerci
125   {"alizado",4},
126   # traumatizado -> traum
127   {"atizado",4},
128   {"tizado",4,"",{"alfabetizado"}},
129   # alfabetizado -> alfabet
130   {"izado",5,"",{"organizado","pulverizado"}},
131   # associativo -> associ
132   {"ativo",4,"",{"pejorativo","relativo"}},
133   # contraceptivo -> contracep
134   {"tivo",4,"",{"relativo"}},
135   # esportivo -> esport
136   {"ivo",4,"",{"passivo","possessivo","pejorativo","positivo"}},
137   # abalado -> abal
138   {"ado",2,"",{"grado"}},
139   # impedido -> imped
140   {"ido",3,"",{"cândido","consolido","rápido","decido","tímido","duvido","marido"}},
141   # ralador -> ral
142   {"ador",3},
143   # entendedor -> entend
144   {"edor",3},
145   # cumpridor -> cumpr
146   {"idor",4,"",{"ouvidor"}},
147   {"dor",4,"",{"ouvidor"}},
148   {"sor",4,"",{"assessor"}},
149   {"atoria",5},
150   {"tor",3,"",{"benfeitor","leitor","editor","pastor","produtor","promotor","consultor"}},
151   {"or",2,"",{"motor","melhor","redor","rigor","sensor","tambor","tumor","assessor","benfeitor","pastor","terior","favor","autor"}},
152   # comparabilidade -> compar
153   {"abilidade",5},
154   # abolicionista -> abol
155   {"icionista",4},
156   # intervencionista -> interven
157   {"cionista",5},
158   {"ionista",5},
159   {"ionar",5},
160   # profissional -> profiss
161   {"ional",4},
162   # referência -> refer
163   {"ência",3},
164   # repugnância -> repugn
165   {"ância",4,"",{"ambulância"}},
166   # abatedouro -> abat
167   {"edouro",3},
168   # fofoqueiro -> fofoc
169   {"queiro",3,"c"},
170   {"adeiro",4,"",{"desfiladeiro"}},
171   # brasileiro -> brasil
172   {"eiro",3,"",{"desfiladeiro","pioneiro","mosteiro"}},
173   {"uoso",3},
174   # gostoso -> gost
175   {"oso",3,"",{"precioso"}},
176   # comercializaç -> comerci
177   {"alizaç",5},
178   {"atizaç",5},
179   {"tizaç",5},
180   {"izaç",5,"",{"organizaç"}},
181   # alegaç -> aleg
182   {"aç",3,"",{"equaç","relaç"}},
183   # aboliç -> abol
184   {"iç",3,"",{"eleiç"}},
185   # anedotário -> anedot
186   {"ário",3,"",{"voluntário","salário","aniversário","diário","lionário","armário"}},
187   {"atório",3},
188   {"rio",5,"",{"voluntário","salário","aniversário","diário","compulsório","lionário","próprio","stério","armário"}},
189   # ministério -> minist
190   {"ério",6},
191   # chinês -> chin
192   {"ês",4},
193   # beleza -> bel
194   {"eza",3},
195   # rigidez -> rigid
196   {"ez",4},
197   # parentesco -> parent
198   {"esco",4},
199   # ocupante -> ocup
200   {"ante",2,"",{"gigante","elefante","adiante","possante","instante","restaurante"}},
201   # bombástico -> bomb
202   {"ástico",4,"",{"eclesiástico"}},
203   {"alístico",3},
204   {"áutico",4},
205   {"êutico",4},
206   {"tico",3,"",{"político","eclesiástico","diagnostico","prático","doméstico","diagnóstico","idêntico","alopático","artístico","autêntico","eclético","crítico","critico"}},
207   # polêmico -> polêm
208   {"ico",4,"",{"tico","público","explico"}},
209   # produtividade -> produt
210   {"ividade",5},
211   # profundidade -> profund
212   {"idade",4,"",{"autoridade","comunidade"}},
213   # aposentadoria -> aposentad
214   {"oria",4,"",{"categoria"}},
215   # existencial -> exist
216   {"encial",5},
217   # artista -> art
218   {"ista",4},
219   {"auta",5},
220   # maluquice -> maluc
221   {"quice",4,"c"},
222   # chatice -> chat
223   {"ice",4,"",{"cúmplice"}},
224   # demoníaco -> demon
225   {"íaco",3},
226   # decorrente -> decorr
227   {"ente",4,"",{"freqüente","alimente","acrescente","permanente","oriente","aparente"}},
228   {"ense",5},
229   # criminal -> crim
230   {"inal",3},
231   # americano -> americ
232   {"ano",4},
233   # amável -> am
234   {"ável",2,"",{"afável","razoável","potável","vulnerável"}},
235   # combustível -> combust
236   {"ível",3,"",{"possível"}},
237   {"vel",5,"",{"possível","vulnerável","solúvel"}},
238   {"bil",3,"vel"},
239   # cobertura -> cobert
240   {"ura",4,"",{"imatura","acupuntura","costura"}},
241   {"ural",4},
242   # consensual -> consens
243   {"ual",3,"",{"bissexual","virtual","visual","pontual"}},
244   # mundial -> mund
245   {"ial",3},
246   # experimental -> experiment
247   {"al",4,"",{"afinal","animal","estatal","bissexual","desleal","fiscal","formal","pessoal","liberal","postal","virtual","visual","pontual","sideral","sucursal"}},
248   {"alismo",4},
249   {"ivismo",4},
250   {"ismo",3,"",{"cinismo"}}};
251
252 # Step 6: Verb Suffix Reduction
253 {  "Verb", 0, 0, {}, 
254   # cantaríamo -> cant
255   {"aríamo",2},
256   # cantássemo -> cant
257   {"ássemo",2},
258   # beberíamo -> beb
259   {"eríamo",2},
260   # bebêssemo -> beb
261   {"êssemo",2},
262   # partiríamo -> part
263   {"iríamo",3},
264   # partíssemo -> part
265   {"íssemo",3},
266   # cantáramo -> cant
267   {"áramo",2},
268   # cantárei -> cant
269   {"árei",2},
270   # cantaremo -> cant
271   {"aremo",2},
272   # cantariam -> cant
273   {"ariam",2},
274   # cantaríei -> cant
275   {"aríei",2},
276   # cantássei -> cant
277   {"ássei",2},
278   # cantassem -> cant
279   {"assem",2},
280   # cantávamo -> cant
281   {"ávamo",2},
282   # bebêramo -> beb
283   {"êramo",3},
284   # beberemo -> beb
285   {"eremo",3},
286   # beberiam -> beb
287   {"eriam",3},
288   # beberíei -> beb
289   {"eríei",3},
290   # bebêssei -> beb
291   {"êssei",3},
292   # bebessem -> beb
293   {"essem",3},
294   # partiríamo -> part
295   {"íramo",3},
296   # partiremo -> part
297   {"iremo",3},
298   # partiriam -> part
299   {"iriam",3},
300   # partiríei -> part
301   {"iríei",3},
302   # partíssei -> part
303   {"íssei",3},
304   # partissem -> part
305   {"issem",3},
306   # cantando -> cant
307   {"ando",2},
308   # bebendo -> beb
309   {"endo",3},
310   # partindo -> part
311   {"indo",3},
312   # propondo -> prop
313   {"ondo",3},
314   # cantaram -> cant
315   {"aram",2},
316   {"arão",2},
317   # cantarde -> cant
318   {"arde",2},
319   # cantarei -> cant
320   {"arei",2},
321   # cantarem -> cant
322   {"arem",2},
323   # cantaria -> cant
324   {"aria",2},
325   # cantarmo -> cant
326   {"armo",2},
327   # cantasse -> cant
328   {"asse",2},
329   # cantaste -> cant
330   {"aste",2},
331   # cantavam -> cant
332   {"avam",2,"",{"agravam"}},
333   # cantávei -> cant
334   {"ávei",2},
335   # beberam -> beb
336   {"eram",3},
337   {"erão",3},
338   # beberde -> beb
339   {"erde",3},
340   # beberei -> beb
341   {"erei",3},
342   # bebêrei -> beb
343   {"êrei",3},
344   # beberem -> beb
345   {"erem",3},
346   # beberia -> beb
347   {"eria",3},
348   # bebermo -> beb
349   {"ermo",3},
350   # bebesse -> beb
351   {"esse",3},
352   # bebeste -> beb
353   {"este",3,"",{"faroeste","agreste"}},
354   # bebíamo -> beb
355   {"íamo",3},
356   # partiram -> part
357   {"iram",3},
358   # concluíram -> conclu
359   {"íram",3},
360   {"irão",2},
361   # partirde -> part
362   {"irde",2},
363   # partírei -> part
364   {"irei",3,"",{"admirei"}},
365   # partirem -> part
366   {"irem",3,"",{"adquirem"}},
367   # partiria -> part
368   {"iria",3},
369   # partirmo -> part
370   {"irmo",3},
371   # partisse -> part
372   {"isse",3},
373   # partiste -> part
374   {"iste",4},
375   {"iava",4,"",{"ampliava"}},
376   # cantamo -> cant
377   {"amo",2},
378   {"iona",3},
379   # cantara -> cant
380   {"ara",2,"",{"arara","prepara"}},
381   # cantará -> cant
382   {"ará",2,"",{"alvará"}},
383   # cantare -> cant
384   {"are",2,"",{"prepare"}},
385   # cantava -> cant
386   {"ava",2,"",{"agrava"}},
387   # cantemo -> cant
388   {"emo",2},
389   # bebera -> beb
390   {"era",3,"",{"acelera","espera"}},
391   # beberá -> beb
392   {"erá",3},
393   # bebere -> beb
394   {"ere",3,"",{"espere"}},
395   # bebiam -> beb
396   {"iam",3,"",{"enfiam","ampliam","elogiam","ensaiam"}},
397   # bebíei -> beb
398   {"íei",3},
399   # partimo -> part
400   {"imo",3,"",{"reprimo","intimo","íntimo","nimo","queimo","ximo"}},
401   # partira -> part
402   {"ira",3,"",{"fronteira","sátira"}},
403   {"ído",3},
404   # partirá -> part
405   {"irá",3},
406   {"tizar",4,"",{"alfabetizar"}},
407   {"izar",5,"",{"organizar"}},
408   {"itar",5,"",{"acreditar","explicitar","estreitar"}},
409   # partire -> part
410   {"ire",3,"",{"adquire"}},
411   # compomo -> comp
412   {"omo",3},
413   # cantai -> cant
414   {"ai",2},
415   # cantam -> cant
416   {"am",2},
417   # barbear -> barb
418   {"ear",4,"",{"alardear","nuclear"}},
419   # cantar -> cant
420   {"ar",2,"",{"azar","bazaar","patamar"}},
421   # cheguei -> cheg
422   {"uei",3},
423   {"uía",5,"u"},
424   # cantei -> cant
425   {"ei",3},
426   {"guem",3,"g"},
427   # cantem -> cant
428   {"em",2,"",{"alem","virgem"}},
429   # beber -> beb
430   {"er",2,"",{"éter","pier"}},
431   # bebeu -> beb
432   {"eu",3,"",{"chapeu"}},
433   # bebia -> beb
434   {"ia",3,"",{"estória","fatia","acia","praia","elogia","mania","lábia","aprecia","polícia","arredia","cheia","ásia"}},
435   # partir -> part
436   {"ir",3,"",{"freir"}},
437   # partiu -> part
438   {"iu",3},
439   {"eou",5},
440   # chegou -> cheg
441   {"ou",3},
442   # bebi -> beb
443   {"i",3}};
444
445 # Step 7: Vowel Removal 
446 {  "Vowel", 0, 0, {}, 
447   {"bil",2,"vel"},
448   {"gue",2,"g",{"gangue","jegue"}},
449   {"á",3}, 
450   {"ê",3,"",{"bebê"}},
451   # menina -> menin
452   {"a",3,"",{"ásia"}},
453   # grande -> grand
454   {"e",3},
455   # menino -> menin
456   {"o",3,"",{"ão"}}};