1 # Steps file for the RSLP stemmer.
3 # Step 1: Plural Reduction
4 { "Plural", 3, 1, {"s"},
10 {"ães",1,"ão",{"mães"}},
12 {"ais",1,"al",{"cais","mais"}},
20 {"is",2,"il",{"lápis","cais","mais","crúcis","biquínis","pois","depois","dois","leis"}},
24 {"res",3,"r", {"árvores"}},
26 {"s",2,"",{"aliás","pires","lápis","cais","mais","mas","menos","férias","fezes","pêsames","crúcis","gás","atrás","moisés","através","convés","ês","país","após","ambas","ambos","messias", "depois"}}};
28 # Step 2: Adverb Reduction
31 {"mente",4,"",{"experimente"}}};
33 # Step 3: Feminine Reduction
34 { "Feminine", 3, 1, {"a","ã"},
36 {"ona",3,"ão",{"abandona","lona","iona","cortisona","monótona","maratona","acetona","detona","carona"}},
38 {"ã",2,"ão",{"amanhã","arapuã","fã","divã"}},
39 # professora -> professor
41 # americana -> americano
42 {"na",4,"no",{"carona","abandona","lona","iona","cortisona","monótona","maratona","acetona","detona","guiana","campana","grana","caravana","banana","paisana"}},
44 {"inha",3,"inho",{"rainha","linha","minha"}},
46 {"esa",3,"ês",{"mesa","obesa","princesa","turquesa","ilesa","pesa","presa"}},
48 {"osa",3,"oso",{"mucosa","prosa"}},
52 {"ica",3,"ico",{"dica"}},
54 {"ada",2,"ado",{"pitada"}},
56 {"ida",3,"ido",{"vida","dúvida"}},
57 {"ída",3,"ido",{"recaída","saída"}},
59 {"ima",3,"imo",{"vítima"}},
61 {"iva",3,"ivo",{"saliva","oliva"}},
62 # primeira -> primeiro
63 {"eira",3,"eiro",{"beira","cadeira","frigideira","bandeira","feira","capoeira","barreira","fronteira","besteira","poeira"}}};
65 # Step 4: Augmentative/Diminutive Reduction
66 { "Augmentative", 0, 1, {},
67 # cansadíssimo -> cansad
74 # chiquérrimo -> chiqu
82 # cansadinho -> cansad
85 {"inho",3,"",{"caminho","cominho"}},
91 {"aço",4,"",{"antebraço"}},
97 {"ázio",3,"",{"topázio"}},
105 {"zão",2,"",{"coalizão"}},
107 {"ão",3,"",{"camarão","chimarrão","canção","coração","embrião","grotão","glutão","ficção","fogão","feição","furacão","gamão","lampião","leão","macacão","nação","órfão","orgão","patrão","portão","quinhão","rincão","tração","falcão","espião","mamão","folião","cordão","aptidão","campeão","colchão","limão","leilão","melão","barão","milhão","bilhão","fusão","cristão","ilusão","capitão","estação","senão"}}};
109 # Step 5: Noun Suffix Reduction
111 # existencialista -> exist
113 # minimalista -> minim
116 {"agem",3,"",{"coragem","chantagem","vantagem","carruagem"}},
117 # gerenciamento -> gerenc
119 # monitoramento -> monitor
120 {"amento",3,"",{"firmamento","fundamento","departamento"}},
123 {"mento",6,"",{"firmamento","elemento","complemento","instrumento","departamento"}},
124 # comercializado -> comerci
126 # traumatizado -> traum
128 {"tizado",4,"",{"alfabetizado"}},
129 # alfabetizado -> alfabet
130 {"izado",5,"",{"organizado","pulverizado"}},
131 # associativo -> associ
132 {"ativo",4,"",{"pejorativo","relativo"}},
133 # contraceptivo -> contracep
134 {"tivo",4,"",{"relativo"}},
135 # esportivo -> esport
136 {"ivo",4,"",{"passivo","possessivo","pejorativo","positivo"}},
138 {"ado",2,"",{"grado"}},
140 {"ido",3,"",{"cândido","consolido","rápido","decido","tímido","duvido","marido"}},
143 # entendedor -> entend
146 {"idor",4,"",{"ouvidor"}},
147 {"dor",4,"",{"ouvidor"}},
148 {"sor",4,"",{"assessor"}},
150 {"tor",3,"",{"benfeitor","leitor","editor","pastor","produtor","promotor","consultor"}},
151 {"or",2,"",{"motor","melhor","redor","rigor","sensor","tambor","tumor","assessor","benfeitor","pastor","terior","favor","autor"}},
152 # comparabilidade -> compar
154 # abolicionista -> abol
156 # intervencionista -> interven
160 # profissional -> profiss
162 # referência -> refer
164 # repugnância -> repugn
165 {"ância",4,"",{"ambulância"}},
168 # fofoqueiro -> fofoc
170 {"adeiro",4,"",{"desfiladeiro"}},
171 # brasileiro -> brasil
172 {"eiro",3,"",{"desfiladeiro","pioneiro","mosteiro"}},
175 {"oso",3,"",{"precioso"}},
176 # comercializaç -> comerci
180 {"izaç",5,"",{"organizaç"}},
182 {"aç",3,"",{"equaç","relaç"}},
184 {"iç",3,"",{"eleiç"}},
185 # anedotário -> anedot
186 {"ário",3,"",{"voluntário","salário","aniversário","diário","lionário","armário"}},
188 {"rio",5,"",{"voluntário","salário","aniversário","diário","compulsório","lionário","próprio","stério","armário"}},
189 # ministério -> minist
197 # parentesco -> parent
200 {"ante",2,"",{"gigante","elefante","adiante","possante","instante","restaurante"}},
202 {"ástico",4,"",{"eclesiástico"}},
206 {"tico",3,"",{"político","eclesiástico","diagnostico","prático","doméstico","diagnóstico","idêntico","alopático","artístico","autêntico","eclético","crítico","critico"}},
208 {"ico",4,"",{"tico","público","explico"}},
209 # produtividade -> produt
211 # profundidade -> profund
212 {"idade",4,"",{"autoridade","comunidade"}},
213 # aposentadoria -> aposentad
214 {"oria",4,"",{"categoria"}},
215 # existencial -> exist
223 {"ice",4,"",{"cúmplice"}},
226 # decorrente -> decorr
227 {"ente",4,"",{"freqüente","alimente","acrescente","permanente","oriente","aparente"}},
231 # americano -> americ
234 {"ável",2,"",{"afável","razoável","potável","vulnerável"}},
235 # combustível -> combust
236 {"ível",3,"",{"possível"}},
237 {"vel",5,"",{"possível","vulnerável","solúvel"}},
239 # cobertura -> cobert
240 {"ura",4,"",{"imatura","acupuntura","costura"}},
242 # consensual -> consens
243 {"ual",3,"",{"bissexual","virtual","visual","pontual"}},
246 # experimental -> experiment
247 {"al",4,"",{"afinal","animal","estatal","bissexual","desleal","fiscal","formal","pessoal","liberal","postal","virtual","visual","pontual","sideral","sucursal"}},
250 {"ismo",3,"",{"cinismo"}}};
252 # Step 6: Verb Suffix Reduction
332 {"avam",2,"",{"agravam"}},
353 {"este",3,"",{"faroeste","agreste"}},
358 # concluíram -> conclu
364 {"irei",3,"",{"admirei"}},
366 {"irem",3,"",{"adquirem"}},
375 {"iava",4,"",{"ampliava"}},
380 {"ara",2,"",{"arara","prepara"}},
382 {"ará",2,"",{"alvará"}},
384 {"are",2,"",{"prepare"}},
386 {"ava",2,"",{"agrava"}},
390 {"era",3,"",{"acelera","espera"}},
394 {"ere",3,"",{"espere"}},
396 {"iam",3,"",{"enfiam","ampliam","elogiam","ensaiam"}},
400 {"imo",3,"",{"reprimo","intimo","íntimo","nimo","queimo","ximo"}},
402 {"ira",3,"",{"fronteira","sátira"}},
406 {"tizar",4,"",{"alfabetizar"}},
407 {"izar",5,"",{"organizar"}},
408 {"itar",5,"",{"acreditar","explicitar","estreitar"}},
410 {"ire",3,"",{"adquire"}},
418 {"ear",4,"",{"alardear","nuclear"}},
420 {"ar",2,"",{"azar","bazaar","patamar"}},
428 {"em",2,"",{"alem","virgem"}},
430 {"er",2,"",{"éter","pier"}},
432 {"eu",3,"",{"chapeu"}},
434 {"ia",3,"",{"estória","fatia","acia","praia","elogia","mania","lábia","aprecia","polícia","arredia","cheia","ásia"}},
436 {"ir",3,"",{"freir"}},
445 # Step 7: Vowel Removal
448 {"gue",2,"g",{"gangue","jegue"}},