1 # Steps file for the RSLP stemmer.
3 # Step 1: Plural Reduction
4 { "Plural", 3, 1, {"s"},
6 {"ns",1,"n",{"luns","furatapóns","furatapons"}},
12 {"ães",1,"ão",{"mães","magalhães"}},
14 {"ais",2,"al",{"cais","tais","mais","pais","ademais"}},
15 {"áis",2,"al",{"cáis","táis", "máis", "páis", "ademáis"}},
20 # espanhóis -> espanhol
21 {"óis",2,"ol",{"escornabóis"}},
23 {"ois",2,"ol",{"escornabois"}},
25 {"ís",2,"il",{"país"}},
27 {"is",2,"il",{"menfis","pais","kinguis"}},
29 {"les",2,"l",{"ingles","marselles","montreales","senegales","manizales","móstoles","nápoles"}},
31 {"res",3,"r",{"petres","henares","cáceres","baleares","linares","londres","mieres","miraflores","mércores","venres", "pires"}},
39 {"ás",1,"al",{"más"}},
43 {"s",2,"",{"barbadés","barcelonés","cantonés","gabonés","llanés","medinés","escocés","escocês","francês","barcelonês","cantonês","macramés","reves","barcelones","cantones","gabones","llanes","magallanes","medines","escoces","frances","xoves","martes","aliás","pires","lápis","cais","mais","mas","menos","férias","pêsames","crúcis","país","cangas","atenas","asturias","canarias","filipinas","honduras","molucas","caldas","mascareñas","micenas","covarrubias","psoas","óculos","nupcias","xoves","martes","llanes"}}};
45 { "Unification", 0, 0, {},
46 # cansadísimo -> cansadísimo
48 # cansadísima -> cansadísima
52 # mulheraça -> mulheraza
56 # manilhar -> manillar
72 # hospitalário -> hospitalario
74 # bibliotecária -> bibliotecaria
76 # agradable -> agradábel
78 # agradávele -> agradábel
80 # imposible -> imposíbel
82 # imposível -> imposíbel
84 # imposiçom -> imposición
90 # impressão -> impressón
96 # garrafom -> garrafón
101 { "Adverb", 0, 0, {},
102 # felizmente -> feliz
103 {"mente",4,"",{"experimente","vehemente","sedimente"}}};
105 { "Augmentative", 0, 1, {},
106 # cansadísimo -> cansad
108 # cansadísima -> cansad
126 # charlatana -> charlat
127 {"ana",2,"",{"argana","banana","choupana","espadana","faciana","iguana","lantana","macana","membrana","mesana","nirvana","obsidiana","palangana","pavana","persiana","pestana","porcelana","pseudomembrana","roldana","sábana","salangana","saragana","ventana"}},
128 # charlatán -> charlat
129 {"án",3,"",{"ademán","bardán","barregán","corricán","curricán","faisán","furacán","fustán","gabán","gabián","galán","gañán","lavacán","mazán","mourán","rabadán","serán","serrán","tabán","titán","tobogán","verán","volcán","volován"}},
131 {"azo",4,"",{"abrazo","espazo","andazo","bagazo","balazo","bandazo","cachazo","carazo","denazo","engazo","famazo","lampreazo","pantocazo","pedazo","preñazo","regazo","ribazo","sobrazo","terrazo","trompazo"}},
132 # mulleraza -> muller
133 {"aza",3,"",{"alcarraza","ameaza","baraza","broucaza","burgaza","cabaza","cachaza","calaza","carpaza","carraza","coiraza","colmaza","fogaza","famaza","labaza","liñaza","melaza","mordaza","paraza","pinaza","rabaza","rapaza","trancaza"}},
135 {"allo",4,"",{"traballo"}},
139 {"arra",3,"",{"cigarra","cinzarra"}},
140 # medicastro -> medic
141 {"astro",3,"",{"balastro","bimbastro","canastro","retropilastro"}},
143 {"astra",3,"",{"banastra","canastra","contrapilastra","piastra","pilastra"}},
145 {"ázio",3,"",{"topázio"}},
147 {"elo",4,"",{"bacelo","barrelo","bicarelo","biquelo","boquelo","botelo","bouquelo","cacarelo","cachelo","cadrelo","campelo","candelo","cantelo","carabelo","carambelo","caramelo","cercelo","cerebelo","chocarelo","coitelo","conchelo","corbelo","cotobelo","couselo","destelo","desvelo","esfácelo","fandelo","fardelo","farelo","farnelo","flabelo","ganchelo","garfelo","involucelo","mantelo","montelo","outerelo","padicelo","pesadelo","pinguelo","piquelo","rampelo","rastrelo","restelo","tornecelo","trabelo","restrelo","portelo","ourelo","zarapelo"}},
149 {"eta",3,"",{"arqueta","atleta","avoceta","baioneta","baldeta","banqueta","barraganeta","barreta","borleta","buceta","caceta","calceta","caldeta","cambeta","canaleta","caneta","carreta","cerceta","chaparreta","chapeta","chareta","chincheta","colcheta","cometa","corbeta","corveta","cuneta","desteta","espeta","espoleta","estafeta","esteta","faceta","falanxeta","frasqueta","gaceta","gabeta","galleta","garabeta","gaveta","glorieta","lagareta","lambeta","lanceta","libreta","maceta","macheta","maleta","malleta","mareta","marreta","meseta","mofeta","muleta","peseta","planeta","raqueta","regreta","saqueta","veleta","vendeta","viñeta"}},
151 {"ete",3,"",{"alfinete","ariete","bacinete","banquete","barallete","barrete","billete","binguelete","birrete","bonete","bosquete","bufete","burlete","cabalete","cacahuete","cavinete","capacete","carrete","casarete","casete","chupete","clarinete","colchete","colete","capete","curupete","disquete","estilete","falsete","ferrete","filete","gallardete","gobelete","inglete","machete","miquelete","molete","mosquete","piquete","ribete","rodete","rolete","roquete","sorvete","vedete","vendete"}},
153 {"ica",3,"",{"andarica","botánica","botica","dialéctica","dinámica","física","formica","gráfica","marica","túnica"}},
155 {"ico",3,"",{"conico","acetifico","acidifico"}},
157 {"exo",3,"",{"arpexo","arquexo","asexo","axexo","azulexo","badexo","bafexo","bocexo","bosquexo","boubexo","cacarexo","carrexo","cascarexo","castrexo","convexo","cotexo","desexo","despexo","forcexo","gabexo","gargarexo","gorgolexo","inconexo","manexo","merexo","narnexo","padexo","patexo","sopexo","varexo"}},
158 {"exa",3,"",{"airexa","bandexa","carrexa","envexa","igrexa","larexa","patexa","presexa","sobexa"}},
161 # pequeniño -> pequeno
162 {"iño",3,"o",{"camiño","cariño","comiño","golfiño","padriño","sobriño","viciño","veciño"}},
163 # pequeniña -> pequena
164 {"iña",3,"a",{"camariña","campiña","entreliña","espiña","fariña","moriña","valiña"}},
169 # anomaloide -> animal
170 {"oide",3,"",{"anaroide","aneroide","asteroide","axoide","cardioide","celuloide","coronoide","discoide","espermatozoide","espiroide","esquizoide","esteroide","glenoide","linfoide","hemorroide","melaloide","sacaroide","tetraploide","varioloide"}},
172 {"ola",3,"",{"aixola","ampola","argola","arola","arteríola","bandola","bítola","bractéola","cachola","carambola","carapola","carola","carrandiola","catrapola","cebola","centola","champola","chatola","cirola","cítola","consola","corola","empola","escarola","esmola","estola","fitola","florícola","garañola","gárgola","garxola","glicocola","góndola","mariola","marola","michola","pirola","rebola","rupícola","saxícola","sémola","tachola","tómbola"}},
174 {"olo",3,"",{"arrolo","babiolo","cacharolo","caixarolo","carolo","carramolo","cascarolo","cirolo","codrolo","correolo","cotrolo","desconsolo","rebolo","repolo","subsolo","tixolo","tómbolo","torolo","trémolo","vacúolo","xermolo","zócolo"}},
176 {"ote",3,"",{"aigote","alcaiote","barbarote","balote","billote","cachote","camarote","capote","cebote","chichote","citote","cocorote","escote","gañote","garrote","gavote","lamote","lapote","larapote","lingote","lítote","magote","marrote","matalote","pandote","paparote","rebote","tagarote","zarrote"}},
178 {"ota",3,"",{"asíntota","caiota","cambota","chacota","compota","creosota","curota","derrota","díspota","gamota","maniota","pelota","picota","pillota","pixota","queirota","remota"}},
180 {"cho",3,"",{"abrocho","arrocho","carocho","falucho","bombacho","borracho","mostacho"}},
182 {"cha",3,"",{"borracha","carracha","estacha","garnacha","limacha","remolacha","abrocha"}},
184 {"uco",4,"",{"caduco","estuco","fachuco","malluco","saluco","trabuco"}},
185 # borrachuzo -> borrach
186 {"uzo",3,"",{"carriñouzo","fachuzo","mañuzo","mestruzo","tapuzo"}},
188 {"uza",3,"",{"barruza","chamuza","chapuza","charamuza","conduza","deduza","desluza","entreluza","induza","reluza","seduza","traduza","trasluza"}},
190 {"uxa",3,"",{"caramuxa","carrabouxa","cartuxa","coruxa","curuxa","gaturuxa","maruxa","meruxa","miruxa","moruxa","muruxa","papuxa","rabuxa","trouxa"}},
191 {"uxo",3,"",{"caramuxo","carouxo","carrabouxo","curuxo","debuxo","ganduxo","influxo","negouxo","pertuxo","refluxo"}},
193 {"ello",3,"",{"alborello","artello","botello","cachafello","calello","casarello","cazabello","cercello","cocerello","concello","consello","desparello","escaravello","espello","fedello","fervello","gagafello","gorrobello","nortello","pendello","troupello","trebello"}},
195 {"ella",3,"",{"alborella","bertorella","bocatella","botella","calella","cercella","gadella","grosella","lentella","movella","nocella","noitevella","parella","pelella","percebella","segorella","sabella"}}};
199 {"dade",3,"",{"acridade","calidade"}},
203 {"eiro",3,"",{"agoireiro","bardalleiro","braseiro","barreiro","canteiro","capoeiro","carneiro","carteiro","cinceiro","faroleiro","mareiro","preguiceiro","quinteiro","raposeiro","retranqueiro","regueiro","sineiro","troleiro","ventureiro"}},
204 # marisqueira -> marisqu
205 {"eira",3,"",{"cabeleira","canteira","cocheira","folleira","milleira"}},
206 # hospitalario -> hospital
207 {"ario",3,"",{"armario","calcario","lionario","salario"}},
208 # bibliotecaria -> bibliotec
209 {"aria",3,"",{"cetaria","coronaria","fumaria","linaria","lunaria","parietaria","saponaria","serpentaria"}},
210 # humorístico -> humor
211 {"ístico",3,"",{"balístico", "ensaístico"}},
213 {"ista",3,"",{"batista","ciclista","fadista","operista","tenista","verista"}},
215 {"ado",2,"",{"grado","agrado"}},
217 {"ato",2,"",{"agnato"}},
219 {"ido",3,"",{"cándido","cândido","consolido","decidido","duvido","marido","rápido"}},
221 {"ida",3,"",{"bastida","dúbida","dubida","duvida","ermida","éxida","guarida","lapicida","medida","morida"}},
226 {"udo",3,"",{"estudo","escudo"}},
229 {"ada",3,"",{"abada","alhada","allada","pitada"}},
231 {"dela",3,"",{"cambadela","cavadela","forcadela","erisipidela","mortadela","espadela","fondedela","picadela","arandela","candela","cordela","escudela","pardela"}},
233 {"ela",3,"",{"canela","capela","cotela","cubela","curupela","escarapela","esparrela","estela","fardela","flanela","fornela","franela","gabela","gamela","gavela","glumela","granicela","lamela","lapela","malvela","manela","manganela","mexarela","micela","mistela","novela","ourela","panela","parcela","pasarela","patamela","patela","paxarela","pipela","pitela","postela","pubela","restela","sabela","salmonela","secuela","sentinela","soldanela","subela","temoncela","tesela","tixela","tramela","trapela","varela","vitela","xanela","xestela"}},
235 {"ábel",2,"",{"afábel","fiábel"}},
236 # combustíbel -> combust
237 {"íbel",2,"",{"críbel","imposíbel","posíbel","fisíbel","falíbel"}},
238 # fabricante -> frabrica
239 {"nte",3,"",{"alimente","adiante","acrescente","elefante","frequente","freqüente","gigante","instante","oriente","permanente","posante","possante","restaurante"}},
240 # ignorancia -> ignora
242 # temperanza -> tempera
244 {"acia",3,"",{"acracia","audacia","falacia","farmacia"}},
245 # inmundicia -> inmund
246 {"icia",3,"",{"caricia","delicia","ledicia","malicia","milicia","noticia","pericia","presbicia","primicia","regalicia","sevicia","tiricia"}},
248 {"iza",3,"",{"alvariza","baliza","cachiza","caniza","cañiza","carbaliza","carriza","chamariza","chapiza","fraguiza","latiza","longaniza","mañiza","nabiza","peliza","preguiza","rabiza"}},
250 {"exar",3,"",{"palmexar"}},
251 # administración -> administr
252 {"ación",2,"",{"aeración"}},
253 # expedición -> exped
254 {"ición",3,"",{"condición","gornición","monición","nutrición","petición","posición","sedición","volición"}},
255 # excepción -> except
257 # comprensión -> comprens
258 {"sión",3,"s",{"abrasión", "alusión"}},
260 {"azón",2,"",{"armazón"}},
262 {"ón",3,"",{"abalón","acordeón","alción","aldrabón","alerón","aliñón","ambón","bombón","calzón","campón","canalón","cantón","capitón","cañón","centón","ciclón","collón","colofón","copón","cotón","cupón","petón","tirón","tourón","turón","unción","versión","zubón","zurrón"}},
264 {"ona",3,"",{"abandona","acetona","aleurona","amazona","anémona","bombona","cambona","carona","chacona","charamona","cincona","condona","cortisona","cretona","cretona","detona","estona","fitohormona","fregona","gerona","hidroquinona","hormona","lesiona","madona","maratona","matrona","metadona","monótona","neurona","pamplona","peptona","poltrona","proxesterona","quinona","quinona","silicona","sulfona"}},
266 {"oa",3,"",{"abandoa","madroa","barbacoa","estoa","airoa","eiroa","amalloa","ámboa","améndoa","anchoa","antinéboa","avéntoa","avoa","bágoa","balboa","bisavoa","boroa","canoa","caroa","comadroa","coroa","éngoa","espácoa","filloa","fírgoa","grañoa","lagoa","lanzoa","magoa","mámoa","morzoa","noiteboa","noraboa","parañoa","persoa","queiroa","rañoa","táboa","tataravoa","teiroa"}},
267 # demoníaco -> demoní
269 # demoníaca -> demoní
270 {"aca",3,"",{"alpaca","barraca","bullaca","buraca","carraca","casaca","cavaca","cloaca","entresaca","ervellaca","espinaca","estaca","farraca","millaca","pastinaca","pataca","resaca","urraca","purraca"}},
271 # carballal -> carball
272 {"al",4,"",{"afinal","animal","estatal","bisexual","bissexual","desleal","fiscal","formal","pessoal","persoal","liberal","postal","virtual","visual","pontual","puntual","homosexual","heterosexual"}},
274 {"dor",2,"",{"abaixador"}},
275 # benfeitor -> benfei
276 {"tor",3,"",{"autor","motor","pastor","pintor"}},
278 {"or",2,"",{"asesor","assessor","favor","mellor","melhor","redor","rigor","sensor","tambor","tumor"}},
279 # profesora -> profes
280 {"ora",3,"",{"albacora","anáfora","áncora","apisoadora","ardora","ascospora","aurora","avéspora","bitácora","canéfora","cantimplora","catáfora","cepilladora","demora","descalcificadora","diáspora","empacadora","epífora","ecavadora","escora","eslora","espora","fotocompoñedora","fotocopiadora","grampadora","isícora","lavadora","lixadora","macrospora","madrépora","madrágora","masora","mellora","metáfora","microspora","milépora","milpéndora","nécora","oospora","padeadora","pasiflora","pécora","píldora","pólvora","ratinadora","rémora","retroescavadora","sófora","torradora","trémbora","uredospora","víbora","víncora","zoospora"}},
282 {"aría",3,"",{"libraría"}},
283 # etiquetaxe -> etiquet
284 {"axe",3,"",{"aluaxe","amaraxe","amperaxe","bagaxe","balaxe","barcaxe","borraxe","bescaxe","cabotaxe","carraxe","cartilaxe","chantaxe","colaxe","coraxe","carruaxe","dragaxe","embalaxe","ensilaxe","epistaxe","fagundaxe","fichaxe","fogaxe","forraxe","fretaxe","friaxe","garaxe","homenaxe","leitaxe","liñaxe","listaxe","maraxe","marcaxe","maridaxe","masaxe","miraxe","montaxe","pasaxe","peaxe","portaxe","ramaxe","rebelaxe","rodaxe","romaxe","sintaxe","sondaxe","tiraxe","vantaxe","vendaxe","viraxe"}},
288 {"eza",3,"",{"alteza","beleza","fereza","fineza","vasteza","vileza"}},
290 {"ez",3,"",{"acidez","adultez","adustez","avidez","candidez","mudez","nenez","nudez","pomez"}},
291 # mullerengo -> muller
294 {"ego",3,"",{"corego","derrego","entrego","lamego","sarego","sartego"}},
296 {"oso",3,"",{"afanoso","algoso","caldoso","caloso","cocoso","ditoso","favoso","fogoso","lamoso","mecoso","mocoso","precioso","rixoso","venoso","viroso","xesoso"}},
298 {"osa",3,"",{"mucosa","glicosa","baldosa","celulosa","isoglosa","nitrocelulosa","levulosa","ortosa","pectosa","preciosa","sacarosa","serosa","ventosa"}},
300 {"ume",3,"",{"agrume","albume","alcume","batume","cacume","cerrume","chorume","churume","costume","curtume","estrume","gafume","legume","perfume","queixume","zarrume"}},
302 {"ura",3,"",{"albura","armadura","imatura","costura"}},
306 {"il",3,"",{"abril","alfil","anil","atril","badil","baril","barril","brasil","cadril","candil","cantil","carril","chamil","chancil","civil","cubil","dátil","difícil","dócil","edil","estéril","fácil","fráxil","funil","fusil","grácil","gradil","hábil","hostil","marfil"}},
307 # principesco -> princip
311 # esportivo -> esport
312 {"ivo",3,"",{"pasivo","positivo","passivo","possessivo","posesivo","pexotarivo","relativo"}}};
335 {"ar",2,"",{"azar","bazar","patamar"}},
336 # lembrarade -> lembra
342 # convidárade -> convid
344 # convidaría -> convid
449 {"este",1,"",{"faroeste","agreste"}},
453 {"ian",2,"",{"enfian","eloxian","ensaian"}},
457 {"irei",3,"",{"admirei"}},
468 {"iava",1,"",{"ampliava"}},
474 {"ara",2,"",{"arara","prepara"}},
476 {"ará",2,"",{"alvará","bacará"}},
478 {"are",2,"",{"prepare"}},
480 {"ava",2,"",{"agrava"}},
484 {"era",1,"",{"acelera","espera"}},
488 {"ere",1,"",{"espere"}},
494 {"imo",3,"",{"reprimo","intimo","íntimo","nimo","queimo","ximo"}},
496 {"ira",3,"",{"fronteira","sátira"}},
500 # concretizar -> concret
501 {"tizar",4,"",{"alfabetizar"}},
502 {"izar",3,"",{"organizar"}},
504 {"itar",5,"",{"acreditar","explicitar","estreitar"}},
506 {"ire",3,"",{"adquire"}},
511 {"ear",4,"",{"alardear","nuclear"}},
518 {"er",1,"",{"éter","pier"}},
520 {"eu",1,"",{"chapeu"}},
522 {"ia",1,"",{"estória","fatia","acia","praia","elogia","mania","lábia","aprecia","polícia","arredia","cheia","ásia"}},
534 {"ede",1,"",{"rede","bípede","céspede","parede","palmípede","vostede","hóspede","adrede"}},
545 # colleramo -> coller
593 # escribirade -> escrib
613 # reflectiron -> reflect
629 {"tizar",3,"",{"alfabetizar"}},
634 {"gue",2,"g",{"azougue","dengue","merengue","nurague","merengue","rengue"}},
635 {"que",2,"c",{"alambique","albaricoque","abaroque","alcrique","almadraque","almanaque","arenque","arinque","baduloque","ballestrinque","betoque","bivaque","bloque","bodaque","bosque","breque","buque","cacique","cheque","claque","contradique","coque","croque","dique","duque","enroque","espeque","estoque","estoraque","estraloque","estrinque","milicroque","monicreque","orinque","arinque","palenque","parque","penique","picabeque","pique","psique","raque","remolque","xeque","repenique","roque","sotobosque","tabique","tanque","toque","traque","truque","vivaque","xaque"}},
636 {"a",3,"",{"amasadela","cerva"}},
637 {"e",3,"",{"marte"}},
638 {"o",3,"",{"barro","fado","cabo","libro","cervo"}},
640 {"ã",3,"",{"amanhã","arapuã","fã","divã","manhã"}},