# Steps file for the RSLP stemmer. # Step 1: Plural Reduction { "Plural", 3, 1, {"s"}, # bons -> bom {"ns",1,"m"}, # balões -> balão {"ões",3,"ão"}, # capitães -> capitão {"ães",1,"ão",{"mães"}}, # normais -> normal {"ais",1,"al",{"cais","mais"}}, # papéis -> papel {"éis",2,"el"}, # amáveis -> amável {"eis",2,"el"}, # lençóis -> lençol {"óis",2,"ol"}, # barris -> barril {"is",2,"il",{"lápis","cais","mais","crúcis","biquínis","pois","depois","dois","leis"}}, # males -> mal {"les",3,"l"}, # mares -> mar {"res",3,"r", {"árvores"}}, # casas -> casa {"s",2,"",{"aliás","pires","lápis","cais","mais","mas","menos","férias","fezes","pêsames","crúcis","gás","atrás","moisés","através","convés","ês","país","após","ambas","ambos","messias", "depois"}}}; # Step 2: Adverb Reduction { "Adverb", 0, 0, {}, # felizmente -> feliz {"mente",4,"",{"experimente"}}}; # Step 3: Feminine Reduction { "Feminine", 3, 1, {"a","ã"}, # chefona -> chefão {"ona",3,"ão",{"abandona","lona","iona","cortisona","monótona","maratona","acetona","detona","carona"}}, # vilã -> vilão {"ã",2,"ão",{"amanhã","arapuã","fã","divã"}}, # professora -> professor {"ora",3,"or"}, # americana -> americano {"na",4,"no",{"carona","abandona","lona","iona","cortisona","monótona","maratona","acetona","detona","guiana","campana","grana","caravana","banana","paisana"}}, # sozinha -> sozinho {"inha",3,"inho",{"rainha","linha","minha"}}, # inglesa -> inglês {"esa",3,"ês",{"mesa","obesa","princesa","turquesa","ilesa","pesa","presa"}}, # famosa -> famoso {"osa",3,"oso",{"mucosa","prosa"}}, # maníaca -> maníaco {"íaca",3,"íaco"}, # prática -> prático {"ica",3,"ico",{"dica"}}, # cansada -> cansado {"ada",2,"ado",{"pitada"}}, # mantida -> mantido {"ida",3,"ido",{"vida","dúvida"}}, {"ída",3,"ido",{"recaída","saída"}}, # prima -> primo {"ima",3,"imo",{"vítima"}}, # passiva -> passivo {"iva",3,"ivo",{"saliva","oliva"}}, # primeira -> primeiro {"eira",3,"eiro",{"beira","cadeira","frigideira","bandeira","feira","capoeira","barreira","fronteira","besteira","poeira"}}}; # Step 4: Augmentative/Diminutive Reduction { "Augmentative", 0, 1, {}, # cansadíssimo -> cansad {"díssimo",5}, # amabilíssimo -> ama {"abilíssimo",5}, # fortíssimo -> fort {"íssimo",3}, {"ésimo",3}, # chiquérrimo -> chiqu {"érrimo",4}, # pezinho -> pe {"zinho",2}, # maluquinho -> maluc {"quinho",4,"c"}, # amiguinho -> amig {"uinho",4}, # cansadinho -> cansad {"adinho",3}, # carrinho -> carr {"inho",3,"",{"caminho","cominho"}}, # grandalhão -> grand {"alhão",4}, # dentuça -> dent {"uça",4}, # ricaço -> ric {"aço",4,"",{"antebraço"}}, {"aça",4}, # casadão -> cans {"adão",4}, {"idão",4}, # corpázio -> corp {"ázio",3,"",{"topázio"}}, # pratarraz -> prat {"arraz",4}, {"zarrão",3}, {"arrão",4}, # bocarra -> boc {"arra",3}, # calorzão -> calor {"zão",2,"",{"coalizão"}}, # meninão -> menin {"ão",3,"",{"camarão","chimarrão","canção","coração","embrião","grotão","glutão","ficção","fogão","feição","furacão","gamão","lampião","leão","macacão","nação","órfão","orgão","patrão","portão","quinhão","rincão","tração","falcão","espião","mamão","folião","cordão","aptidão","campeão","colchão","limão","leilão","melão","barão","milhão","bilhão","fusão","cristão","ilusão","capitão","estação","senão"}}}; # Step 5: Noun Suffix Reduction { "Noun", 0, 0, {}, # existencialista -> exist {"encialista",4}, # minimalista -> minim {"alista",5}, # contagem -> cont {"agem",3,"",{"coragem","chantagem","vantagem","carruagem"}}, # gerenciamento -> gerenc {"iamento",4}, # monitoramento -> monitor {"amento",3,"",{"firmamento","fundamento","departamento"}}, # nascimento -> nasc {"imento",3}, {"mento",6,"",{"firmamento","elemento","complemento","instrumento","departamento"}}, # comercializado -> comerci {"alizado",4}, # traumatizado -> traum {"atizado",4}, {"tizado",4,"",{"alfabetizado"}}, # alfabetizado -> alfabet {"izado",5,"",{"organizado","pulverizado"}}, # associativo -> associ {"ativo",4,"",{"pejorativo","relativo"}}, # contraceptivo -> contracep {"tivo",4,"",{"relativo"}}, # esportivo -> esport {"ivo",4,"",{"passivo","possessivo","pejorativo","positivo"}}, # abalado -> abal {"ado",2,"",{"grado"}}, # impedido -> imped {"ido",3,"",{"cândido","consolido","rápido","decido","tímido","duvido","marido"}}, # ralador -> ral {"ador",3}, # entendedor -> entend {"edor",3}, # cumpridor -> cumpr {"idor",4,"",{"ouvidor"}}, {"dor",4,"",{"ouvidor"}}, {"sor",4,"",{"assessor"}}, {"atoria",5}, {"tor",3,"",{"benfeitor","leitor","editor","pastor","produtor","promotor","consultor"}}, {"or",2,"",{"motor","melhor","redor","rigor","sensor","tambor","tumor","assessor","benfeitor","pastor","terior","favor","autor"}}, # comparabilidade -> compar {"abilidade",5}, # abolicionista -> abol {"icionista",4}, # intervencionista -> interven {"cionista",5}, {"ionista",5}, {"ionar",5}, # profissional -> profiss {"ional",4}, # referência -> refer {"ência",3}, # repugnância -> repugn {"ância",4,"",{"ambulância"}}, # abatedouro -> abat {"edouro",3}, # fofoqueiro -> fofoc {"queiro",3,"c"}, {"adeiro",4,"",{"desfiladeiro"}}, # brasileiro -> brasil {"eiro",3,"",{"desfiladeiro","pioneiro","mosteiro"}}, {"uoso",3}, # gostoso -> gost {"oso",3,"",{"precioso"}}, # comercializaç -> comerci {"alizaç",5}, {"atizaç",5}, {"tizaç",5}, {"izaç",5,"",{"organizaç"}}, # alegaç -> aleg {"aç",3,"",{"equaç","relaç"}}, # aboliç -> abol {"iç",3,"",{"eleiç"}}, # anedotário -> anedot {"ário",3,"",{"voluntário","salário","aniversário","diário","lionário","armário"}}, {"atório",3}, {"rio",5,"",{"voluntário","salário","aniversário","diário","compulsório","lionário","próprio","stério","armário"}}, # ministério -> minist {"ério",6}, # chinês -> chin {"ês",4}, # beleza -> bel {"eza",3}, # rigidez -> rigid {"ez",4}, # parentesco -> parent {"esco",4}, # ocupante -> ocup {"ante",2,"",{"gigante","elefante","adiante","possante","instante","restaurante"}}, # bombástico -> bomb {"ástico",4,"",{"eclesiástico"}}, {"alístico",3}, {"áutico",4}, {"êutico",4}, {"tico",3,"",{"político","eclesiástico","diagnostico","prático","doméstico","diagnóstico","idêntico","alopático","artístico","autêntico","eclético","crítico","critico"}}, # polêmico -> polêm {"ico",4,"",{"tico","público","explico"}}, # produtividade -> produt {"ividade",5}, # profundidade -> profund {"idade",4,"",{"autoridade","comunidade"}}, # aposentadoria -> aposentad {"oria",4,"",{"categoria"}}, # existencial -> exist {"encial",5}, # artista -> art {"ista",4}, {"auta",5}, # maluquice -> maluc {"quice",4,"c"}, # chatice -> chat {"ice",4,"",{"cúmplice"}}, # demoníaco -> demon {"íaco",3}, # decorrente -> decorr {"ente",4,"",{"freqüente","alimente","acrescente","permanente","oriente","aparente"}}, {"ense",5}, # criminal -> crim {"inal",3}, # americano -> americ {"ano",4}, # amável -> am {"ável",2,"",{"afável","razoável","potável","vulnerável"}}, # combustível -> combust {"ível",3,"",{"possível"}}, {"vel",5,"",{"possível","vulnerável","solúvel"}}, {"bil",3,"vel"}, # cobertura -> cobert {"ura",4,"",{"imatura","acupuntura","costura"}}, {"ural",4}, # consensual -> consens {"ual",3,"",{"bissexual","virtual","visual","pontual"}}, # mundial -> mund {"ial",3}, # experimental -> experiment {"al",4,"",{"afinal","animal","estatal","bissexual","desleal","fiscal","formal","pessoal","liberal","postal","virtual","visual","pontual","sideral","sucursal"}}, {"alismo",4}, {"ivismo",4}, {"ismo",3,"",{"cinismo"}}}; # Step 6: Verb Suffix Reduction { "Verb", 0, 0, {}, # cantaríamo -> cant {"aríamo",2}, # cantássemo -> cant {"ássemo",2}, # beberíamo -> beb {"eríamo",2}, # bebêssemo -> beb {"êssemo",2}, # partiríamo -> part {"iríamo",3}, # partíssemo -> part {"íssemo",3}, # cantáramo -> cant {"áramo",2}, # cantárei -> cant {"árei",2}, # cantaremo -> cant {"aremo",2}, # cantariam -> cant {"ariam",2}, # cantaríei -> cant {"aríei",2}, # cantássei -> cant {"ássei",2}, # cantassem -> cant {"assem",2}, # cantávamo -> cant {"ávamo",2}, # bebêramo -> beb {"êramo",3}, # beberemo -> beb {"eremo",3}, # beberiam -> beb {"eriam",3}, # beberíei -> beb {"eríei",3}, # bebêssei -> beb {"êssei",3}, # bebessem -> beb {"essem",3}, # partiríamo -> part {"íramo",3}, # partiremo -> part {"iremo",3}, # partiriam -> part {"iriam",3}, # partiríei -> part {"iríei",3}, # partíssei -> part {"íssei",3}, # partissem -> part {"issem",3}, # cantando -> cant {"ando",2}, # bebendo -> beb {"endo",3}, # partindo -> part {"indo",3}, # propondo -> prop {"ondo",3}, # cantaram -> cant {"aram",2}, {"arão",2}, # cantarde -> cant {"arde",2}, # cantarei -> cant {"arei",2}, # cantarem -> cant {"arem",2}, # cantaria -> cant {"aria",2}, # cantarmo -> cant {"armo",2}, # cantasse -> cant {"asse",2}, # cantaste -> cant {"aste",2}, # cantavam -> cant {"avam",2,"",{"agravam"}}, # cantávei -> cant {"ávei",2}, # beberam -> beb {"eram",3}, {"erão",3}, # beberde -> beb {"erde",3}, # beberei -> beb {"erei",3}, # bebêrei -> beb {"êrei",3}, # beberem -> beb {"erem",3}, # beberia -> beb {"eria",3}, # bebermo -> beb {"ermo",3}, # bebesse -> beb {"esse",3}, # bebeste -> beb {"este",3,"",{"faroeste","agreste"}}, # bebíamo -> beb {"íamo",3}, # partiram -> part {"iram",3}, # concluíram -> conclu {"íram",3}, {"irão",2}, # partirde -> part {"irde",2}, # partírei -> part {"irei",3,"",{"admirei"}}, # partirem -> part {"irem",3,"",{"adquirem"}}, # partiria -> part {"iria",3}, # partirmo -> part {"irmo",3}, # partisse -> part {"isse",3}, # partiste -> part {"iste",4}, {"iava",4,"",{"ampliava"}}, # cantamo -> cant {"amo",2}, {"iona",3}, # cantara -> cant {"ara",2,"",{"arara","prepara"}}, # cantará -> cant {"ará",2,"",{"alvará"}}, # cantare -> cant {"are",2,"",{"prepare"}}, # cantava -> cant {"ava",2,"",{"agrava"}}, # cantemo -> cant {"emo",2}, # bebera -> beb {"era",3,"",{"acelera","espera"}}, # beberá -> beb {"erá",3}, # bebere -> beb {"ere",3,"",{"espere"}}, # bebiam -> beb {"iam",3,"",{"enfiam","ampliam","elogiam","ensaiam"}}, # bebíei -> beb {"íei",3}, # partimo -> part {"imo",3,"",{"reprimo","intimo","íntimo","nimo","queimo","ximo"}}, # partira -> part {"ira",3,"",{"fronteira","sátira"}}, {"ído",3}, # partirá -> part {"irá",3}, {"tizar",4,"",{"alfabetizar"}}, {"izar",5,"",{"organizar"}}, {"itar",5,"",{"acreditar","explicitar","estreitar"}}, # partire -> part {"ire",3,"",{"adquire"}}, # compomo -> comp {"omo",3}, # cantai -> cant {"ai",2}, # cantam -> cant {"am",2}, # barbear -> barb {"ear",4,"",{"alardear","nuclear"}}, # cantar -> cant {"ar",2,"",{"azar","bazaar","patamar"}}, # cheguei -> cheg {"uei",3}, {"uía",5,"u"}, # cantei -> cant {"ei",3}, {"guem",3,"g"}, # cantem -> cant {"em",2,"",{"alem","virgem"}}, # beber -> beb {"er",2,"",{"éter","pier"}}, # bebeu -> beb {"eu",3,"",{"chapeu"}}, # bebia -> beb {"ia",3,"",{"estória","fatia","acia","praia","elogia","mania","lábia","aprecia","polícia","arredia","cheia","ásia"}}, # partir -> part {"ir",3,"",{"freir"}}, # partiu -> part {"iu",3}, {"eou",5}, # chegou -> cheg {"ou",3}, # bebi -> beb {"i",3}}; # Step 7: Vowel Removal { "Vowel", 0, 0, {}, {"bil",2,"vel"}, {"gue",2,"g",{"gangue","jegue"}}, {"á",3}, {"ê",3,"",{"bebê"}}, # menina -> menin {"a",3,"",{"ásia"}}, # grande -> grand {"e",3}, # menino -> menin {"o",3,"",{"ão"}}};