Origem das palavras: “Da mesma forma que um paleontólogo recupera a vida de um período por meio dos fósseis, a etimologia só dispõe do que foi escrito”, diz o etimólogo Mário Viaro CRÉDITO: BETO NEJME_2023
O prazer das palavras
Os etimólogos e o amplo dicionário que a língua portuguesa não tem
Paula Alkmim | Edição 200, Maio 2023
“Abacaxi: seu feitio é como uma linda pirâmide, mas redonda tecida à maneira de pinha, e tem por coroa e remate um galante pedaço de folhas, em lugar de plumas.” Assim o padre João Daniel descreve um abacaxi em 1776 em sua obra Tesouro Descoberto no Rio Amazonas. Trata-se do primeiro documento em que o termo “abacaxi” aparece designando uma variedade de fruta. De acordo com os dicionários, o vocábulo tem origem tupi e significa “fruta que exala cheiro”, a partir da junção dos termos ybá (“fruta”) e kati (“que recende”).
Antes de nomear a planta, porém, a palavra foi usada para se referir a um povo indígena, um rio e uma missão jesuítica, como descobriu o professor Bruno Maroneze, do curso de letras da Universidade Federal da Grande Dourados (UFGD), em Mato Grosso do Sul. E é pouco provável que o nome de um povo, de um rio ou de uma missão jesuítica signifique “fruta que exala cheiro”, afirma o professor em um artigo no qual propõe reavaliar a etimologia da palavra.
Maroneze é um etimólogo, dedica-se a pesquisar a origem das palavras, sua história e as mudanças de forma e significado por que passaram ao longo dos anos, séculos e até milênios. Nascido em São Bernardo do Campo, na Grande São Paulo, ele tem 42 anos e estuda o léxico desde os 19, quando começou a investigar neologismos e a formação de palavras. Já pesquisou a datação de 94 termos ou acepções. Descobriu, por exemplo, que é de 1793 o registro mais antigo da palavra “pétala” encontrado até o momento. Seu artigo sobre a etimologia de “abacaxi”, resultado de uma pesquisa iniciada em 2017 em documentos antigos, foi publicado três anos depois na revista Filologia e Linguística Portuguesa, da USP.
O etimólogo descobriu que, mais de um século antes do Tesouro Descoberto no Rio Amazonas, precisamente em 1663, a Chronica da Companhia de Jesu do Estado do Brasil, do padre Simão de Vasconcellos, já menciona os abacaxis em uma lista de povos indígenas. Os abacaxis habitavam um território entre os rios Tapajós e Madeira, no estado do Amazonas, e teriam sido extintos provavelmente em decorrência de epidemias ou guerras. Em 1691, o primeiro registro conhecido do Rio Abacaxis aparece em um mapa, denominando um afluente do Rio Madeira que deságua na margem direita do Amazonas. Em um catálogo de 1760 – dezesseis anos antes de o padre João Daniel falar da fruta exótica –, há notações a respeito de uma missão jesuítica com o nome Abacaxi, que se instalou às margens do Rio Abacaxis a fim de catequizar não só o povo do mesmo nome como também os barés e jumas, entre outros.
Por causa de todo esse passado da palavra pesquisado por Maroneze, ele propõe a revisão da etimologia consensual de “abacaxi” como sendo “fruta que exala cheiro”, tal como registrada nos dicionários desde 1889, já que isso é incompatível com a sua primeira atestação – ou seja, a primeira vez em que aparece registrada na língua portuguesa. Para o pesquisador, deve-se buscar no povo indígena, e não na fruta, a origem do vocábulo. “Não é exatamente um problema dos dicionários. É que, simplesmente, ninguém tinha analisado ainda os dados históricos, ninguém tinha posto em dúvida a etimologia de ‘abacaxi’”, diz Maroneze. Ele ressalta que tudo pode mudar se for encontrado algum documento fazendo referência à fruta que seja anterior aos que ele encontrou empregando a palavra para designar o rio, a missão jesuítica e o povo Abacaxis.
Os documentos que o pesquisador levantou não esclarecem, contudo, a respeito de um ponto crucial: se a palavra “abacaxi” foi usada pela primeira vez para designar um povo indígena e seu rio, qual a relação entre eles e a fruta? Maroneze tem algumas hipóteses, como a de que a fruta talvez fosse comum na região ou cultivada pelos indígenas. Mas a questão continua em aberto, pois ainda não se descobriram documentos que comprovem essa correlação. Se esses documentos existiram, mas foram destruídos, é possível que o nexo entre o povo Abacaxis e a fruta permaneça para sempre um enigma.
Para um etimólogo, encontrar a data de nascimento de uma palavra é um feito importante, parecido com a de um biólogo que consegue descrever uma nova espécie. Não à toa, o professor Mário Viaro, do Departamento de Letras Clássicas e Vernáculas da USP, queria ser um entomólogo, um pesquisador dos insetos, quando era criança em Botucatu, cidade do interior paulista onde nasceu. Por volta dos 12 anos, começou a estudar latim por conta própria para ler tratados científicos sobre opiliões (um tipo de aracnídeo) e tomou gosto por outras línguas, como o alemão e o russo. Acabou trocando os insetos pelas palavras. Formou-se em letras pela USP, e a entomologia se tornou para ele apenas um hobby. “Ainda me embrenho pelas matas para fotografar insetos e consigo às vezes achar opiliões me valendo só do olfato [pois exalam um cheiro forte], talento que devo ter adquirido desde pequeno”, conta o pesquisador de 54 anos, considerado por seus pares o maior especialista em etimologia da língua portuguesa.
Essa especialidade entrou em sua vida na pós-graduação, quando ele foi convidado para fazer a revisão da parte etimológica do Dicionário Michaelis. Depois disso, escreveu dois manuais que viraram referência para pesquisadores da área e passou a sonhar com a criação de um novo e robusto dicionário etimológico de língua portuguesa – algo que não existe no Brasil, nem em Portugal, ou qualquer outro país que fala o idioma.
Para levar adiante a empreitada de um Dicionário Etimológico da Língua Portuguesa – título que escolheu para a obra –, Viaro juntou-se a Maroneze em 2012. A ideia era, a partir do Núcleo de Apoio à Pesquisa em Etimologia e História da Língua Portuguesa (NEHiLP), da USP, desenvolver um dicionário com os recursos do século XXI, buscando a origem das palavras com a ajuda das ferramentas computacionais, de modo a preencher as lacunas históricas que existem nos dicionários etimológicos de língua portuguesa. Aos dois pesquisadores, foram-se agregando dezenas de outros, inclusive portugueses, franceses e alemães, de áreas como filologia (que estuda escritos antigos), morfologia (que investiga a estrutura e formação de palavras) e lexicografia (que se dedica à elaboração e organização de dicionários). Nos primeiros estágios da pesquisa foram coletados dados sobre a datação de mais de 25 mil verbetes. Depois disso, só avançaram os problemas.
Fazer um dicionário, qualquer dicionário, é uma tarefa titânica. Exige numerosas pesquisas, leituras e consultas, muito rigor e vigor intelectual, extremo cuidado, paciência infinita, além de fartos recursos materiais, pois é um trabalho que se alonga no tempo – às vezes, a perder de vista. Por exemplo: o primeiro dicionário geral da língua portuguesa projetado pela Academia Real de Ciências de Lisboa (o nome da Academia das Ciências de Lisboa na época) começou a ser feito no século XVII e só foi finalizado neste século. Em 1793, a academia planejou fazer uma obra colossal, nos moldes do que fizera a Academia Francesa em 1694 e a Real Academia Espanhola em 1780. A empreitada dos eruditos portugueses não saiu da letra “a”, parando na palavra “azurrar”. Quase dois séculos mais tarde, em 1976, uma nova tentativa empacou, outra vez na primeira letra do alfabeto. O dicionário completo da Academia, de “a” a “z”, só foi concluído em 2001 – ou 208 anos depois da primeira tentativa.
Apesar disso, a história da lexicografia portuguesa seguiu em frente. No século XVI, foram publicados os dicionários bilíngues (português-latim e latim-português) de Jerónimo Cardoso (1508-69), um latinista cujos trabalhos são fundamentais para os estudos etimológicos. Outra obra notável foi a do monge Raphael Bluteau (1638-1734), londrino de pais franceses que passou a maior parte da vida em Portugal e entre 1712 e 1728 publicou o enciclopédico Vocabulario Portuguez e Latino, em oito volumes e dois suplementos, abarcando vários campos do conhecimento.
Dicionários etimológicos do português, que trazem a genealogia da palavra, são raros até hoje. O primeiro foi lançado em 1836, feito pelo filólogo, médico e jornalista lisboeta Francisco Solano Constancio (1777-1846), um autor prolífico que chegou a escrever uma História do Brasil, em dois volumes. Outra referência importante data de 1890: o Diccionario Manual Etymologico da Lingua Portugueza, do filólogo Francisco Adolpho Coelho (1847-1919) – nascido em Coimbra –, cuja primeira edição tinha 1,2 mil páginas. “O mérito desses autores é inquestionável, sobretudo o de Adolpho Coelho”, diz Viaro. Da parte dos portugueses, há ainda o dicionário feito por José Pedro Machado (1914-2005), publicado em 1952 e pioneiro na datação da origem das palavras, embora se limite a indicar o século em que entraram no léxico.
No Brasil, uma das principais obras na área é o Dicionário Etimológico da Língua Portuguesa, publicado em 1932 pelo filólogo carioca Antenor Nascentes (1886-1972). Mas nas livrarias é muito provável que o leitor interessado na matéria só encontre o trabalho de Antônio Geraldo da Cunha (1924-1999), Dicionário Etimológico da Língua Portuguesa. O Dicionário Houaiss da Língua Portuguesa, embora não se dedique à etimologia propriamente dita, é uma referência relevante, pois traz informações sobre a datação e a origem de vocábulos, incluindo alguns só recentemente incorporados à língua.
Cunha foi um erudito do idioma que também fez um dicionário histórico das palavras portuguesas de origem tupi e escreveu livros sobre o português medieval, entre outros temas. As duas primeiras edições de seu Dicionário Etimológico foram publicadas na década de 1980 pela Editora Nova Fronteira, quando o autor ainda estava vivo. Depois disso, a obra só voltou a ter uma nova edição em 2007, lançada pela Lexikon, editora especializada em títulos sobre a língua portuguesa. A edição atualmente à venda é de 2010, com 744 páginas, e traz poucas atualizações. “O Cunha trabalhou praticamente de forma solitária”, diz Viaro. “Ele foi muito bem com os textos medievais até o Renascimento, mas nós já começamos a perceber falhas a partir do século XVII. Muita palavra entrou no século XX, mas sem que ninguém tenha estudado.”
Viaro conta que Cunha fez seu trabalho de maneira inteiramente manual. A cada palavra o etimólogo dedicava uma ficha de papel, na qual registrava todas as informações de que dispunha. Sempre que fazia uma nova descoberta, ele revia as anotações. “Quantas palavras o Cunha pode ter perdido por distração, porque não associou na hora que a ocorrência era mais antiga do que aquela que tinha lá na ficha?”, especula Viaro. O conjunto das fichas formava um arquivo gigantesco. Para se ter uma ideia, somente a pesquisa sobre o português medieval resultou na elaboração de cerca de 170 mil fichas.
A Lexikon não sabe ainda quando haverá uma nova edição do dicionário de Cunha. Mas assegura que é “certamente o mais atualizado dos dicionários etimológicos em língua portuguesa” e que tem acrescentado à obra novas palavras e novas acepções de termos já registrados. A editora também disse à piauí que está aberta a corrigir as datações dos vocábulos, mediante pesquisas comprovatórias, mas que esses casos são raros. De 2007 até 2021, o dicionário vendeu 17 mil exemplares.
Presidente da Comissão de Lexicologia e Lexicografia da Academia Brasileira de Letras (ABL), o gramático e filólogo pernambucano Evanildo Bechara considera que os dicionários do português José Pedro Machado e dos brasileiros Antenor Nascentes e Antônio Geraldo da Cunha são robustos e não estão tão desatualizados como se pensa. “Um dicionário geral, por natureza, estará sempre atrasado ao tomar-se em consideração a ilimitada produtividade de uma língua viva”, diz Bechara, que foi assistente de Antenor Nascentes na cátedra de filologia românica da Universidade do Estado da Guanabara, atual UERJ. Ele observa que o processo de globalização, “acelerado e avassalador”, só acentua esse atraso.
Bechara coordena atualmente a elaboração do Dicionário da Língua Portuguesa, da ABL, cujo conteúdo vem sendo disponibilizado gratuitamente no site da entidade, à medida que os verbetes ficam prontos. A expectativa é que tenha mais de 200 mil entradas. Até agora, o dicionário traz a etimologia de apenas algumas palavras, e não inclui a datação delas. A abl não deu detalhes de como tem trabalhado a parte etimológica do dicionário nem quis informar o valor investido na obra.
Quando se fala em dicionários, uma das principais referências dos pesquisadores é o Oxford Dictionary of English, editado há mais de 150 anos pela Oxford University Press, a maior editora universitária do mundo. Na versão impressa, tem vinte volumes e, embora não se atenha apenas à etimologia, esta ocupa um lugar importante na obra. A versão digital traz o significado de cerca de 600 mil palavras da língua inglesa e é atualizada a cada três meses, num processo que inclui a revisão dos verbetes já existentes e o acréscimo de novos. Cada palavra é acompanhada de informações sobre a pronúncia, o significado atual e a forma mais antiga em inglês escrito. Contém ainda a primeira datação dos vocábulos e a data das diferentes acepções que adquiriram ao longo da história. O dicionário traz mais de 3,5 milhões de abonações – ou seja, frases que ilustram o significado da palavra em determinado contexto –, garimpadas em textos literários, periódicos especializados, roteiros de filmes, livros de culinária etc. “Ninguém consegue vencer a qualidade do dicionário Oxford, que traz informações riquíssimas e é muito bem organizado”, avalia Maroneze.
Há outros dicionários de qualidade, em outros idiomas, que também são referência para os etimólogos em geral e para o grupo da USP. Um deles é o Trésor de la Langue Française, obra coletiva em dezesseis volumes (do qual existe uma versão digital de acesso gratuito), e o Diccionario Crítico Etimológico de la Lengua Castellana, do filólogo catalão Joan Corominas (1905-97). Um dos méritos desses dicionários é que eles esmiúçam tanto a história das palavras que, às vezes, chegam a dedicar mais de uma página a um único verbete.
Os dicionários da língua portuguesa costumam ser bem sumários. É comum que tragam a informação de que a palavra veio do latim ou do grego, por exemplo, mas sem dizer como ela chegou até a nossa língua. É o caso de “fotografia”. Em geral, os dicionários registram somente que a palavra é formada pela composição dos elementos gregos phõs, photós (luz) e gráphein (escrever, registrar), acrescida do sufixo –ia, para formar o substantivo. “O leigo, ao se deparar com essa explicação, terá a impressão de que a palavra ‘fotografia’ foi criada na língua portuguesa a partir de radicais gregos. Mas não foi o que ocorreu”, diz o linguista Aldo Bizzocchi, de 61 anos, pesquisador do NEHiLP e integrante do projeto do novo dicionário etimológico. “A palavra foi criada na língua francesa em 1826, pelos inventores dessa técnica: photographie. A palavra portuguesa é um empréstimo do francês. Esse tipo de informação histórica você não encontra nos nossos dicionários.”
A etimologia entrou na vida de Aldo Bizzocchi durante a pós-graduação. Quando cursava a disciplina de lexicologia, durante o mestrado em linguística na USP, ele teve a ideia de desenvolver uma pesquisa sobre os processos de criação de palavras em cinco idiomas: inglês, francês, italiano, alemão e português. O trabalho virou seu tema de doutorado e resultou no livro Léxico e Ideologia na Europa Ocidental, publicado em 1998. Bizzocchi conheceu Viaro em um congresso e passou a colaborar com ele, trabalhando na implantação do sistema informatizado do dicionário etimológico.
A ambição do grupo de etimólogos da USP era fazer um dicionário à altura dos maiores do mundo. Para tanto, seria preciso incorporar as novas ferramentas da informática à pesquisa, o que levou Viaro e seus colegas a fazer uma parceria com o Instituto de Matemática e Estatística da USP. Em um primeiro momento, a grande aposta foi no Moedor. Trata-se de um software, desenvolvido para o projeto, com a habilidade de distinguir as palavras de um documento e catalogar os diferentes contextos em que elas são usadas. “Parece um moedor de carne. Você pega um texto, joga no programa, e ele vai desmembrar o texto em todas as palavras que o compõem”, diz Bizzocchi.
À medida que o material é inserido no Moedor, a ferramenta checa se a datação das palavras é anterior àquela que já está registrada no seu banco de dados e faz as atualizações necessárias. O programa permitiu rever, por exemplo, a data de nascimento da palavra “brigadeiro”, na acepção de doce de leite condensado com chocolate. Datado pelo Dicionário Houaiss como sendo da década de 1950, o vocábulo foi identificado em um livro de receitas de 1948. O nome talvez esteja relacionado ao brigadeiro Eduardo Gomes, que concorreu à Presidência da República dois anos antes.
O ponto de partida para a construção do banco de dados no Moedor foi a inserção do dicionário de Jerônimo Cardoso, do século XVI, o primeiro registro dicionarizado das palavras da língua portuguesa. Depois, foram acrescentados o dicionário do monge Raphael Bluteau e outras obras, além de textos de publicações diversas, disponíveis na Hemeroteca Digital, da Fundação Biblioteca Nacional. Foram tantos textos inseridos no Moedor que o programa começou a dar sinais de lentidão, e o trabalho foi reduzido.
Outra vantagem do Moedor é o uso de inteligência artificial. Essa ferramenta consegue, por exemplo, converter para o masculino singular (que é a forma do dicionário) uma palavra que aparece em um texto no feminino plural. Faz operação similar com os verbos, reduzindo ao infinitivo o que aparece no texto – suponha-se – no pretérito imperfeito do subjuntivo. “Ao mesmo tempo, o programa registra a grafia original da palavra ou a flexão, tal como está no texto”, diz Bizzocchi.
Com a ajuda da ferramenta, os pesquisadores já conseguiram coletar dados sobre a datação de mais de 25 mil palavras, o que pode ajudar a refinar as informações encontradas atualmente nos dicionários. Eles descobriram, por exemplo, que a palavra “uranologia” (estudo do céu), que consta nos dicionários de Cunha e Houaiss como tendo surgido em 1858, é bem mais antiga. Aparece, mais de um século antes, no frontispício do próprio dicionário de Bluteau, cujo título completo na escrita original é:
Vocabulario Portuguez e Latino, Aulico, Anatomico, Architectonico, Bellico, Botanico, Brasilico, Comico, Critico, Chimico, Dogmatico, Dialectico, Dendrologico, Ecclesiastico, Etymologico, Economico, Florifero, Forense, Fructifero, Geographico, Geometrico, Gnomonico, Hydrographico, Homonymico, Hierologico, Ichtyologico, Indico, Isagogico, Laconico, Liturgico, Lithologico, Medico, Musico, Meteorologico, Nautico, Numerico, Neoterico, Ortographico, Optico, Ornithologico, Poetico, Philologico, Pharmaceutico, Quidditativo, Qualitativo, Quantitativo, Rethorico, Rustico, Romano, Symbolico, Synonimico, Syllabico, Theologico, Terapeutico, Technologico, Uranologico, Xenophonico, Zoologico, autorizado com exemplos dos Melhores Escritores Portuguezes, [et] Latinos, e offerecido a elrey de portugal dom joan v.
A datação de um vocábulo é só o começo do trabalho do etimólogo. O especialista precisa também elaborar hipóteses sobre como foi a transmissão das palavras ao longo do tempo. Isso requer investigar, entre outras coisas, as mudanças sonoras que ocorreram na incorporação à língua estudada. A expressão latina silvam forestem, que significa “bosque do lado de fora (das muralhas)”, reduzida para forestem apenas, gerou forêt, no francês, foresta, no italiano, mas, no português, significando o mesmo que nessas duas línguas, virou floresta, provavelmente por uma analogia com a palavra “flor”. Segundo Viaro, compreender as mudanças fonéticas “é expediente imprescindível para separar as boas etimologias das más”.
Por isso, outra aposta do projeto da USP no campo da informática foi o desenvolvimento do Metaplasmador, uma ferramenta que utiliza algoritmos para testar se a evolução da palavra segue ou não as leis fonéticas – no caso específico do programa, do latim para o português. Ou seja, se na passagem de uma língua a outra, o vocábulo sofreu modificações conforme os padrões esperados. É o caso do “p” entre vogais, que se transformou em “b”, como em lupum/lobo ou saponem/sabão. “As leis fonéticas são complexas para a nossa cabeça, mas para uma máquina é superfácil”, diz Viaro.
Quando a palavra latina é inserida, o Metaplasmador mostra, na ordem em que ocorreram historicamente, todas as modificações fonéticas pelas quais o vocábulo passou até a forma que tem no português atual. Isso permite levantar hipóteses sobre sua origem. Se o resultado das transformações coincidir, de fato, com a forma portuguesa atual do vocábulo – como ocorre com lupum/lobo –, pode-se dizer que a origem da palavra foi provada. Se o resultado for diferente, será preciso encontrar provas em outras línguas ou outros contextos similares da mesma língua para explicar por que a mudança ocorreu.
É o caso da palavra “raposa”, cuja origem pode estar no verbo latino rapere, que significa roubar (em latim, a raposa mesmo é vulpes). O problema é que, nesse caso, pelo padrão, o esperado seria a forma “rabosa”. Assim, ainda é preciso fazer mais investigações para elucidar por que, nesse caso, o “p” não se transformou em “b”, ou buscar outra etimologia para o termo “raposa”. “Não há até agora nenhuma outra hipótese, mas também não conseguimos explicar por que essa palavra seria uma exceção da língua portuguesa. Portanto, a origem é controversa”, diz Maroneze.
Viaro vê limites para as contribuições que as ferramentas computacionais podem dar às pesquisas. “Não acho que as etimologias sem respostas suficientes hoje em dia terão algo mais palpável no futuro, com o avanço de técnicas. Isso me soa demasiadamente positivista”, argumenta. “A falta de dados muitas vezes é algo irrecuperável. Da mesma forma que um paleontólogo se consola em recuperar parte da vida de um período por meio dos fósseis, a etimologia também só tem o que foi escrito e o que foi encontrado.”
Além de ferramentas automatizadas, outra novidade que tem impulsionado os estudos etimológicos em geral, e tem ajudado bastante os pesquisadores da USP, é a digitalização das fontes históricas. Antigamente, para ter acesso às obras mais antigas escritas em língua portuguesa, era preciso consultá-las em bibliotecas e arquivos públicos. Hoje, estão disponíveis na internet milhões de obras, documentos históricos e dicionários antigos, como o de Bluteau. No Google Livros, plataforma com mais 10 milhões de obras digitalizadas em vários idiomas, é possível pesquisar textos em língua portuguesa do século XVI até o XIX que já estão em domínio público. Esse acervo ajuda a identificar os contextos mais antigos do uso das palavras e apurar as datações. Mas o registro de livros por idioma pode apresentar falhas, com as publicações em português sendo classificadas em outras línguas. “Se colocamos o filtro de pesquisa só em livros em português, acabamos não encontrando tudo”, diz Maroneze.
Ele utilizou o Google Livros na pesquisa sobre a palavra “abacaxi”. “Quase todos os dados de datações sobre os usos da palavra foram encontrados ali. Mas não é só digitar e pronto. É preciso imaginar que o vocábulo pode estar grafado de outra forma e tentar ortografias alternativas, como ‘abacachi’ ou ‘avacaxi’”, conta. Maroneze optou pela plataforma do Google porque ela permite encontrar todas as ocorrências de uma dada palavra em milhares de obras disponíveis no seu banco de dados. Já o Moedor é mais útil para comparar, nas obras inseridas no programa, as diferentes datas em que os vocábulos aparecem nos textos. “Para procurar o termo ‘abacaxi’ usando o Moedor, eu já preciso saber de antemão qual texto tem essa palavra, para poder inseri-lo no programa, que depois vai registrar sua datação”, diz o professor.
É difícil afirmar com precisão em que momento surgiu a curiosidade humana pela origem das palavras. No Ocidente, textos do filósofo grego Heráclito de Éfeso, escritos há mais de 2,5 mil anos, são talvez os primeiros registros desse interesse, de acordo com Viaro, e mais ainda o diálogo Crátilo, de Platão. Mas a etimologia só se tornou objeto de estudos na virada do século XVIII para o XIX, quando os pesquisadores passaram a fazer comparações sistemáticas entre vários idiomas. Na segunda metade do século XX, as pesquisas etimológicas perderam prestígio entre os linguistas. Isso ocorreu porque, sobretudo a partir do movimento estruturalista, a linguística deixou de se interessar pelo passado para se dedicar aos fenômenos contemporâneos da linguagem, à descrição de línguas minoritárias (principalmente as indígenas) e às suas relações com outras áreas do conhecimento, como a antropologia, a psicanálise, a neurologia e os estudos literários. Somente no fim do século XX, a linguística histórica recuperou seu espaço nas universidades.
Mesmo com a retomada, existem poucos pesquisadores no mundo que se dedicam exclusivamente ao assunto e podem ser considerados etimólogos em tempo integral. Em geral, eles se dividem entre a etimologia e outros ramos da linguística. No Brasil, os etimólogos não enchem uma sala de aula. Na base de dados do Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq), a busca pelos termos “etimologia” e “etimológico” resulta em apenas sete grupos de pesquisa. Desses, somente quatro têm desenvolvido trabalhos específicos sobre etimologia: dois grupos da USP, ambos ligados ao professor Viaro, o grupo da UFGD, ao qual o professor Maroneze é vinculado, e o Grupo de Pesquisa Nêmesis: Estudos do Léxico e da História da Língua Portuguesa, da Universidade Federal da Bahia (UFBA), que está desenvolvendo dois projetos, o Dicionário Etimológico de Português Arcaico e o Dicionário Dialetal Brasileiro. Nos cursos de letras, a etimologia é abordada como um tópico dentro da disciplina de linguística histórica. Na USP, apenas a pós-graduação tem um curso específico.
Na avaliação de Viaro, o cenário é desértico. “Não é como em outras áreas, como a sintaxe, por exemplo, que tem centenas de pessoas estudando e dá para fazer um congresso”, diz. Para Bizzocchi, a interrupção dos estudos ao longo do século XX tem reflexos até hoje na formação de novos pesquisadores. No caso brasileiro, ele atribui a escassez de etimólogos também a outro motivo: “Para você trabalhar com etimologia, precisa ser poliglota, ter uma cultura geral e uma cultura literária muito grande. E, infelizmente, a maioria das universidades hoje não está formando pessoas com esse perfil.”
O problema se agrava quando se trata de investigar palavras cuja origem está assentada nas línguas dos povos da África, pois nas universidades brasileiras faltam especialistas nesses idiomas. A palavra “cafundó”, por exemplo, é registrada em dicionários, como os de Cunha e Aurélio, como sendo “de origem africana”, sem especificar o idioma, ao contrário do que ocorre com vocábulos de origem europeia. E até hoje ainda restam dúvidas sobre a origem do termo “cafundó”. O Dicionário Houaiss traz a informação de que a etimologia da palavra é controversa, mas registra a hipótese do linguista Jacques Raimundo (1889-1959) de que viria do idioma ambundo. “Não tem ninguém que trabalhe com as línguas africanas, que são muitas e têm estruturas muito diferentes umas da outras. Então, não dá para generalizar”, lamenta Viaro.
Na USP, a Faculdade de Letras oferece apenas a disciplina linguística não indo-europeia, que trata, de forma alternada a cada ano, de línguas indígenas brasileiras e línguas africanas. Nesta última área existem as obras pioneiras de Jacques Raimundo, como O Elemento Afro-Negro na Língua Portuguesa (1933), e de Renato Mendonça, autor de A Influência Africana no Português do Brasil (lançado no mesmo ano). Mais recentes são os trabalhos do africanista Nei Braz Lopes, que publicou sete dicionários, entre eles o Novo Dicionário Banto do Brasil e o Dicionário Literário Afro-Brasileiro. O Dicionário Houaiss incorporou a explicação etimológica de Lopes em 250 verbetes.
Um obstáculo aos novos pesquisadores nos estudos da etimologia é a extrema dedicação que a disciplina exige. Somente para explicar a origem da palavra “zebra”, Viaro e o zoólogo Nelson Papavero dedicaram longo tempo ao assunto e escreveram um livro de quase duzentas páginas, intitulado O “Zebro”: Considerações Históricas, Sua Identificação e Distribuição Geográfica, Origem da Palavra “Zebra” e Considerações sobre Etimologia, publicado de forma online pelo NEHiLP. O trabalho desmonta hipóteses de que a palavra – registrada pela primeira vez no século IX – teria origem hebraica, árabe ou latina. Afirma que o mais provável é que venha do suevo, uma língua germânica já extinta. A origem estaria em uma palavra sueva da qual não há registro escrito e que se pronunciava assim, no alfabeto fonético: tseβra, com o significado genérico de “animal que serve para o sacrifício”. A partir do século XVI, o vocábulo, que por séculos designou diferentes tipos de equídeos, se espalhou do português para o resto do mundo (como zebra, em inglês, italiano, sueco, turco ou húngaro), já associado aos animais africanos famosos por suas listras. “É um trabalho de formiga. Cada palavra leva a uma pesquisa especial”, diz Viaro.
O Dicionário Etimológico da Língua Portuguesa dos pesquisadores da USP pretendia contribuir também para combater as pseudoetimologias que tanto preocupam os pesquisadores. São explicações fantasiosas para a origem das palavras que circulam na mídia e na internet. Por exemplo: a lorota de que a palavra “aluno” significa “sem luz”, pois seria formada pelo prefixo –a (que indica privação) e o termo latino lumni (luz). Ou que “criado-mudo” tem origem racista porque seria uma referência aos negros escravizados que faziam trabalhos domésticos. Na verdade, “aluno” vem do verbo latino alere, que significa “alimentar”. O aluno é, então, metaforicamente, uma pessoa a ser alimentada com conhecimento. A origem de “criado-mudo” ainda não foi fixada, mas uma das hipóteses é que vem do vocábulo inglês dumbwaiter (formado pelas palavras dumb, mudo, no inglês antigo, e waiter, garçom) e que designa uma plataforma móvel para passar os alimentos entre a cozinha e a sala de jantar. Pode ser ainda que venha de dumb servant (literalmente “criado ou servente mudo”), que designa um tipo de cabideiro, ou do francês serviteur muet (de novo, “criado ou servente mudo”), que se refere a uma espécie de mesa expositora de alimentos.
Em alguns casos, os próprios dicionários acabam sendo fonte de etimologias imaginárias. É atribuída a Antenor Nascentes a difusão da etimologia errônea da palavra “larápio”. Segundo o filólogo, “houve em Roma um pretor que dava sentenças favoráveis a quem melhor pagava. Chamava-se ele Lucius Antonius Rufus Appius. Sua rubrica era L.A.R. Appius. Daí chamar-lhe o povo larappius, nome que ficou sinônimo de gatuno”. Essa história, no entanto, não tem comprovação em nenhum documento histórico. Até hoje a origem da palavra é considerada obscura.
O ambicioso projeto de criar o Dicionário Etimológico da Língua Portuguesa, concebido por Mário Viaro, Bruno Maroneze, Aldo Bizzocchi e seus colegas, começou há dez anos, mas ainda vai demorar a preencher as lacunas. Há nove anos, o projeto não conta com financiamento público. A princípio, os recursos para as pesquisas viriam da USP, que, de acordo com Viaro, se comprometeu a repassar 300 mil reais por ano, durante três anos.
Ele conta que, em 2014, foi preciso negociar para que fossem assegurados ao menos os recursos para o pagamento dos bolsistas e do programador, de cerca de 100 mil reais, com o que a USP concordou. Em nota à piauí, a USP informou que, naquele ano, em razão da crise econômica no país, houve uma “consequente redução de recursos destinados ao orçamento da USP pelo governo estadual” e por isso a verba destinada aos Núcleos de Apoio à Pesquisa – como o de etimologia – teve que ser contingenciada, para que a instituição tivesse condições de arcar com as despesas obrigatórias.
Depois disso, o projeto do dicionário praticamente não recebeu mais recursos. Os pesquisadores passaram a buscar então fontes alternativas de financiamento e investiram até recursos próprios, como fez Viaro, que doou 3,8 mil reais para contratar uma empresa que ajudasse com o programa Metaplasmador. Os pesquisadores também foram atrás de recursos privados, sem sucesso. “Acabei desistindo de buscar parcerias desse tipo, pois achei muito complicado aliar os interesses dos financiadores e os do núcleo”, afirma o professor.
Bizzocchi diz que a falta de investimento em um projeto como o dicionário da USP está relacionada à visão de que as pesquisas em ciências humanas não trazem benefícios práticos. “Não existe uma aplicação tecnológica para esse nosso conhecimento, o que a gente gera é basicamente cultura”, afirma. “Os burocratas de plantão vão dizer que é preciso investir dinheiro em coisas que tragam soluções para os grandes problemas do país e saber a origem das palavras não é uma delas.”
Ex-professor de português na Universidade Federal do Rio Grande do Sul e criador do site Sua Língua, Cláudio Moreno, de 75 anos, é pessimista sobre o Brasil ter um dicionário etimológico à altura dos melhores do mundo. “Um dicionário etimológico envolve um mercado rico que compre e financie. Mas o português é uma língua muito paroquial”, diz Moreno, que publicou livros de divulgação, como Guia Prático do Português Correto, e mantém o bem-sucedido podcast Noites Gregas, sobre mitologia grega, sua outra especialidade. Ele ressalta que o dicionário Oxford tem por trás uma grande empresa, a Oxford University Press, com mais de 6 mil funcionários em 53 países, que vende produtos e serviços em quase cem idiomas. Só no atual projeto de revisão do dicionário inglês estão sendo investidos 34 milhões de libras (cerca de 200 milhões de reais).
Moreno planeja lançar um podcast sobre a língua portuguesa, em que a etimologia será um dos tópicos. “Quero contar histórias como a da palavra ‘búzio’, que se usa para fazer adivinhação ou pulseirinha. E mostrar como ‘buzina’ vem de ‘búzio’, porque esta palavra designa ‘caramujo’ na origem. Antigamente, se usavam búzios como trombetas. Até hoje nós vemos na Polinésia aquela figura do nativo soprando búzio”, diz Moreno. “Cada palavra contém a história de uma vida, de uma cultura. Tudo isso para mim dá prazer, é o prazer das palavras.”
O que ajudou a manter parcialmente, e por um tempo, os trabalhos do dicionário planejado na USP foram os estudantes com bolsas, que se incumbiram da tarefa pesada de alimentar o banco de dados. Entre 2017 e 2018, o NEHiLP chegou a ter dez bolsistas, reduzidos a quatro no biênio seguinte – dois deles sob orientação do professor Viaro. A USP explica que, nesse último período, houve um aumento expressivo no número de solicitações de bolsas, sem que houvesse um aumento equivalente no número de bolsas disponíveis. Isso “resultou na redução do número de bolsas distribuídas por projeto”, segundo a universidade.
De 2019 em diante, o número de bolsas no NEHiLP oscilou de quatro a seis e, com a interrupção do projeto do dicionário, os bolsistas passaram a se dedicar exclusivamente à produção de conteúdo sobre linguística para as redes sociais do núcleo. Aos poucos, os pesquisadores que integravam inicialmente a rede do projeto se dispersaram em razão de outros compromissos acadêmicos. “As pessoas não podem ficar disponíveis para sempre”, diz Viaro. Em paralelo, os programas computacionais desenvolvidos para a elaboração do dicionário começaram a apresentar problemas, como lentidão no banco de dados.
A situação se agravou quando adoeceu o professor Marco Dimas Gubitoso, do Instituto de Matemática e Estatística da USP, responsável por coordenar, desde o início, todo o braço computacional do projeto. Os pesquisadores levaram um susto, pois os dados coletados estavam até então no computador de Gubitoso e por pouco não se perderam. Foram recuperados, mas, em fevereiro do ano passado, o professor morreu, levando com ele boa parte do conhecimento sobre a programação do dicionário.
Para dar continuidade ao projeto da forma como foi idealizado, seria preciso fazer uma revisão dos cerca de 25 mil verbetes que foram retrodatados e continuar ampliando a base de dados. Além disso, com os problemas que apareceram, nem chegaram a ser desenvolvidas as etapas mais complexas da elaboração do dicionário, como a história das palavras coletadas. A parte de programação também precisaria ser toda refeita. Viaro considera que a única saída para conseguir recursos é rever o projeto original, de modo que possa se enquadrar em modalidades públicas de financiamento. Sua referência é o Dictionnaire Étymologique Roman, um projeto internacional que se dedica a pesquisar a etimologia do léxico comum às línguas românicas. A iniciativa já recebeu, desde 2008, mais de 700 mil euros de financiamento (em torno de 3,5 milhões de reais).
Depois que os programas começaram a apresentar problemas, em 2019, Viaro voltou a fazer pesquisas com métodos manuais. “Isso tomou muito tempo meu, até me prejudicou em alguns momentos do ponto de vista acadêmico.” Por fim, a plataforma usada pelos pesquisadores para atualizar o banco de dados do dicionário acabou sendo desativada – e Viaro diz que nem se lembra mais da senha de acesso.
Leia Mais