Esperanto: Dicionário X Gramática

3/novembro/2009

Legu esperante tie cxi!

Via de regra aqueles que se interessam por linguística em algum momento ouvem falar do Esperanto e acabam lendo alguma coisa a respeito. Eu ouvi falar do esperanto com uns 16 anos e com uns 17 lá estava eu, cabulando aulas de física para ir à biblioteca do Centro Cultural, onde há um curso de esperanto para autodidatas.  No começo, tudo muito bom, tudo muito simples, 16 regras gramaticais sem exceção que dão conta de um recado que nenhuma outra língua promete dar – mesmo com gramáticas de 500 páginas. É claro que não me tornei um falante exemplar – quem ler minha versão em esperento desta publicação vai notar,  só pelo volume de linhas, que eu não sou tão capaz assim em esperanto – mas eu sou um leitor atento.

E atentei pr’um negócio interessante: há um curso de esperanto no twitter, em espanhol. Sacada muito boa que mistura frases em esperanto e explicações curtas em espanhol, pra ajudar os estudantes. Uma das frases é esta aqui: “Kvar minus naŭ estas minus kvin.”. A tradução é simples: “Quatro menos nove é menos cinco.”

Por mim tranquilo, pelo menos no que diz respeito ao resultado da conta. A gramática esperantista diz o seguinte:

20.1.3 Kondicionalo: US-finaĵo

Kondicionala verbo, verbo kun US-finaĵo, estas uzata por agoj kaj statoj nerealaj, imagaj fantaziaj. US-formo ne montras la tempon de la ago.

Traduzindo:

20.1.3 Condicional: final -US

Verbo condicional, verbo terminado em US, é usado para ações e estados não-reais, imaginários ou fantasiosos. A forma em US (condicional) não demonstra o tempo do verbo.

Claro que fiquei encafifado, afinal, se as regras não permitem exceção no esperanto, minus deveria ser um verbo condicional, como “amaria, faria, mataria, gostaria, teria”, entretanto, pela frase do exemplo, minus não é verbo.

Fui, teimoso, ao dicionário Português-Esperanto, do site lernu.net. Procurando por “menos” ele propõe os termos em esperanto: malpli e minuso. Imaginei que o sujeito no twitter tivesse comido bola. Fui fazer o caminho inverso. Procurei “minus” no dicionário Esperanto-Português, Esperanto-Inglês e Esperanto-Esperanto. E estava ali:

Esperanto-Português: minus → menos (matemática)

Esperanto-Inglês:  minus → minus

Esperanto-Esperanto: minus → “forprenu la sekvantan”; minuso: la signo “-” en kalkulado (8-3=5 ok minus tri estas kvin) (trad: “retire do seguinte”; menos: o sinal “-” em cálculo (8-3=5 oito menos três é cinco)

Tendo explicado todo o problema a uma amiga que faz linguística na USP e já fez um curso de esperanto ela me perguntou: “Afinal, a frase tá certa ou tá errada?”

Pois é: A frase tá certa e tá errada! Tá certa pelo dicionário (minus existe e não é verbo) e errada pela gramática (se a palavra acaba em -us, é verbo). Parece que o esperanto é tão língua quanto qualquer outra, e nem quintentas páginas de gramática dariam conta de todas as regras nem de todas as exceções.



Devanagari

12/outubro/2009

O devanagari (em sânscrito देवनागरी) é um sistema de escrita silábico desenvolvido com base no silabário brahmi. Tem sua origem por volta de XI d.C. e é utilizado, ainda hoje, na Índia e no Nepal.

O sentido da escrita é da esquerda para a direita. Possui, em quase todas as sílabas, uma linha horizontal superior chamada mantra. Quase todas as sílabas possuem uma “vogal inerente a”. Para formar as diferentes qualidades de vogais são acrescentados diacríticos, conforme exemplo abaixo:

Sílaba Ka:Ka

Para formar, por exemplo, as sílabas ki, ku, kā, kām, kī, etc, devemos adicionar diacríticos à sílaba ka, que perde a vogal inerente para tornar-se outra sílaba, conforme imagem abaixo:


(clique na imagem para ampliar)

O traço que aparece sobre as vogais a, i e u indica que elas são longas. O r e o l com a bolinha significam, em lingüistanês, que o som é retroflexo, como o som do “r caipira”. Tanto o “r caipira” quanto o “l retroflexo” eram considerados sons vocálicos na gramática sânscrita.


Aprenda Catalão!

11/outubro/2009

O catalão é uma língua derivada do latim, como o português, o espanhol, o francês, o romeno e o italiano. Tem atualmente uns 9 milhões de falantes, de acordo com a wikipedia.

Eu não tenho nenhum interesse específico pelo idioma, mas,  definitivamente este é o curso de idiomas mais bem feito que eu já vi na internet. O curso é dividido em quatro níveis: Bàsic, Elemental, Intermedi e Suficiència.

Cada um desses níveis é dividido em unidades menores. O curso é gratuito, tem bons recursos de audio, dicionário, gramática, permite que o estudante faça gravações em Catalão para comparar com a pronuncia nativa e, até onde eu fiz, é bastante interessante.

Eu e a Mari (que foi quem me indicou o site) estamos competindo para ver quem finaliza o curso primeiro. Assim que ela ganhar ela virá escrever algum comentário em Catalão por aqui, pra se exibir e provar que o curso é bom mesmo!  =)


Biblioteca Digital Curt Nimuendaju

11/outubro/2009

Amigos,

Peço desculpas pela ausência e já prometo voltar com a corda toda!

Recomeço com uma tremenda dica de site: A Biblioteca Digital Curt Nimuendaju, que conta com uma série de textos (livros e artigos) raros e fora de catálogo sobre línguas e culturas indígenas Sul-Americanas, incluindo aí não somente os “índios de Terras Baixas” mas as populações andinas também! Dentre os autores disponíveis vale citar Paul Rivet, Padre Lemos Barbosa, Curt Nimuendaju, Padre José de Anchieta além de professores como Aryon Rodrigues e Lucy Seki, entre outros.

Abraços e até mais!


Estudo Histórico Comparativo: Línguas Tupis

21/abril/2009

Pessoal,

Segue meu trabalho de Lingüística Histórica, como prometi ontem (ou anteontem?!)

A Profª Luciana Storto corrigiu alguns detalhes sobre o Karitiana (que é a especialidade dela.) Segundo ela o verbo “pensar”, em Karitiana, não veio do português, como eu estava supondo no trabalho.

Como ela não leu o trabalho todo e como eu não corrigi todas as observações dela, as culpas pelos erros que ainda estão aí são minhas.

Outro detalhe: Alguns diacríticos e sinais do IPA não funcionaram no blogue, se alguém souber me dar uma dica de como corrigir o problema eu agradeço. É pena pq o vocabulário (que deu um trabalhão para ser digitado) acaba sendo publicado com algumas falhas!

Abraços,

Glotocronologia

Análise Lexical de três línguas Tupis

I. RESUMO

O presente trabalho busca traçar um breve estudo comparativo de três línguas indígenas faladas atualmente no Brasil e consideradas, por unanimidade entre os lingüistas, pertencentes ao Tronco Tupi.

O método comparativo utilizado é a Glotocronologia; trata-se de uma polêmica técnica que busca calcular a separação temporal entre duas ou mais línguas geneticamente aparentadas. Esta técnica consiste na comparação lexical entre os idiomas buscando verificar convergências entre a fonologia e a semântica de uma lista pré-definida de vocábulos conhecida por Lista de Swadesh.

Após o trabalho de comparação lexical, efetuamos os cálculos propostos por Swadesh para determinar o momento de separação entre cada uma das línguas. Ao final do trabalho buscamos verificar as convergências e divergências entre os resultados de nossa análise e as concepções mais aceitas pela lingüística moderna. O objetivo último do trabalho é avaliar criticamente a Glotocronologia demonstrando os pontos positivos e negativos da metodologia.

II. INTRODUÇÃO

É comum considerar o ano de 1786 como o ano de fundação da Lingüística Histórica. Neste ano, Sir Willian Jones apresentou sua famosa proposta que apontava para uma origem comum entre o grego, o sânscrito e o latim. A constatação das semelhanças lexicais e morfológicas entre as três línguas exigia uma explicação que descartasse a possibilidade do acaso. Desde o final do século XVIII até meados do século XX o estudo diacrônico das línguas indo-européias gozou de uma posição privilegiada na lingüística, continuando importante mesmo após o advento do estruturalismo.

A partir de meados do século XX, entretanto, observamos uma decadência considerável dos estudos que buscavam analisar a língua no eixo do tempo. Com Chomsky postulando a hipótese de princípios lingüísticos que deveriam estar presentes em todas as línguas do mundo – a Gramática Universal -, o estudo diacrônico perde espaço para o estudo sincrônico da língua. Noutras palavras, a lingüística deixa de lado a abordagem histórico-comparativa (diacronia) para atentar às línguas vivas do mundo (sincronia), buscando analisar e interpretar suas semelhanças e diferenças na busca de universais da linguagem.

No que tange às línguas indígenas brasileiras, é importante notarmos que, no momento em que a lingüística chega ao Brasil, os postulados teóricos da ciência estão mais voltados aos estudos sincrônicos do que ao estudo histórico-comparativo. Isto significa dizer que, enquanto o estudo histórico dos idiomas indo-europeus absorveu dois séculos de pesquisa, o estudo histórico dos idiomas ameríndios foi praticamente ignorado.

Apesar da ausência de uma longa etapa histórico-comparativa na América, não podemos ignorar que o Gerativismo, na busca de universais da linguagem, impeliu muitos estudiosos para a descrição dos idiomas indígenas e, com os dados colhidos por eles, pode-se fazer estudos na área de Lingüística Histórica.

O presente trabalho busca aplicar a Glotocronologia a três línguas indígenas pertencentes ao Tronco Tupi; o Karitiana, o Tupi e o Guarani. O Guarani e o Tupi são classificados dentro da família Tupi-Guarani, a mais numerosa família do Tronco Tupi. O Karitiana pertence à Família Arikém e é o único representante vivo desta família.

A Glotocrononogia se sustenta em três pressupostos teóricos:

“The first basic assumption of lexicostatistics is that some parts of vocabulary[1] of any language are assumed, on empirical evidence, to be much less subject to change than other parts. […] The second basic assumption is that the rate of retention of vocabulary is constant through time. […] The third basic assumption is that the rate of loss of basic vocabulary is approximately the same in all languages.” (GUDSCHINSKY, 1956:177)

O ponto central da Glotocronologia consiste na aplicação de uma fórmula matemática para calcular a distância temporal que separa uma língua de outra, supondo que ambas tenham uma origem comum. De acordo com Swadesh:

“The basis of this procedure is the counting of cognates in a given test vocabulary taken for two or more related languages. Experimentation shows that this method gives apparently consistent results approximately correlated with the actual divergence. Thus it becomes possible to obtain estimates of the time depth of any linguistic differentiation, qualified by the factor of degrees of contact.” (SWADESH,1954:326)

A partir da divergência entre os cognatos, Swadesh propõe – além do método para estimar o momento de separação dos idiomas no eixo do tempo – uma classificação dos idiomas em conceitos como: língua (de 100% a 88% de cognatos), dialeto (de 88% a 81% de cognatos), família (entre 81% e 36% de cognatos) e tronco (entre 36% e 12% de cognatos.). Para comparações com menos de 12% de cognatos são propostas as seguintes categorias:

  • Microfilo (entre 12 e 4% de cognatos)
  • Mesofilo (entre 4 e 1% de cognatos)
  • Macrofilo (menos de 1% de cognatos).

III. DADOS

Apresentamos, a seguir, a lista de vocábulos estudados. Os grifos correspondem às formas que, em nossa análise, foram considerados cognatos e possuem, desta maneira, uma origem comum. Não nos ocuparemos, neste trabalho, com a reconstrução dos fonemas originais das protolínguas que originaram cada um dos idiomas estudados. Tal reconstrução seria necessariamente falha tendo em vista que analisamos apenas três idiomas pertencentes a duas famílias distintas.

Guarani Karitiana Tupi V ocabulário
y ese i água (water)
pe, PE py apê ali (there)
apeju, ju kyrysiiry zu amarelo (yellow)
-jokua, -joJOKUA, -juvy, -kua, moXÃ soko’~i mu-ham amarrar (to tie)
-guata, -iko tek, taraka (v.i.) atá andar (to walk)
ma’et~y korahi`ar ano (year)
-mboPIJA pesek, ky’yr~ym (v.i.) apipik apertar (to squeeze)
a’e ‘aka (pron) on~y (a) aipo (invisivel), kwey (visivel) aquele (that)
aa, ‘apy haka, hypy (adv) apê aqui (here)
‘ITA ku’i eje’~in iwi-ting areia (sand)
yvyra ep `iw árvore (tree)
pepo papa’ep (s. poss) pepó asa (wing)
ye khonh, kõnh sepa (poss) riyé barriga (belly)
-jeAPI, -mbota, -pete m~i (vt m-) pyr’ot (vi) t~yg (ideog) itik bater (to beat)
-y’u ahy, se’y (vi) ‘y (vt) `u beber (to drink)
juru koromo (poss) zuru boca (mouth)
a’eve, porã se’a ét€ bom (good)
jyva nhõgõ (poss) ziwa braço (arm)
xi~i pok(a) karai (etn), -ting (cor) branco (white)
akã ‘o (poss) akãng cabeça (head)
‘a osop, osopot, sop (poss) a cabelo (hair)
jagua omãkymy’en (lit onça mimada), omãkypok zawar cachorro (dog)
-‘a, -kui ako, ‘ot (vi) pyg, paksik (ideog) apirar cair (to fall down)
ape, tape PIA pa, ky’op awa-rapé caminho (road)
-nheMONGETA, poraei h~yr~ynh mo-puratzey cantar (to sing)
o’o h~im, – pisyp, pisyp g~yjym~y ma`ê-rookwêr carne (flesh, meat)
pekue, pire pykyp (poss) iwir casca [de árvore] (bark)
-jo’o pyryk (vi) hiwi-kay cavar (to dig)
‘amba, yva pãmi iwak céu (sky)
-ny~e, tyny~e osykyry (a) por cheio (full)
et~u h~in, hynnãnã hiakwen cheirar (to smell)
akua opik~ijõ (poss) `âk chifre (horn)
kambu, pyte n~e’õm (vi)] za-piter (donde za=fruta redonda) chupar (to suck)
‘oky e (s) aman chuva (rain)
PETE~I nhiru~i yjpyt (a) po-éh~engwêr cinco (five)
uge, tata rUGUE tanimuk cinza (ash)
jai, AJI ra’y, mboi moroja moy-mboy cobra (snake)
py tyn héhé com (with)
-karu, -‘u pyt’y (vi) ‘y (vt) -sopa =goj (ideo) may`u comer (to eat)
marã rami, rami tikat maê-nungar? como? (how?)
puku, vuku horop, horowa (a) ku comprido (long)
koraxõ(pt), py’a han~impa (poss) `a coração (heart)
takipa ham corda (rope)
-nha, xyry hoho, tettet (ideog), pyk~yn (vi) iririk correr (to flow)
A’EVEa rami correto (correct)
-ape’aro, -aya, -kyx~i, -mboguai op~i (sin) ok~enh (pl) (vt), oky (vi) haw cortar (to cut)
-mbovyvy piparãmã (vt) mo-wiwik coser/costurar (to sew)
kupe, poata, pyxo okyty (poss) apê costa[s] (back)
apu’a ok~yn, tek (a) apêw-ahi curto (short)
-me’~e hit (vt) mé`~eng dar (to give)
tyso (sing), tysowãn (pl) (adv) de pé (standing)
-nhono, -no (v), -jupy, -tui (deitado) amo,n~eg 9vi) mu-zérêw deitado (lying)
a~i nhõnh (poss) RAY dente (tooth)
‘ara kat `ar dia (day)
AXU e’~ya rre awizêr-ha direito (right)
-‘e dizer (to say)
moko~i sypõm mukwi dois (two)
-ke kat (vi) t~e (ideog) kêr dormir (to sleep)
a’e, A’E va’e i (pron) a`ê ele (he)
idem eles (they)
em casa (at home)
em cima (above, up)
embaixo (below, down)
embotado (dull)
-moanha pimik(vt) mo-azan empurrar (to push)
ka’a (erva mate) ka`a erva (grass)
pyt~u nip, p~imõnh (a) pihun escuro (dark)
a’yxy, EMBIreko, YVY rygua sooj (poss) témi-rekó esposa (wife)
AXUa re põnh ahur réhé-har esquerdo (left)
ko, KOva’e ã ã este (this)
ovi põng estreito (narrow)
JAXY tata otirypo zahi-tata estrela (star)
xee y, ~yn, ~yn~y a eu (I)
perer~i,po’i ewet, pasawak, pym~ir~im ka`i fino (thin)
poty, ‘yvoty ewossit i-putir flor (flower)
ata iso tata fogo (fire)
ogue epesap huw folha (leaf)
ro’y, ro’y xã, yro’y ke’õn (a) ruwitzãng frio (cold)
‘a epe’o iwa fruta/o (fruit)
atax~i, tata rTAX~I iso nh~ig, nh~iga tata-ting fumaça (smoke)
-mboKUA, moMBU, jo’o atzaw furar (to pierce)
gelo (ice)
NHANDE va’e têko gente/pessoa (person/people)
kawêr gordura (grease)
guaxu, ja’ea, tuvixa, uxu tyy (sing) onyt (pl)(a) iwatê-katu grande (big)
ana, PO guaxu, pokã paneto, patyrat (a) anam grosso (thick)
ava awa homem (man)
rurú inchar (to swell)
-moMBO atik, pyn itik jogar/atirar (to throw)
embe koromoanep (poss) témê lábio (lip)
yy rUPA, yUPA esekarawa i-paw lago (lake)
PO ruxu, py ky’op, orowa, penot (a) pew-uhu (ser …) largo (wide)
-ei, -joi hõrõn (v t m-) êy lavar (to wash)
kamby nõmse (poss,materno) kami leite (milk)
apek~u, ayvu koromopi’yp (poss) apeku língua (tongue)
yxy~i saraka, k~yk~yn api-pêw liso (smooth)
kii, mombyry, puku opa (adv) mumiri longe (far)
jaxy oti zahi lua (moon)
aju, apeju, aguyje somõrõ (fruta madura) tiaro maduro (ripe)
xy, a’i (poss) ti (poss0 hi mãe (mother)
po py (poss0 po mão (hand)
para guaxu, yy E’~E i-ri-whu mar (sea)
me, YVY rygua, ir~u man (poss0 mên marido (husband)
-apyrupã, -juka oky (vt) zuka matar (to kill)
vai katu(i)`im mau (bad)
AVA’i my’~inã (inter. suponho port.) kunumi menino (boy, child)
ak~y semok aruru molhado (wet)
-xu’u okot (vt) nhõjak (vi) ti`u morder (to bit)
-JEREKO vai, -mano owi, pop, py’yw~ym (vi) mano morrer (to die)
eta, -‘i, MBOVY e’~y, PORÃ’i, rei, vai, vaipa harary, honnã, kana, pitat (a) etété muitos (many)
kunha nhõnso vide linha 94 kuñã mulher (woman)
-‘yta taktag (vi) i…moto-motôm nadar (to swim)
any, eme, e’~y, -i o’~i (interj) na-ani não (not)
ap~yi, x~i nhõpi’op (poss) ti nariz (nose)
pyt~u nip, mõnh pitun noite (night)
ery sat (poss) hêr nome (name)
nhande, ore yj (com vi), yjja (com vt)\ excl. yta yandé nós (we)
pyau, kunumi got, opit ta`i novo (new)
‘arai esyra, pãmpipok iwa-ting nuvem (cloud)
exa, exa rA’Y~I sypo (poss) hu-ângwêr olho (eye)
mamo ta’i awer-eté olho (eye)
nambi opirisap (poss) nami orelha (ear)
kã, kãgue ‘ep (poss) kãng osso (bone)
amboae, jevy, jo-, mboae otat, pojogo (a) amo outro (other)
endu énu ouvir (to hear)
upi’a sypi tupi`a ovo (egg)
-u ‘it (poss, h falando), syp (poss, mulher falando) ru(w) pai (father)
guyra ~inh wirá pássaro/ave (bird)
py pi `iw pé (foot)
‘ita kinapyti (ha varios nomes com funcoes, comop\ cortar, etc) itá pedra (stone)
pira ip pira peixe (fish)
ague, pire pa, pykyp (poss) hupê pele (skin, fur)
ague t~ym taw pêlo (body hair)
peludo (hairy)
ague sop (poss) hahi-haw pena (feather)
-p~exa (pt), po, -py’a koro’ophan (vi) pi`a têko pensar (to think)
-i, kyr~i, mir~i ‘~in a`i,miri pequeno (small)
etyma sa’ep (poss)\ tétima perna (leg)
katy, py’y’i mypi tariwe perto (near)
poyi pyti puhiy pesado (heavy)
aju’y, poxi’a hyto azu`iw pescoço (neck)
ky gep kiw piolho (louse)
ku’i iwi-ku`i pó/poeira (dust)
-u’u, ‘ar~e nãm (a) nem podre (rotten)
kyr~i,MOAPY’i, mbovi it (adv), pymyra, sypõm (a) a`i poucos (few)
u~u ~em karai-pihun (etn) pihun (cor) preto (black)
-moATÃ, -pira atej (vt) her~en (vt m-) ekiy puxar (to pull)
‘araka’e, jave, rami, vy tikat ma`ê-méhé? quando? (when?)
irundy otann~ym~ym uzey iru-irungatu quatro (four)
va’e, vaz’ejue, va’erã, -a mõramõn ma`e que [coisa]? (what?)
-apy, -kai pipop (vi), ‘y (vt) api queimar (to burn)
mava’e, va’e, va’ekue, va’erã, -a mhora ma`e nungar-te? quem? (who?)
aku oky quente (warm)
uguai peteppa(poss) tuay rabo (tail)
-mboA’Y, mboVO soky (vt) mo-tzorok rachar (to split)
apo epkyjymy (poss) hapo raiz (root)
-nhop~i gyri, joj, syk, kerit (ideo) ketkej (vi) kiwip (vt) mu-karay raspar (to rub grate)
apu’a, jere at~ynã põng redondo (round)
terep té-him reto (straight)
yakã ese, setti i rio (river)
-kuaa sonyp (um fato) é saber (to know)
juky TAWARA (A, SALDADO) zukir sal (salt)
endryry kyse (poss) héni saliva (spit)
uguy ge (poss) huwi sangue (blood)
ramo, vy, va’e rire, je-, jo- tykit amo se (if)
piru, ypa, ypi pipaseep tining seco (dry)
kak (vt) pyso (vi) mu zé-kok segurar (to hold)
nõm (poss) seio (bosom)
sypo a`iy semente (seed)
-iny t~enh (sing), tysyp (pl) u sentado (sitting)
YVYRA kyx~ia (acho que tem carga semantica de cortador) neso iwira-kiti-haw serra (mountain)
kuaray, nhamandu, nhanemoPU’Ãa go, gokyp korahi sol (sun)
-peju he, he’y, pyjeg (vi) mo-iwitu soprar (to blow)
ky’a ~em, opaammã, syyt kiti`im sujo (dirty)
kizê temer (to fear)
yvy eje’~in, ejepi iwi terra (earth, soil)
a’e javi, A’E JAVIve, pav~e, javi,pa akat~ym (adj) pame todos (all)
mboapy mukuy amo ma-irwi três (three)
YEkua tripas (guts)
ndee érê tu (thou)
pete~i pité`i um (one)
puru’ã piru`a umbigo (navel)
ap~e po-ape unha (nail, claw)
vamos para casa (let us go to home)
tuja, yma, YMAGUE azayu velho (old)
yvytu iwitu vento (wind)
-exa,-,a’~e etzak ver (to see)
ovy, pyau, ky, aky toki verde (green)
axo ahok verme/larva (worm)
pytã pitang vermelho (red)
-ju, juvy, tury, uvy mu-wo vir (to come)
-iko(viver) IKOve (permanecer -) téha-koy vivo (alive)
-veve wewew voar (to fly)
-mboJEVY huk vomitar (to vomit, puke)

Antes de iniciarmos a análise dos dados apresentados, convém esclarecer alguns detalhes acerca da tabela acima:

  • A ausência de fonte fonética, nos dicionários, é um fator que dificulta necessariamente a análise dos dados. Cada autor estabeleceu, em cada um dos dicionários, um método distinto de transcrição. Além da ausência de fonte fonética, vale dizer que nenhum dos dicionários estabeleceu marcação das sílabas nas traduções. Este fato dificulta, quando não impossibilita, a verificação de regras de mudança fonética.
  • O dicionário de Karitiana ignora, além das divisões segmentais, as peculiaridades supra-segmentais da língua, não marcando em nenhum lexema os tons da língua.
  • Optamos por manter, na transcrição, informações consideradas importantes pelos autores dos dicionários. Desta maneira formas verbais[1] em Guarani aparecem sempre antecedidas por “-” buscando evidenciar a necessidade de um morfema que a anteceda. Apesar de o dicionário de Karitiana e de Tupi não apresentarem a mesma metodologia, a formação verbal nos três idiomas é similar.
  • a ausência de fonte fonética, no envio dos dados para o blogue, gerou inconsistências que buscaram ser sanadas da melhor maneira possível. Vogais nasais que não permitem “~” foram marcadas com o “~” antes da vogal. O “´” representa parada glotal.

IV. ANÁLISE LEXICAL

É desnecessário ser lingüista para notar, rapidamente, que o Tupi e o Guarani têm uma proximidade lexical significativamente maior do que a proximidade existente entre os pares Karitiana e Tupi ou Karitiana e Guarani. É intuitivo supor que quanto maior a quantidade de vocábulos semelhantes entre duas línguas, maior é a proximidade genética entre elas. Rodrigues entende que “o maior ou menor grau de diferenciação observável entre as línguas em um dado momento é basicamente uma função do tempo decorrido entre o início do processo – a cisão da comunidade original – e o momento da observação.” (RODRIGUES, 1984/1985, 34)

A decisão de classificar cada unidade lexical como resultante ou não de uma mesma proto-forma se baseou em critérios de semelhança fonológica. As mais importantes regras gerais de semelhança fonológica verificadas são as seguintes:

A ocorrência de /x/ em Guarani tende a manter correspondência com a ocorrência de /t/ em Karitiana e /h/ em Tupi: xy > ti > hi (mãe), jaxy > oti > zahi (estrela), pyti > puhiy (pesado), xá > ham (corda), axo > ahok (verme).

A ocorrência de /gu/ e /v/ em Guarani tem correspondência fonética com /w/ em Tupi: jagua > zawar (caachorro), uguy > huwi (sangue), guyra > wira (pássaro), jyva >ziwa (braço), ava >awa (homem), veve > wewew (voar)

Ao /j/ em Guarani corresponde /z/ em Tupi: juru > zuru (boca), jyva >ziwa (pássaro), jagua>zawar (cachorro), juka > zuka (matar) aju’y > azu’iw (pescoço), juky > zukir (sal), ju > zu (amarelo).

A ocorrência de /y/ em Guarani corresponde /i/ em Tupi: xy > hi (mãe), jaxy > zahi (estrela), y > i (água), apy > api (queimar), ky > kiw (piolho), etyma > tetima (perna), pytũ > pitun (noite), xĩ > ti (nariz), kamby > kami (leite), mombyry > mumiri (longe).

Perda da oclusiva surda /t/ em início de palavras Guaranis, comparadas com palavras Tupis: ata > tata (fogo), etyma > tetima (perna), uguai > tuay (rabo), upi’a > tupi’a (ovo), embe > teme (lábio). A perda de /h/ em início de palavra é também comum em Guarani: apo > hapo (raiz), uguy > huwi (sangue).

Assimilação de fonemas oclusivos quando antecedidos por fonemas nasais (com mesmo ponto de articulação) no Tupi em relação ao Guarani: mbovyvy > mowiwik (costurar), embe > teme (lábio), kamby > kami (leite), mombyry > mumiri (longe), nambi > nami (orelha), amboae > amo (outro), endu > enu (ouvir).

Elisão das consoantes em coda (final de palavra) em Guarani e manutenção da coda em Tupi: jagua > zawar (cachorro), pyte > za-piter (donde za significa fruta) (chupar), ke > ker (dormir), me > men (marido), kã > kang (cabeça), juky > zukir (sal), axo > ahok (verme), pytã > pitang (vermelho).

O número de exemplos que demonstram semelhanças sistemáticas entre o Tupi e o Guarani são quantitativa e qualitativamente superiores em relação aos exemplos que demonstram regras de semelhança fonológica entre eles e o Karitiana. Meillet previra fatos como este em seu livro “O método comparativo em Lingüística Histórica” advertindo que “Les concordances sont moins frappantes et les règles de correspondances sont moins difficile à determiner si l’on observe des langues séparées par de plus grands intervalles dans l’espace et dans le temps”. (MEILLET, 1954:4)

V. APLICAÇÃO DAS FÓRMULAS

Para calcularmos a distância temporal entre os três idiomas contabilizamos, primeiramente, o número de palavras que ocorrem simultaneamente em cada um dos pares comparados. Após a contagem das palavras que compõe o corpus específico da comparação, contamos o número de itens lexicais considerados cognatos e calculamos a porcentagem de cognatos entre cada par de idiomas, conforme segue:

Tupi e Guarani Tupi e Karitiana Guarani e Karitiana
Palavras Comparadas: 176 107 148
Cognatos: 81 16 14
Porcentagem de Cognatos: 46% 14% 10%

As porcentagens de cognatos revelam que Tupi e Guarani pertencem a uma mesma família lingüística (46% de cognatos) e, de maneira aproximada (10-14% de cognatos), demonstram que o Karitiana pertence ao mesmo tronco lingüístico das duas primeiras línguas, não podendo ser classificado como pertencente à mesma família.

O cálculo que estabelece o distanciamento temporal entre duas línguas é baseado na seguinte fórmula, proposta por Swadesh:

i= log C / 2 log r

Onde i corresponde ao intervalo de tempo a ser calculado, C corresponde à porcentagem de cognatos e r representa uma razão constante de mutação do vocabulário básico da língua. Definida a partir de comparação entre os idiomas indo-europeus, esta constante (.805) é aplicada a qualquer comparação Glotocronológica e sua aplicação se escora nas bases teóricas do modelo, já expostas na introdução do trabalho.

Apresentamos, a seguir, os cálculos dos três pares possíveis de línguas:

Guarani e Tupi Tupi e Karitiana Guarani e Karitiana
porcentagem de cognatos: 46% 14% 10%
log de C -0.337242168 -0.853871964 -104.575.749
2*log de r -0.188408239 -0.188408239 -0.188408239
i (momento de separação) 1.789 4.532 5.550
1970 – i[2] 181 d.C. 2.562 a.C. 3.580 a.C.

A partir dos resultados calculados na tabela anterior, propomos a seguinte árvore para demonstrar as relações genéticas entre os idiomas estudados:

Proto-Tupi (Tronco)

3500 a.C. ↓

Proto-Tupi-Guarani-Ariquém

2500 a.C . ↓ ↓

180 d.C. Ariquém (Família) Tupi-Guarani (Família)

↓ ↓ ↓

Hoje Karitiana Tupi Guarani

A separação entre o Tupi e o Guarani ocorreu, de acordo com nossos cálculos, no início da Era Cristã, essa separação é classificada, na árvore genética, através da Família “Proto-Tupi-Guarani”. Diferentemente do que propõe a maior parte dos trabalhos históricos sobre idiomas ameríndios, propusemos, entre o Proto-Tupi-Guarani (Família) e o Proto-Tupi (Tronco), uma etapa intermediária que nomeamos “Proto-Tupi-Guarani-Ariquém”. A justificativa da inclusão desta etapa se baseia no fato de não podermos defender a idéia que a separação entre a Família Ariquém e a Família Tupi-Guarani corresponde ao Proto-Tupi. Noutras palavras, por sabermos da existência de outras famílias lingüísticas oriundas do Proto-Tupi, não podemos assumir a priori que o momento de diferenciação entre duas dessas famílias corresponde à cisão mais antiga de todo o Tronco.

Esta leitura só poderia ser feita se analisássemos, pelo menos, uma língua de cada uma das famílias descendentes do Proto-Tupi.

VI. CONCLUSÃO

Muitas críticas foram feitas à hipótese Glotocronológica propostas por Swadesh. Dentre elas destacamos as seguintes:

O fato de que a Glotocronologia trabalha apenas com lexemas, ignorando questões morfológicas e sintáticas muitas vezes importantes para a análise diacrônica dos idiomas. Ao ignorar, por exemplo, que a palavra “fumaça”, nos três idiomas estudados em nosso trabalho, é formada pela justaposição dos lexemas “fogo” e “branco” gerou a impressão de que Karitiana é mais distante da Família Tupi do que ele realmente deve ser. Isto se deve ao fato de os lexemas “fogo” e “branco”, em Karitiana, não serem cognatos com os lexemas Tupis e Guaranis. Entretanto, do ponto de vista morfológico, a semelhança é evidente e não deve ser descartada.

Outra crítica interessante e que repercute em nosso trabalho foi feita por O’GRADY, ao aplicar a Glotocronologia a línguas australianas; para ele a necessidade de se verificar em que medida os vocábulos propostos são realmente a-culturais era evidente, posto que os idiomas australianos (como os Tupis) não possuíam léxico para palavras como “gelo” ou “neve”. No caso do Karitiana, falado em Porto Velho, conceitos como “mar” também são inexistentes.

Outra questão que inspirou críticas por parte de lingüistas é que os cálculos propostos, baseados na analogia do carbono 14, só são possíveis mediante um postulado que, para Mattoso Câmara, é “o ponto mais controvertido de toda a teoria: […] [de] que a redução do vocabulário básico se processa, seja qual for a língua, numa velocidade constante…” (CÂMARA, 1959/1960:212)

Falando a respeito da analogia entre a lingüística e a biologia, o italiano Cavalli-Sforza diz, ainda, que “a glotocronologia é um método menos rigoroso do que os empregados em biologia e é particularmente difícil aplicá-lo a comparações distantes em que a fração e palavras cognatas de mais de 10 mil anos atrás é muito pequena. As listas de palavras não podem crescer, visto que apenas um número limitado delas muda lentamente. Além disso, cada palavra tem seu próprio ritmo de mudança, um fato relegado pela glotocronologia, que pressupõe uma taxa de mudança constante.”

Outro problema metodológico verificado merece destaque; alguns dicionários trazem os pronomes pessoais através dos morfemas pronominais “ixé, iandé, ore, etc” ao passo que outros apresentam os pronomes através das marcas morfológicas de conjugação verbal[3] “a-, ia-, o-, etc”, este fato também distancia erroneamente os idiomas analisados. Outras questões referentes à seleção dos dados nos dicionários decerto contribuíram para a ampliação da distância genética entre os idiomas.

Finalmente vale notar que, apesar de todas as palavras analisadas neste trabalho pertencerem ao que a Glotocronologia chama de “core vocabulary” (algo como o âmago da língua) e serem, portanto, avessas a empréstimos de outros idiomas, temos alguns exemplos de palavras de origem portuguesa nas línguas indígenas. Os exemplos, no nosso estudo, são: koraxõ e pẽxa (em Guarani) e myˤĩnã (em Karitiana). Outro fato referente a línguas indígenas brasileiras e que vai de encontro a esta leitura é o fato de o Pirahã -que ficou famoso em 2006 graças às críticas de Everett à Gramatica Gerativa- utilizar todos os pronomes pessoais do Tupi, sendo uma língua da Família Guahariban, Tronco Chirianan.[4]

Apesar dos problemas teóricos e metodológicos expostos acima, os resultados apresentados são, no que diz respeito ao Tronco e Família dos idiomas estudados, consoantes com as concepções mais aceitas acerca da classificação genética das línguas Tupis.

VII BIBLIOGRAFIA

CAVALLI-SFORZA, L.L Genes, Povos e Línguas, São Paulo, Companhia das Letras, 2003

CÂMARA JR., J.M. Crônica Lingüística in: Revista Brasileira de Filologia, Vol. 5, 1959/1960.

KEILER, A. R. Genetic Relationship among Languages, in: American Mathematical Society, Vol. 12, 1961

LESS, R.B. The Basis of Glottochronology in: Language, Vol. 29, Nº 2, 1953

MCQUOWN AND GREEENBERG, Classified Aboriginal Language of Latin America, in: Current Anthropology, Vol. 1, Nº 5-6, 1960.

MEILLET, A. Le Méthode Comparative en Linguistique Historique, Paris, Honoré Champion, 1954.

O’GRADY, G.N. More on Lexicostatistics in: Current Anthropology, Vol. 1 Nº 4, 1960

RODRIGUES, A.D. Lingüística tupi guarani in: Revista de Antropologia, Vol. 27/28, 1984/1985.

________. A classificação do Tronco Lingüístico Tupi in: Revista de Antropologia Vol. 12, 1985

________. Línguas Brasileiras – Para o conhecimento das línguas indígenas, São Paulo, Loyola, 1986.

SWADESH, M. Perspectives and problems of Amerindian Comparative Linguistics, in: WORD, Vol. 10, 1954.


[3] Isto provavelmente ocorreu porque a marcação pronominal de sujeito é um parâmetro que não é necessariamente marcado em idiomas Tupis.

[4] Classificação de McQuown, in Current Anthropology, Vol. 1, 1960. Apesar de termos um exemplo de empréstimo de pronomes pessoais entre línguas de troncos diferentes, devemos assumir que fatos como este devem ser extremamente raros.


[2] Estabelecemos o ano de 1970 como data-média de recolhimento dos dados lexicais das três línguas para a elaboração dos dicionários. Subtraindo i de 1970 chega-se ao momento de cisão entre os idiomas estudados, com base no calendário cristão.


[1] Este tipo de marcação ocorre não apenas com as formas verbais, mas também com qualquer morfema que não possa ser realizado isoladamente, como o morfema “-i” (pequeno) em Guarani.


[1] A parte do vocabulário que a Glotocronologia propõe como “menos sujeito a mudança” chama-se “core vocabulary” e é representada, na lista de Swadesh, por vocábulos considerados “não-culturais”.


O espanhol no Paraguai e a Glotocronologia

19/abril/2009

Pessoal,

Uma postagem rápida sobre o espanhol do Paraguai (ligando a realidade lingüística do Paraguai com a hipótese Glotocronológica do Morris Swadesh):

A população paraguaia tem a seguinte origem étnica: 95% da população é mestiça (índios guaranis e espanhóis), 3% é indígena e 2% é descendente de espanhóis.[1]

A realidade lingüística que essa ascendência étnica gera é interessante: O espanhol é tido como língua de prestígio e ensinado nas escolas. O Guarani é falado por grande parte da população, principalmente em casa. Numa relação lingüística como essa, o usual é que a língua do povo conquistador tome o lugar da língua do conquistado. É o que aconteceu, por exemplo, no Brasil, onde “Estima-se […] que desde a chegada dos portugueses houve a perda de 1.000 línguas, o que representa 85% das línguas existentes no território brasileiro no século XVI.”[2]. No Paraguai, entretanto, o Guarani possui alguma força e atualmente é matéria obrigatória nas escolas (Isso de ser matéria obrigatória é recente, veio com a última constituição do Paraguai, não tenho a data da constituição aqui, quando eu tiver um tempo eu pesquiso e coloco!)

Para Swadesh, que propôs o método Glotocronológico[3], alguns itens lexicais fazem parte de um “core vocabulary”, algo como o âmago da língua, e não são emprestados de uma língua pra outra. Swadesh usa este “core vocabulary” (uma lista de 207 itens lexicais) para calcular a distância genética entre duas línguas aparentadas geneticamente, já que as semelhanças entre as palavras, para ele, não podem ser originárias de empréstimos lingüísticos.

De acordo com Swadesh, todos os “pronomes pessoais” (eu, tu, ele, nós, vós, eles) fazem parte deste “âmago da língua” e nenhum falante, em nenhuma ocasião, utiliza o pronome de outra língua emprestado. Utilizando exemplos:

Podemos emprestar palavras novas, como “scanner” e dizer: 1. Ele quebrou meu scanner!

Mas nunca podemos dizer algo como: 2. *He quebrou minha fotocopiadora.

Pra mim está tudo bem! Para o Swadesh está tudo bem também, afinal, essa é a realidade da minha língua e do inglês. Mas há alguns contra-exemplo bastante interessantes, como o do Paraguai, que permite usar o pronome guarani e o restante da frase em espanhol. Ontem mesmo uma colega paraguaia conectou o MSN com a seguinte frase:

nde

O “nde” é o pronome de segunda pessoa do singular do guarani, e substitui o “usted” (formal), o “tu” (informal) e o “vos” coloquial do espanhol.

(A tradução da frase é: Você, me traz algo de lá!”)

Outro exemplo de incorporação (neste caso, plena) de pronomes pessoais de outra língua ocorreu com o Pirahã (famoso em guerras travadas na lingüística por conta das publicações de Everett apontando possíveis erros na Gramática Universal de Chomsky[4]). O Pirahã (família Mura), que não faz parte do tronco Tupi, utiliza todos os pronomes pessoais do Tupi.

Não é que eu não concorde que alguns itens lexicais são mais facilmente importados do que outros, mas é necessário ter em mente que qualquer definição do tipo “este grupo de palavras é a-cultural e menos propenso ao empréstimo” tem  tudo pra dar errado. A questão é que, no caso do Espanhol Paraguaio, ninguém nunca vai dizer que é geneticamente aparentado do Guarani e do Tupi, pois sabemos que foi um empréstimo relativamente recente. O nosso problema é utilizar essa técnica de comparação (e algumas outras) buscando comparar línguas indígenas ágrafas, e concluir que elas são mais próximas ou mais distantes do que realmente são, por um erro de conduta metodológica.

Amanhã eu posto uma comparação entre três línguas Tupis, utilizando a hipótese de Swadesh, para demonstrar algumas outras críticas à teoria dele.


[1] Os dados são daqui: http://www.portalbrasil.net/americas_paraguai.htm

[2] Lucy Seki,”A lingüística indígena no Brasil” in: Delta Vol. XVI, disponível aqui: http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0102-44501999000300011&lng=en&nrm=iso

[3] Mais sobre a Glotocronologia: http://pt.wikipedia.org/wiki/Glotocronologia

[4] Sobre a Língua Pirahã: http://en.wikipedia.org/wiki/Pirah%C3%A3_language


Orações interrogativas: comparação entre idiomas

14/abril/2009

Pessoal,

Segue um breve resumo sobre orações interrogativas[1] comparando o Português, o Inglês, o Alemão, o Tcheco, o Russo, o Swahili (língua Bantu africana) o Esperanto (língua artificial), o Paraná (língua indígena brasileira do tronco Jê) e o Quechua (língua indígena falada no Peru e Bolívia):

As línguas do mundo têm diferentes maneiras de demonstrar que a sentença proferida pelo falante é interrogativa. O Inglês e o Alemão, por exemplo, marcam a interrogativa através de alterações de ordem sintática. O Esperanto, o Paraná e o Quechua marcam a interrogação acrescentando um “morfema interrogativo” à oração, o Português e o Russo marcam a interrogativa alterando a entonação da sentença. O Swahili pode marcar a interrogativa morfologicamente (como o Esperanto, o Paraná e o Quechua) ou através da entonação (como o Português). O Tcheco pode marcar a interrogativa através da alteração da ordem sintática (como o Inglês e o Alemão) ou através da entonação (Como o Português).

Vamos aos exemplos, para facilitar:
Inglês e Alemão: a sintaxe indica a interrogação:

Alemão Inglês Tradução
Afirmativa Sie sind müde You are tired Você está cansado!
Interrogativa Sind Sie müde? Are you tired? Você está cansado?
Afirmativa Sie können mir helfen You can help me Você pode me ajudar!
Interrogativa Können Sie mir helfen? Can you help me? Você pode me ajudar?

Esperanto, Paraná e Quechua: a morfologia indica a interrogação:

Estas línguas usam um morfema para indicar a interrogativa; os morfemas são {cxu[2]} para o Esperanto, {a-} para o Paraná e {-chu} para o Quechua.

Exemplos:

Esperanto Tradução
Afirmativa Vi estas laca Você está cansado!
Interrogativa Cxu vi estas laca? Você está cansado?
Afirmativa Vi povas helpi min Você pode me ajudar!
Interrogativa Cxu vi povas helpi min? Você pode me ajudar?
Afirmativa Li laboras Ele trabalha!
Interrogativa Cxu li laboras? Ele trabalha?
Paraná[3] Tradução
Interrogativa Téseya, aty to tépi su? Téseya, ele foi pegar peixe?
Interrogativa Aty sy Mara hem pari? Ele cortou a árvore?
Quechua Tradução
Afirmativa Payqa takin Ele canta
Interrogativa Payqa takinchu? Ele canta?
Afirmativa Quchapampa Cochabamba
Interrogativa Quchapampachu? É Cochabamba?

Já o português e o russo não fazem nenhuma alteração de ordem sintática para evidenciar a diferença entre uma afirmativa e uma interrogativa. Tampouco inserem morfemas específicos para demonstrar a interrogativa, conforme exemplos:

Russo Tradução
Afirmativa Eto kniga Isso é um livro
Interrogativa Eto kniga? Isso é um livro?
Afirmativa Ty ustal Você está cansado.
Interrogativa Ty ustal? Você está cansado?

O Tcheco costuma fazer a interrogação como no inglês e no alemão (através de alteração sintática), mas é possível fazer a interrogação através da entonação:

Tcheco Português
Afirmativa To je kniha Isso é um livro
Interrogativa 1 (mais comum) Je to kniha Isso é um livro?
Interrogativa 2 (menos comum) To je kniha?[4] Isso é um livro

O Swahili tem duas alternativas para fazer interrogativas, uma delas usando a entonação e outra usando um morfema interrogativo {je-}

Swahili Português
Afirmativa Unaweza kunisaidia Você pode me ajudar
Interrogativa 1 Je, unaweza kunisaidia Você pode me ajudar?
Interrogativa 2 Unaweza kunisaidia? Você pode me ajudar?

De onde vieram os dados:

Os dados de português, inglês, esperanto e alemão são meus (inclusive eventuais erros), os dados de quechua foram retirados da Gramática de Quechua de Alfredo Quiroz Villaroel. Os dados de Swahili são do “Swahilli phrasebook“, da Ed. Lonely Planet. (Os autores são Martin Benjamin, Charles Mironko & Anne Geoghegan). Os dados do Paraná são da Luciana Dourado e podem ser encontrados no livro “Novos estudos sobre línguas indígenas”, organizado pelo Aryon Rodrigues e pela Ana Suely Arruda Camara Cabral. Os dados de tcheco são da Tereza Svarcova e os de Russo são da Mariana Marcoantonio, às quais agradeço (de verdade!!!) pela ajuda. =)


[1] Esta postagem trata apenas das orações interrogativas cujas respostas podem ser sim ou não. Há, ainda, as interrogativas “Qu-” (Wh- em inglês, “Ki-” em esperanto) cujas respostas não podem ser sim/não.

[2] Dentre as três, o esperanto é o único que tem o morfema livre, podendo ocorrer em qualquer posição na sentença. Aliás, ele pode ocorrer inclusive sem nenhum outro item anexado a ele, como em:

– Li edzigxos morgaux.        (Ele casará amanhã!)

– Cxu?                                    (Algo como “É?/Verdade?”)

[3] Não possuo exemplos de frases afirmativas em Paraná. De qualquer maneira, na afirmativa o morfema {a-} desaparece e o verbo deixa a periferia esquerda da sentença (de acordo com Dourado). Eu imagino que a afirmativa da primeira frase seria: “Téseya, ty tépi to su”.

[4] De acordo com a Tereza, esse tipo de interrogativa quase não se usa na linguagem normal.