Az eszperantó helye a világ nyelvei között – korpusznyelvészeti vizsgálatok alapján

La loko de Esperanto inter la lingvoj de la mondo – laux korpuslingvistikaj esploroj

Bujdosó Iván, PhD

lekciisto de Esperanto-fako, Universitato ELTE

1.      Hipotézis az eszperantó nyelvről                     Hipotezo pri Esperanto

Az eszperantó nyelvi jellemzése már születése pillanatában felmerült. Lévén tervezett nyelv, legelőször azt kérték rajta számon, hogy mennyire teljesíti egy ideális nyelvtől elvárható kritériumokat. A mesterséges nyelvek alkotói két elgondolás közül választhatnak. Megalkothatnak egy filozófiai, vagy másképpen nevezve a priori nyelvet. Ezt Umberto Eco így jellemezte:

La lingva karakterizo de Esperanto ekestis samtempe kun gxia naskigxo. Cxar Esperanto estas planita lingvo, unue oni pridemandis gxin pri tio, kiom gxi plenumas la kriteriojn pretendeblajn de ideala lingvo. La kreantoj de la artefaritaj lingvoj povas elekti inter du konceptoj. Oni povas krei filozofian aux laux alia nomo apriorian lingvon. Umberto Eco karakterizis tiun cxi jene:  

… ha dolgokat, vagy fogalmakat jelölő karaktereket szeretnénk alkotni:először is szükségünk van a dolgok vagy fogalmak lajstromára. Minthogy pedig a természetes nyelvekben a szavak száma véges, míg a dolgoké (a fizikailag létezőktől kezdve a szellemi entitásokon át a különféle rendű és rangú akcidensekig) potenciálisan végtelen, ennélfogva a reális karakter megalkotásának problémája egyszerre egyetemes és valamilyen módon véges jelkészlet összeállításának kettős feladata elé állít bennünket. El kell döntenünk, hogy melyek a legáltalánosabb dolgok és fogalmak, ezt követően határozhatjuk meg a származékos fogalmakat az elemi jegyek összetételének elve szerint. A nyelvek által kifejezett összes lehetséges tartalmat szemantikai atomokból vagy jegyekből összeálló “molekuláris: szervezetként kell meghatároznunk (Eco 1998, 212).

„… se ni volas krei karakterojn karakterizantaj ajxojn aux ecojn: unue ni bezonas la inventaron de la ajxoj kaj ecoj. Cxar en la naturaj lingvoj la kvanto de la vortoj estas limigita, sed la kvanto de la ajxoj estas teorie nelimigita (tiuj estas la realaj ajxoj, la mensaj entoj kaj la diversaj neesencajxoj), tiel la problemo krei realajn karakterojn donas al ni duflankan taskon de kunmeto de signogarnituro jen universala jen iel limigita. Ni devas decidi, kiuj estas la plej gxeneralaj ajxoj kaj ecoj, poste ni povas difini la devenantajn ecojn laux la principo de kunmeto de elementaj proprecoj. Ni devas difini cxiujn enhavojn esprimeblajn de la lingvoj per „molekulaj” organoj, kiujn semantikaj atomoj aux signoj konsistigas” (Eco 1998, 212).     

A fenti irányban elvégzett kutatások nagyon sok és szép gyakorlati részeredményt hoztak. Ugyanakkor nem várhatjuk el, hogy a közeljövőben valamilyen végső eredmény fog megszületni. A dolgok, jelenségek modellben való ábrázolása csak bizonyos szintig lehetséges. A Newton által megállapított tömegvonzás törvénye a gyakorlatban csak két test, a Nap és a Föld viszonylatában kezelhető matematikailag. Az úgynevezett „háromtest probéma” megoldására (a Hold figyelembevétele) már nem elegendőek matematikai eszközeink. Itt már az elvi modell helyett egy gyakorlati értékekkel korrigált modell szükséges.

La esploroj en tiu direkto alportis vere multajn kaj belajn praktikajn partajn rezultojn. Sed tamen ni ne povas atendi ke en la proksima estonteco ia fina rezulto povu naskigxi. La montrado de ajxoj kaj fenomenoj per modeloj estas ebla nur gxis certa nivelo. La legxo pri gravito, kiun konstatis Newton, en la praktiko estas matematike manipulebla nur por du korpoj, la Suno kaj la Tero. Por solvi la tiel nomatan „trikorpan problemon” (la priatenton de la Luno) jam ne estas suficxaj niaj matematikaj rimedoj. En tiu cxi kazo estas bezonata modelo korektita per praktikaj datumoj anstataux teoria modelo.  

Ezért érthető, hogy a mesterséges nyelvek alkotóinak másik útja a létező nyelvek törvényszerűségeinek tanulmányozása és ezek alapján levonható elvek gyakorlati megvalósítása, majd ennek a gyakorlatban való kipróbálása felé vezet. A világon levő hatezer nyelv hatmilliárd beszélője nem tévedhet.

Tio klarigas, ke la vojo de la kreantoj de artefaritaj lingvoj kondukas al la studado de legxoj de ekzistantaj lingvoj, la fakta realigo de la tiel akireblaj principoj  kaj la elprovado en la praktiko. La ses miliardoj da parolantoj de la ses miloj da lingvoj ne povas erari.

A mesterséges nyelvekről a múlt század elején lefolyt vita nem tudott olyan döntő érvet felhozni az eszperantó ellen, ami alapján egy másfajta elvű mesterséges nyelv kidolgozása mellett kötelezték volna el magukat a közös nyelv hívei. Ezt talán legtömörebben Meillet szavaival adhatjuk vissza: “Minden elméleti vita hasztalan,: az eszperantó működik” (Meillet 1918, 268 idézi Eco 1998, 309).

La diskuto okazinta en la komenco de la pasinta jarcento pri la artefaritaj lingvoj ne povis produkti decidigan argumenton kontraux Esperanto, ke sur tiu bazo la adeptoj de la komuna lingvo sin estus devigintaj por prilaboro de alitipa artefarita lingvo. Tion ni povas redoni per la vortoj de Meillet: „Cxia teoria diskuto estas senutila: Esperanto funkcias” (Meillet 1918, 268 citas Eco 1998, 309).

Az eszperantó működéséről számos esetben szerezhetünk bizonyosságot. Az év minden napján megjelenik legalább egy könyv eszperantóul, az interneten beadott ‘esperanto’ szóra többmillió találatot jelez ki a kereső. Az internetes szabad szerkesztésű enciklopédia eszperantó nyelvű változata a 16. helyet (wikipedia 2005-10-14) foglalja el a rangsorban szócikkeinek számát tekintve (=28457 szócikk).

Pri la funkciado de Esperanto ni povas certigxi en multaj okazoj. Cxiutage en la jaro aperas almenaux unu libro en Esperanto, la retumilo donas plurajn  milionojn da trovoj por la entajpita vorto ’esperanto’. La esperantlingva varianto de interreta libere redaktebla enciklopedio okupas la 16-an lokon inter la lingvoj laux la kvanto de la difinitaj vortoj (= 28457 la 14-an de oktobro 2005).

Ennek ellenére nagyon sok emberben felmerül egy olyan aggály, ha nagyobb teret nyerne az eszperantó, vajon nem egy Gólemet indítunk-e az útjára, amely azután túlzottan rátelepszik életünkre. Ezek az esetleg tudatalatti félelmek abban nyernek kifejezést, hogy megpróbálják a nyelv minőségét, a nemzetek közötti információcserére való alkalmasságát megkérdőjelezni. Hogy talán ez a nyelv nem olyan, mint a többi, hogy “kilóg a sorból”. Az egyik amerikai egyetemen a hallgatók azt a feladatot kapták, hogy vizsgálják meg néhány nyelv statisztikai jellemzőit, és ez alapján erősítsék, vagy cáfolják meg az alábbi hipotézist: az eszperantó eltér az etnikus nyelvektől a nyelv szavainak eloszlását tekintve. (Hypothesis: Esperanto does not exhibit the scaling properties normally found in natural languages).

Malgraux tio en multaj homoj aperas skrupuloj. Se Esperanto ricevus pli grandan terenon, cxu ni ekirigus iaspecan Monstron, kiu poste tro forte influus nian vivon. Tiuj timoj eble nur subkonsciaj manifestigxas en tio, ke oni provas pridubigi la kvaliton de la lingvo, gxian tauxgecon por la informsxangxo inter la nacioj. Ke eble tiu cxi lingvo ne estas simila al la aliaj, ke gxi iel „ekstervicas”. La studentoj en iu Usona universitato ricevis la taskon priekzameni la statistikajn proprecijn de kelkaj lingvoj kaj surbaze de tio ili firmigu aux refutu la jenan hipotezon: Esparanto ne montras la lauxgradan distribuon de la vortoj, kiu karakterizas la naturajn lingvojn. (Hypothesis: Esperanto does not exhibit the scaling properties normally found in natural languages).   

2.      A nyelvstatisztikai vizsgálatok módszere. La metodoj de la lingvostatistikaj esploroj

G. K. Zipf harvardi nyelvészprofesszor volt, alapvető műve: Az emberi viselkedés és a legkisebb erőkifejtés elve. Ebben a művében Zipf olyan tényeket gyűjtött össze a különböző területekről, amelyek a természetben fellelhető szabályosság meglétét demonstrálták. Zipf fő érdeme az, hogy

G. K. Zipf estis profesor de lingvistiko en la Harvard, lia fundamenta verko: La principo de laj homa konduto kaj de la plej malgranda fortostrecxo. En tiu cxi verko li kolektis faktojn el diversaj terenoj, kiuj demonstras la regulecon en la naturo. La cxefaj meritoj de Zipf estis

a)         ő volt az első, aki azt feltételezte, hogy itt egy egyetemes törvényszerűségről van szó,

a) li estis la unua, kiu tezis, ke temas pri universala legxo,

b)        ő javasolt egy matematikai formulát ennek leírására,

b) li proponis matematikan formulon por gxia priskribo,

c)         alkalmas megjelenítéssel ezt evidenssé tett.

c) li faris la rilaton evidenta per konvena vidigo

A magyar nézők csak az elmúlt egy hónapban két előadást is láthattak a televízió Mindentudás Egyeteme műsorában: Csermely Péter beszélt a hálózatok erejéről (könyv alakban: Csermely 2005). A másik előadás előadója Barabási Albert-László volt (Duna Televízió 2005. október 11. Behálózva — A hálózatok csodálatos világa a sejtektől a világhálóig). Mindkét előadásban olyan hálózatokról volt szó, amelyek a Zipf-törvény hatálya alá esnek. Hétköznapi nyelven szólva, a Zipf-törvény azokat a jelenségeket írja le, amelyekben bizonyos típusú események elég gyakoriak, míg más típusú események ritkák. Például a magyar nyelvben a rövid szavak elég gyakoriak, (a, az, és), míg a hosszú szavak elég ritkák. Ha egy szó előfordulási gyakoriságát hasonlítjuk össze annak statisztikai rangjával, egy fordított arányosságot figyelhetünk meg Ez az alábbi képlettel adható meg:

La hungaraj spektantoj povis antauxnelonge vidi du prelegojn en la televida programo Cxioscia Universitato: Péter Csemely parolis pri la forto de la retoj (libroforme: Csermely 2005). La preleganto de la alia prelego estis Albert-László Barabási (Televido Duna, la 11-an de oktobro, 2005. Enretigite – La mirinda mondo de la retoj - de la cxeloj gxis la interreto). En ambaux prelegoj temis pri tiaj retoj, kiuj estas sub la povo de la Zipf-legxo. Simple dirite la Zipf-legxo priskribas tiujn fenomenojn, en kiuj certaj eventoj estas suficxe oftaj, kaj alitipaj eventoj estas maloftaj. Ekzemple en la hungara lingvo la mallongaj vortoj (a, az, és) estas suficxe oftaj, sed la longaj vortoj estas maloftaj. Se ni komparas la oftecon de vorto kun gxia statistika rango, ni povas observi inversan proporcion. Tio estas laux la suba formulo:

P(f) ~ 1/f

ahol P(f) mutatja egy f  rangú szó vagy esemény valószínűségét. A fizikában ehhez hasonló képletet találunk:

kie P(f) montras la versxajnecon de vorto aux evento kun la rango f. En la fiziko oni povas vidi similan formulon:

P(f) ~ 1/fn

azaz a Zipf-törvény ennek egy speciális esete. Ha n értéke 1, az az ideális eset. A Zipf vagy rózsaszín zajú eloszlás az emberi és természeti előfordulások nagy számában felfedezhetők. Ha ezt az eloszlást egy kétszeres logaritmus skálájú diagramban ábrázoljuk, egy meghatározott dőlésszögű egyenest kapunk. Általánosságban véve, a dőlés meredeksége 0-tól mínusz ¥-ig terjed, az ideális a -1 érték. A 0 meredekség az előfordulások egyenlő valószínűségét jelenti, például egy dobókocka által szolgáltatott értékeket. Ha a meredekség mínusz ¥ felé közelít, akkor egy kitüntetett jelenség van túlsúlyban. Ha a meredekség -1 közeli, ezt természetesnek érezzük és ezenfelül még esztétikailag kellemesnek, például a zenében, egy város szerkezetében vagy egy tájban.

nome la Zipf-legxo estas ties speciala kazo. Se la valoro de n estas 1, gxi estas la ideala kazo. La distribuo laux Zipf-legxo aperas en granda kvanto de la eventoj homaj aux naturaj. Se ni prezentas tiun cxi distrubuon sur duobla logaritma diagramo, ni ricevos rekton kun certa klino. Gxenerale la valoro de la klino estas ekde 0 gxis -¥, la ideala valoro estas -1. Se la klino estas 0, tiam la versxajneco de diversaj valoroj estas egala, ekzemple se ni rigardas la valorojn kiujn produktas jxetkubo. Se la klino proksimigxas al -¥, tiam unu certa fenomeno superpezas. Se la klino estas proksime al -1, tiam ni sentas la fenomenon natura kaj estetike agrabla, ekzemple en la muziko, en la struktiro de iu urbo aux en iu pejzagxo.

A fenti hipotézis vizsgálatához célszerűnek látszott, ha legalább három nyelvet választunk. Két nyelv vizsgálatánál ugyanis nem lehetne megállapítani, hogy az eszperantó “kilóg-e a sorból”. A választott három nyelv célszerűségi okokból a magyar, az eszperantó és az angol lett.

Por esplori la supran hipotezon ni elektu celhave almenaux tri lingvojn. Se ni elektus nur du lingvojn, ni ne povus scii, cxu Esperanto ektervicas aux ne. La elektitaj tri lingvoj pro oportuno estis la hungara, la angla kaj Esperanto.

3.      A vizsgálandó szövegek kiválasztása              La selekto de la esplorota teksto

Milyen jellegű szöveg lehet alkalmas vizsgálatunk számára? Több ilyen szöveg is számításba jöhet. Az egyik ilyen lehetőség a hazánkban Szatmári Sándor jól ismert Kazohinia könyve, amelyet a szerző – nyilatkozata szerint – eszperantóul írt meg és ő maga fordított le magyarra. Ez a regény angolul, illetve más nyelveken is megjelent.

Kiaspeca teksto povus tauxgi por nia esploro? Pluraj tekstoj povas esti konsiderataj por la celo. Unu el la ebloj estas la en Hungario bone konata libro de Sándor Szatmári: Kazohinio, kiun la auxtoro – laux lia deklaro – verkis Esperante kaj li mem tradukis gxin en la hungaran. Tiu cxi romano aperis angle kaj en aliaj lingvoj.

A másik választásom egy Rejtő Jenő regényre esett, gyakorlati szempontok figyelembevételével. A tizennégy karátos autó nem ismeretlen a magyar olvasók előtt, ez a regény volt egyike annak a két Rejtő regénynek, amelyik bekerült a Nagy Könyv verseny első 100 helyezettje közé. A második ok pedig az, hogy a hálón megtaláltam a regény magyar, angol és eszperantó nyelvű szövegét. Még egy ok szól a Rejtő regény választása mellett, éspedig az, hogy 27 Rejtő regény található az interneten eszperantó fordításban. Szövegstatisztikai szempontból ez felettébb érdekes és értékes, mivel vizsgálható lesz/lenne, hogy a korpusz nagyságának változásával hogyan alakulnak a szövegstatisztikai mutatók.

Mia elekto estas la romano de Jenõ Rejtõ, pro praktikaj konsideroj. La dekkvar karata auxtomobilo ne estas nekonata por la hungaraj legantoj. Tiu cxi romano estis unu el la du romanoj de Rejtõ, kiuj eniris en la 100 romanojn de la konkurso Granda Libro. La dua kauxzo estas, ke mi trovis en interreto la tekstojn de la romano en la lingvoj hungara, angla kaj Esperanto.  Estas ankoraux unu kauxzo, ke mi elektis tiun cxi romanon, nome, ke oni povas trovi en interreto 27 aliajn romanojn de Rejtõ en Esperanta traduko. Laux la esploroj de tekst-statistikajxoj tio estas tre interesa kaj valora, cxar ni povos/us esplori, kiel sxangxigxas la statistikajxoj kun la sxangxo de la korpusa kvanto. 

4.      A statisztikai jellemzők                                    La statistikajxoj

Nézzük meg a regény statisztikai jellemzői e három nyelven.

Ni rigardu la stastistikajxojn en tiuj cxi tri lingvoj

1.táblázat A regény statisztikai jellemzői


 


 

 

magyar/hungara

Esperanto

angol/angla

szóhossz átlag / aritmo de vortlongeco

5,63

4,81

4,39

szóhossz szórás / devio de vortlongeco

3,21

2,71

2,35

min

1

1

1

max

23

24

27

darab szó / kvanto de vortoj

44 096

54 190

62 317

féle szó / kvanto de apartaj vortoj

12 748

9 789

6 466

terjedelem (betű) / volumeno (litero)

248 380

260 896

273 775

rilato al la kvanto de la hungara teksto

100%

105,04%

110,22%

Feltűnő, hogy a szöveg magyar nyelven a legrövidebb. Ha ez általában is így van, érdemes a fordításért járó honoráriumunk kiszámítását az angol szöveg alapján kérni[1].  De még ennél is váratlanabb, hogy az eszperantó nyelvű szöveg is rövidebb az angol nyelvű szövegnél. Ezt a jelenséget érdemes lesz alaposabban megvizsgálni. Az eszperantó nyelvű szöveg rövidségének az is lehet a magyarázata, hogy az eszperantó betűkészlete 28 betű, azaz 4%-kal több mint az angol betűkészlete. További csökkentést jelent, hogy az eszperantóban nincs határozatlan névelő. Az első érvnek ellentmond az, hogy az eszperantó nyelvű szövegek rövidebbek a német nyelvűeknél is, holott a német nyelv betűkészlete (=29) nagyobb az eszperantóénál. Ezt a AIS[2] által kiadott szakkönyvek adatai alapján egyértelműen meg lehet állapítani, mivel ezek a könyvek kétnyelvűek. A kiadó a kognitív kétnyelvűség elvéből kiindulva megköveteli, hogy a szövegek párhuzamosan jelenjenek meg a szerző anyanyelvén és eszperantóul. Úgy vélik, hogy ez által

Estas okulfrape, ke la teksto estas la plej mallonga en la hungara. Se tio estas de gxenerala valido, ni insistu, ke oni kalkulu la pagadon por la tradukado laux la anglalingva teksto. Sed ecx pli neatendite estas, ke ankaux la esperantlingva teksto estas pli mallonga ol la anglalingva teksto. Ni ekzamenu iom pli tiun cxi fenomenon. La kauxzo de mallongeco de la Esperantlingva teksto povas esti, ke en Esperanto estas 28 literoj, do kun 4%-ojn pli ol literoj en la angla. Pluan mallongigon kauxzas, ke en Esperanto ne estas nedifinita artikolo. Tio estas argumento kontraux la unua konstato, ke la esperantlingvaj tekstoj estas pli mallongaj ol la germanlingvaj tekstoj, kvankam en la germana estas pli da literoj (=29), do pli multe ol tiu de Esperanto. Tion oni povas konstati sendube, cxar tiuj libroj estas dulingvaj. La eldonejo postuloj pro la principo de kogna dulingveco, ke la tekstoj aperu paralele en la la gepatra lingvo de la auxtoro kaj en Esperanto. Ili opinias, ke tiel

a) az eszperantó nyelvű terminológia fejlődik,

a) la terminaro de Esperanto evoluas,

b) a szerzők fordítás közben eltávolítják mind a két nyelvből a klisészerű kifejezéseket.

b) la auxtoroj forigas el la tekstoj de ambaux lingvoj la klisxecajn esprimojn.

Az általam megvizsgált könyvekben sok képlet található, ezek mindkét hasábhoz tartoznak (Frank & Franke 1997; Frank & Lobin 1998; Frank 1999; Frank & Maksimova 2004). Hogy a szövegek hosszúsága egy bekezdésen belül azonos legyen, ezért úgy szerkesztették ezeket a könyveket, hogy a párhuzamos német hasáb 10%-kal volt nagyobb az eszperantó nyelvű hasábnál. A fenti kiadványok mindegyike változatlan formában az interneten is hozzáférhető.

Estas multaj formuloj en la libroj ekzemenitaj de mi, kaj tiuj apartenas al ambaux kolono (Frank & Franke 1997; Frank & Lobin 1998; Frank 1999; Frank & Maksimova 2004). Por ke la longeco de tekstoj en unu paragrafo estu la sama, tial la redaktistoj donis al la germanlingva kolono pli grandan largxecon per 10%-oj. Tiuj eldonajxoj estas atingeblaj sensxangxe ankaux en interreto.

5.      A szavak gyakorisága hosszúságuk fügvényében La ofteco de la vortoj laux siaj longecoj

1. ábra A szavak gyakorisága hosszúságuk függvényében.

1. figuro La ofteco de la vortoj laux siaj longecoj

Feltűnő, hogy a magyar szavak hossz szerinti eloszlása mennyire eltér az angolétól és az eszperantóétól is. Illyés Gyula 1965-ben (Illyés 2002, 187 és a következő oldalak) arról értekezett, hogy “Szavaink nyelv és elmedermesztő terjedelmességét lényegtelen mellékkörülmény idézte elő”. Ezek közül egyik a német minta követése.

Estas okulfrape, ke la distribuo de la hungaraj vortoj laux longeco malsimilas al tiu de la angla kaj de Esperanto. Gyula Illyés en 1965 (Illyés 2002, 187 kaj la sekvaj pagxoj) parolis pri tio, ke „senesencajxo kauxzis la ampleksigxemon de la hungaraj vortoj, kio frostigas nian lingvon kaj menson”. Unu el tiuj estas la sekvado de la germana modelo.  

Hosszú — idegeneknek hosszú — szavaink gyártódásának másik titka, hogy nemcsak több főnév tetszhetik ekként egybekapcsolva egyetlenegynek, hanem a főnévvel egyetlen szónak vélhetők a hozzá tartozó ragok, határozók, elöl-, illetve utoljárók; a már érintett névmásokról nem is szólva.

„La sekreto de fabrikado de niaj longaj – por fremduloj – vortoj estas, ke ne nur pluraj substantivoj sxajnas vidigxi unu pro la kunligado, sed oni povas kredi, ke formas unu vorton kun la substantivo la finajxoj, adjektoj, prefiksoj kaj sufiksoj, kaj ne forgesante pri la pronomoj.”

Az eszperantó és az angol nyelv gyakorisági görbéje hasonló, azzal az eltéréssel, hogy az angol nyelv szavait írásrendszere hosszabbnak mutatja.

La ofteca kurbo de la anglaj kaj de la hungaraj vortoj estas similaj, kun la diferenco, ke la ortografio de la angla lingvo montras la vortojn de la angla pli longaj.

6.      A három nyelv szavainak rangsora                  Rangvico de la tri lingvoj

A Zipf-törvény szerint elkészítettem mind a három nyelvnél a szavak rangsorát és meghatároztam az ennek megfelelő gyakoriságot. A fenti ábra mutatja még az egyes görbékhez rendelhető regressziós egyeneseket, ezeknek a görbékkel számított korrelációját. Az alsó görbe a magyar, a középső az eszperantó, a felső az angol nyelv szavaira vonatkozik.

Mi pretigis laux la Zipf-legxo cxe cxiuj tri lingvoj la rangon de la vortoj kaj mi determninis la rangvicon. La suba figuro montras ankoraux la regresajn lineojn kaj la korelaciajn kvocientojn. La suba kurbo apartenas al la vortoj de la hungara, la meza al tiuj de Esperanto kaj la supra al tiuj de la angla.

2.ábra Gyakoriság a rangsor függvényében

2a figuro Ofteco laux la rango

 

Mint látható mind az angol, mind az eszperantó n együtthatója közel van a Zipf által ideálisnak mondott -1 értékhez. A magyar nyelvnél ez az érték irodalmi adatok szerint -0,8 kellene, hogy legyen (Füredi et al 2003, idézi Halácsy et al 2003, 215, 13 számú lábjegyzet), esetünkben  ez -0,75,  ennél jóval kisebb. A szógyakoriság mind a három nyelvben eleget tesz a hatványtörvénynek, ezt az R2 értékek mutatják, amelyek 1-hez közeli értékek.

Kiel oni povas vidi, jen la kvociento n de la angla, jen tiu de la hungara estas proksima al -1, la valoro opiniata ideala. Cxe la hungara lingvo tiu valoro estus -0,8 (Füredi et al 2003, citas Halácsy et al 2003, 215, piednoto numero 13), en nia kazo gxi esta -0,75, iom pli malgranda. La vortofteco en cxiuj tri lingvoj montrigxis konforma al la potenco-legxo, tion evidentigas ke la valoroj de R2-oj estas tre proksimaj al 1.

7.      A leggyakoribb 30 szó                                       La plej oftaj 30 vortoj

Az eszperantó szavak gyakoriságát többen vizsgálták. Ezek közül Gledhill munkáját tartják alapvetőnek. Összehasonlíthatjuk a jelenlegi eredményeket a Gledhill által kapott adatokkal (Gledhill, 1998, idézi Liu, 2001: 157). Az alábbi táblázat a rangsorban első 30 szót tartalmazza.

La oftecon de la Esperantaj vortoj ekzamenis pluraj homoj. Inter tiuj oni konsideras fundamenta la verkon de gledhill. Ni povas kompari niajn valorojn kun tiuj de Gledhill (Gledhill, 1998, citas Liu, 2001: 157). La suba tabelo enhavas la unuajn 30 vortojn laux rango.

2. táblázat Az első 30 szó gyakorisága a rangszám függvényében

2a tabelo La ofteco de la unuaj 30 vortoj laux rango

rang

Gledhill

Gledhill

eszp

eszp

magy

magy

ang

ang

1

la

25528

la

4534

a

3430

the

4201

2

de

12949

li

1550

és

1271

a

1622

3

kaj

10046

kaj

1275

az

1226

and

1443

4

en

5685

de

1182

egy

716

to

1414

5

al

4472

mi

1088

hogy

716

of

1374

6

mi

4235

en

853

nem

633

he

1145

7

estas

3804

vi

841

de

432

in

1132

8

ne

3713

estas

820

Gorcsev

392

you

1041

9

por

2925

ne

748

is

311

that

869

10

li

2701

al

681

úr

287

I

826

11

ke

2633

ke

557

volt

282

was

778

12

pri

2436

Gorĉev

415

ez

277

his

748

13

vi

1918

kun

413

Vanek

235

with

626

14

ni

1910

sed

395

ha

233

it

506

15

sed

1908

sinjoro

357

van

200

Gorchev

462

16

estis

1675

ĝi

345

mert

191

had

448

17

ili

1500

sur

335

mondta

166

on

439

18

kun

1394

estis

319

most

165

is

433

19

kiu

1390

ĉu

288

Csak

161

for

421

20

tiu

1330

kiu

281

én

161

this

419

21

tio

1229

lin

262

már

157

at

396

22

el

1207

ili

257

még

151

but

396

23

pli

1201

kiel

255

meg

149

him

379

24

kiel

1193

tion

238

Itt

138

Mr

325

25

oni

1178

ĉar

236

mint

136

be

309

26

ankaŭ

1026

tiu

234

Laboux

135

have

295

27

ĝi

986

Vanek

227

azt

134

me

291

28

per

936

diris

221

mi

123

as

287

29

sur

856

se

214

maga

119

my

286

30

se

843

oni

210

ezt

116

what

267

Gledhill anyaga és a Rejtő regény anyaga jó egyezést mutat. A Rejtő regény rangsor elején álló, azonos jelentésű eszperantó és angol nyelvű szavai szinte azonos rangszámúak.

La tekstoj de Gledhill kaj teksto de romano de Rejtõ montras bonan kongruon. La identaj Esperantaj kaj la anglaj vortoj en la Rejtõ-teksto starantaj cxe la komenco estas preskaux samrangaj.

8.      A szavak hosszúsága rangjainak függvényében. La longeco de la vortoj laux rango

 Zipf törvényét Mandelbrot kiegészítte és a szó rangja és hosszúsága közötti összefüggésre formulát alkotott. Az általunk vizsgált esetben az alábbiakat kaptuk. Az ábra a log függvénnyel közelített értékek alapján készült.

Mandelbrot aldonis la formulon de Zipf per la rilato inter la rango kaj de la longeco de la vortoj. En nia esploro ni ricevis la suban rezulton. La bildo montras la volorojn, kiuj ni ricevis per la logaritma regresia kurbo.

3. ábra A szóhossz változása a rangszám függvényében

3a figuro La sxangxo de la vortlongeco laux la rango

 

 

9.      A szavak szófaji besorolása                             La vortspeca difino de la vortoj

A szövegstatisztikai vizsgálatok legnagyobb problémája a szavak szófaji besorolása. Az eszperantó szavak végződése mutatja ezt. Az eszperantó nyelvű anyag feldolgozása szófaji bontásban:

La plej granda problemo de la tekst-statistikajxoj estas la vortspeca difino. La finajxo de Esperanta vorto montras gxin. La prilaboro de Esperantlingva teksto en la dismeto laux vortspecoj:

3. táblázat Az eszperantó szöveg felbontása szófajok szerint

3a tabelo La dismeto de la Esperantlingva teksto laux vortspecoj

 

ige

főnév

melléknév

határozó

tábl. szó

össz.

 

 

i

o

a

e

tabelvorto

sumo

 

 

9297

9750

4899

2795

5047

31788

 

jelen -as

2593

6212

2988

2672

3296

17761

egyes

múlt -is

4345

980

649

-

82

6056

többes –j

jövő -os

641

2155

1019

123

1638

5576

tárgyeset –n

felszólító -u

589

403

243

-

31

1266

többes tárgy –jn

feltételes -us

291

 

 

 

 

291

 

főnévi igenév -i

838

 

 

 

 

838

 

 

9297

9750

4899

2795

5047

31788

 

Az 1.számú táblázat szerint a könyvben 54.190 szó van. E szám és a fenti táblázatban szereplő 31.788 érték között jelentős a különbség.

Laux la 1-a tabelo en la libro estas 54190 vortoj. Inter tiu nombro kaj la valoro 31788 laux la supra tabelo estas granda la diferenco.

10.   Az eszperantó nyelvű szöveg szerkezetének kialakítására szolgáló szavak La vortoj kiuj servas por formi la strukturon de la Esperantlingva teksto

A nyelv formális szerkezetének kialakítására szolgáló szavak a gyakorisági sorrendben előkelő helyet foglalnak el. Mivel a Rejtõ regény túl hosszú volt, egy rövidebb szöveget vizsgáltam meg. Nézzünk meg egy táblázatot, ahol egy eszperantó nyelvű honlapszerkesztést tárgyaló szöveg (Luin, 2005-10-21) szavait állítottam sorrendbe, majd a ragozatlan alakokat, végül pedig a morfémákat. Mint látjuk, a morfémák sorrendjében a leggyakoribb kategóriajelek vannak elől, a főnév, melléknév, ige stb. jelölése.

La vortoj kiuj servas por formi la strukturon estas de unuaj rangoj. Cxar la romano de Rejtõ estis tro longa mi ekzamenis alian, pli mallongan tekston. Ni rigardu la tabelon, kie mi starigis en oftecan vicon la vortojn de Esperantlingva teksto temante pri la hejmpagxredaktado (Luin, 2005-10-21), poste la senfinajxajn vortformojn kaj fine la morfemojn. Kiel ni vidas, cxe la vico de la morfemoj staras en la unuaj lokoj la kategori-indikiloj por la substantivoj, adjektivoj, verboj, ktp.

4. táblázat Eszperantó morfémák rangsorrendben

4a tabelo Esperantaj morfemoj laux rango

rang

teljes szó

rag nélküli szó

morféma

a morféma jelentése

 

1

408

la

408

 la

754

 o

főnévi végződés

2

131

en

149

 vi

408

 la

névelő

 

3

114

vi

131

 en

401

 as

jelen idő

 

4

88

ke

131

 estas

389

 a

melléknév végődése

 

5

85

kaj

104

 ni

197

 on

főnév tárgyesete

 

6

83

estas

89

 mi

187

 oj

főnév többesszáma

 

7

74

de

88

 ke

178

 e

határozó

 

8

72

ni

85

 kaj

174

 en

-ban, -ben

 

9

65

al

83

 informante

169

 u

felszólító mód

 

10

60

ne

74

 de

149

 vi

te

 

11

50

per

66

 kodaro

142

 i

főnévi igenév

 

12

47

sed

65

 al

135

 est

van

 

13

45

mi

62

 kiu

122

 al

- hoz

 

14

44

kiel

60

 ne

104

 ni

mi

 

15

44

por

58

 tio

101

 aj

melléknév többesszáma

 

16

44

povas

54

 unu

90

 ojn

főnév többessz. tárgyeset

 

17

43

tio

52

 povas

89

 mi

én

 

18

41

informejo

51

 ĝi

88

 ke

hogy

 

19

40

ĉi

50

 per

88

 kod

kód

 

20

37

mia

47

 sed

85

 kaj

és

 

21

36

se

44

 kiel

84

 inform

információ

 

22

35

punkto

44

 por

84

 os

jövő idő

 

23

34

leciono

43

 pli

80

 il

eszköz képző

 

24

33

kiu

43

 punkto

77

 de

birtokos viszony

 

25

31

oni

42

 leciono

65

 ne

nem

 

26

30

nia

40

 ĉi

64

 an

valaminek a tagja

 

27

30

unua

40

 tiu

59

 don

ad

 

28

28

pli

40

 uzante

58

 ig

műveltetés

 

29

27

da

39

 aldonaj

55

 hav

bírtoklás

 

30

27

via

38

 linio

55

unu

egy

 

Egy hipotézist kockáztatok meg. Bickerton Nyelv és evolúció c. könyvében tanulmányozta a pidzsin és kreol nyelvek jellegzetességeit. Megállapítása szerint a pidzsin nem tekinthető igazi nyelvnek, az előnyelv kifejezést használja jellemzésére.

Mi estas kuragxigita fari hipotezon. Bickerton en sia libro Lingvo kaj specioj observis la proprecojn de la lingvoj pigxinaj kaj kreolaj. Laux lia konstato pigxina lingvo ne povas esti vera lingvo, li uzis la terminon prelingvo (antauxlingvo) por difini gxin.

… egyetlen genetikai esemény elég lehetett ahhoz, hogy az előnyelvet átfordítsa a szintaxissal rendelkező nyelvbe.

„… unusola genetika evento suficxis por turni la prelingvon je lingvo havanta sintakson.

Lehet, hogy ez az esemény csak annyiból állt, hogy az agynak azok a területei, ahol a lexikon tárolódik és azok a területek, ahol a cselekvések és események szerkezetét elemezzük, összekapcsolódtak (vagy a már létező kapcsolatok drámaian megerősödtek). Ezek a kapcsolatok aztán megakadályozták volna a szavak véletlenszerű összefűzését, és elősegítették a leírt egységekbe való gyors és automatikus szerveződésüket (Bickerton 2004:203).

Povas esti, ke la evento estis nur tio, ke kunligigxis (aux plifortigxis la jam ekzistantaj ligoj) tiuj areoj de nia cerbo, kie la leksikono storigxas kaj tiuj areoj, kie ni analizas la strukturon de la agadoj kaj okazajxoj. Tiuj cxi ligoj poste malpermesis la hazardan kunligon de la vortoj kaj helpis ilian rapidan kaj auxtomatan organizigxon en la menciitajn unuojn” (Bickerton 2004:203).

A hálózatkutatási tudomány a nyelvet is példái között emlegeti, nincs olyan cikk, amelyik ne mutatná be az angol szavak Zipf-törvény által leírt eloszlását. Ugyanakkor Barabási előadásában azt is bebizonyította, hogy a hálózatok rendkívül ellenállóak a véletlen hibákra, nem esnek szét, de rendkívül sebezhetők a nagy csomópontok meghibásodásával. Ezt a párhuzamot a nyelvre átvíve azt kapjuk, hogy ha megfosztjuk a nyelvet szintaxisától, az szétesik és előnyelvi színvonalú nyelvvé válik.

La scienco pri retoj cxiam mencias la lingvon inter la ekzemploj, ne ekzistas artikolo kiu ne montrus la distribuon de la anglaj vortoj laux la Zipf-legxo. Samtempe Barabási pruvis, ke la retoj estas tre rezistaj kontraux la hazardaj eraroj, ili ne disfalas. Sed ili estas vundeblaj cxe la grandaj nodoj. Se ni transmetas tian analogon al la lingvo, ni ricevas, ke se ni forigas la lingvon de gxia sintakso, gxi disfalas kaj ekestos prelingv-kvalita lingvo.

A fenti táblázatban a nagy csomópontok a szintaxis kialakításában szerepet játszó szavak. Ezek nélkül az eszperantó nyelvű szöveg előnyelvi, pidzsin szintre süllyedne. Az eszperantó művelői mindig ellenálltak azoknak a „jó tanácsoknak”, amelyek a többes szám, a tárgyeset, az alárendelő és mellérendelő mondatok kötőszavainak stb. eltávolítását kérték. Ugyanebből a meggondolásból kétségesnek tartjuk az olyan mesterséges nyelvek (például a nemrég beharangozott europanto) használhatóságát, amelyek csak az európai nyelvekben meglévő közös szavak meglétét használják ki, lemondva a nyelvtani elemek átgondolt megtervezéséről.

En la supra tabelo la gravaj nodoj estas la vortoj kiuj elformas la sintakson. Sen ili la Esperantlingva teksto sinkus je prelingva, pigxina nivelo. La flegantoj de Esperanto cxiam kontrauxstaris la „bonajn konsilojn”, laux kio ni forigu la pluralon, la akuzativon, la subordigan kaj kunordigan konjunkciojn ktp. Laux la sama rezonado ni trovas duba la uzeblecon de tiaj artefaritaj lingvoj (ekzemple la antauxnelonge disherolditan europanton), kiuj utiligas nur la komunajn vortojn enestante en la euxropaj lingvoj, rezignante pri la serioza planado de la gramatikaj strukturoj.

 

 

Irodalom                                                                    Literaturo

Bickerton, D.: Nyelv és evolució. 2004. Gondolat. Budapest.

Dominich, S., Kiezer, T., and Szlávik, Z. (2005). Zipf-törvény, kis világ és magyar nyelv. Magyar Nyelvtudomány, ISSN 1587-1061 (to appear)

Frank, H. & Franke, H.: Ästhetische Information/Estetika informacio. 1997. Akademia Libroservo. KoPäd München & SAIS Nitra.

Frank, H. & Lobin, G.: Sprachorientierungsunterricht/Lingvo-orientiga instruado. 1998. Akademia Libroservo. KoPäd München & SAIS Nitra.

Frank, H.: Klerigkibernetiko/Bildungskybernetik. 1999. Akademia Libroservo. KoPäd München & SAIS Nitra.

Frank, H. & Maksimova, N.: Informationstheorie/Informaciteorio. 2004. Akademia Libroservo. KoPäd München & SAIS Nitra.

Füredi et al 2003: A SZÓTÁR adatbázis. Kézirat.

Gledhill, C. 1998. The Grammar of Esperanto. A corpus-based description. München: Lincom Europa.

Halácsy et al 2003: A szógyakoriság és helyesírás-ellenőrzés. in: Magyar Számítógépes Nyelvészeti Konferencia, Szeged, 2003. december 10-11. (szerk: Alexin Zoltán és Csendes Dóra). Szeged.

Illyés Gy: Nehéz nyelv-e a magyar? vagy egy babona oszlatása in: A törzs szava Írások az anyanyelvről. Nap Kiadó. 2002.

LIU Haitao. 2001. Informadika Aspekto de Interlingvistiko. In: Sabine, F. / LIU Haitao (Red. / Hrsg.). 2001. Studoj pri Interlingvistiko / Studien zur Interlinguistik.  Festlibro por / Festsxhrift für Detlev Blanke. Dobřichovice (Praha): KAVA-PECH. 147-171

Zipf, G.K. (1949).  Human Behavior and the Principle of Least Effort, Addison-Wesley Press, New York

Források

Fontoj

Luin 2005-10-21 www.esperanto.net/veb: Enkonduko al HTML.

Wikipedia 2005-10-14 http://meta.wikimedia.org/wiki/List_of_Wikipedias

Rejtő Jenő La dekkvar karata auxtomobilo http://verkoj.fw.hu/04.htm

P. Howard The 14-Carat Roadster http://mek.oszk.hu/01000/01021/01021.htm

Rejtő Jenő A tizennégy karátos autó http://mek.oszk.hu/01000/01044/01044.htm

 

 

 



[1] Tersánszky Józsi Jenõ ezt nyilatkozta egyik interjújában.

[2] AIS Akedemio Internacia de la Sciencoj (Nemzetközi Tudományos Akadémia)