За растојанието меѓу јазиците

Секому му е јасно дека некои јазици се меѓусебно блиски, а други се оддалечени еден од друг. За јазиците во соседството се стекнува искуство во текот на животот, а за подалечните земји немаме вистинска претстава, освен ако човек патувал таму или има посебен интерес да ги разгледува тие прашања. Постојат повеќе илјади јазици и тие се групирани во зависност од нивното географско потекло и нивните особености. Поголемиот дел европски јазици ѝ припаѓаат на индоевропската група јазици, меѓу кои се словенските, романските и германските јазици. Јазиците се комплексна материја. Се разликуваат во зборовите (лексика), изговорот (фонетика), променливоста на обликот на зборовите (морфологија), редоследот на зборовите во речениците (синтакса), значењето и смислата на зборовите (семантика), граматиката и правописот. Во текот на историјата јазиците еволуирале оддалечувајќи се од заедничките корени. Просторната оддалеченост исто така дала свој придонес. Присутно е и повеќе или помалку застапено позајмување зборови од други јазици.
Во статија од П. Гамаљо, Х.Р.П. Кампос и И. Алегриа, објавена пред три години, пресметувано е меѓусебното растојание на 44 европски јазици и дел од добиените вредности е прикажан со табела во која се вклучени 30 парови на јазици.

Од тоа се гледа дека растојанието меѓу македонскиот и бугарскиот јазик е поголемо од растојанијата меѓу други 17 пара. Во книгата „Животот и смртта на Југославија“, објавена во 1992 г. од познатиот славист Пол Гард, професор на Универзитетот на Прованса, тој тврди дека разликите помеѓу македонскиот и бугарскиот јазик се поголеми од тие помеѓу српскиот и хрватскиот. Како да се определи растојанието меѓу два јазика со оглед на многубројните разлики што може да ги имаат?
Еден ист јазик, англискиот присутен на сите континенти, содржи голем број локални особености. Блиски јазици може да употребуваат различни писма, на пример српскиот и хрватскиот јазик. Покрај латиницата и кирилицата, постојат уште многу други писма, како што се арапските знаци и симболите употребувани во други земји, како Ерменија, Тајланд и други. Кинеското писмо е единствено за целата земја и логографите имаат едно исто значење, но нивниот изговор во одделни оддалечени региони е различен до степен на целосна неразбирливост. Природно е и арапските говори распространети од Атлантски Океан до Персиски Залив да содржат големи разлики.
За одредување на растојанието помеѓу различни јазици се применуваат повеќе начини. Најстар и често применуван е методот предложен во 1965 г. од советскиот и руски математичар Владимир Јосифович Левенштејн (1935-2017).

Тој вовел начин за одредување на растојанието помеѓу две низи од знаци (букви) дефиниран со минималниот број додадени, заменети или отстранети знаци потребни за двете низи да станат еднакви. На пример за да се стигне од зборот врата до зборот портир, треба в да се замени со п, да се додаде о, да се отстрани а, преостанатото а да се замени со и, и на крајот да се додаде р. Исто така пет чекори се потребни да се премине од зборот портир кон зборот врата. Според тоа, растојанието на овие два збора е еднакво на 5. За да немаат преголема тежина зборовите со поголем број букви, подоцна е воведена измена со нормирање на Левенштејновото растојание со делење на претходниот резултат со бројот на букви во подолгиот збор. На тој начин растојанието меѓу два збора не може да биде поголемо од еден, ниту помало од 0. Во разгледаниот пример, нормираното растојание изнесува пет шестини. Очигледно, споредбата може да се прави за јазици што употребуваат исто писмо. Средната вредност што се добива за растојанијата на одреден број зборови може да се смета како мера за оддалеченоста помеѓу два јазика.
Во истражувањата на поврзаноста на јазиците и нивната еволуција, како база често се употребуваат списоците зборови селектирани од американскиот филолог Морис Свадеш (1909 – 1967). Првобитниот список содржел 225 најосновни секојдневни зборови, а потоа е направен потесен избор од сто збора. За така избраните зборови се смета дека најмалку се менуваат со текот на времето. Други автори придонеле со свои видувања на изборот основни зборови и нивниот број. Споредбата на словенските јазици врз база на овие основни зборови укажува на лексички совпаѓања од 80 до 85 проценти.

Алтернативен начин за одредување на растојанието меѓу јазиците предложиле Б.Р. Чисвик и П.В. Милер (2004) врз база на податоците добиени од Л. Харт-Гонзалес и С. Линдеман (1993). Последниве го определувале степенот на усвоено знаење на странски јазик по одредено време на обучување од 16 и 24 недели на просечни американски граѓани со англиски мајчин јазик. Како знак за оддалеченоста помеѓу јазиците е земен степенот на стекнато знаење на одредениот јазик. Послабо знаење означува поголемо растојание на изучуваниот јазик во однос на англискиот, и обратно, подобро знаење претставува израз на поголема блискост на двата јазика. Податоците се однесуваат на 43 јазици.
За анализата што следува како основа е земен Концизниот речник на 26 јазици од Питер М. Бергман, објавен во 1968 г. На страниците како заглавни се дадени по четири англиски збора и потоа нивното основно значење е преведено на 25 јазици, меѓу кои неевропски се арапски, индонезиски, јапонски и свахили. Од словенските јазици се застапени рускиот, полскиот, српско-хрватскиот и чешкиот јазик. Речникот содржи илјада збора од секојдневната употреба, но постојат и исклучоци, како, на пример, зборовите амбасадор, конзулат, јастог и турпија за нокти. Присутни се и некои пропусти, на пример рускиот збор за мозок, мозг, на латиница е транскрибиран во mosk, а англискиот збор drug што има две значења во некои од јазиците е преведен како лек, а во некои како дрога. Изборот на зборовите во речникот во некоја апроксимација може да се смета како случаен, бидејќи содржи предимно секојдневни зборови, но изборот не е вистински случаен, бидејќи ги содржи имињата на сите месеци, деновите во неделата, броевите од 0 до 20 и уште некои броеви.

Написов содржи споредба на еквивалентите на следните јазици: македонски и бугарски, дански и норвешки, дански и шведски, норвешки и шведски и португалски и шпански. Тежинските фактори за секој пар еквиваленти, вкупно 6.998 (бидејќи за два нема соодветни еквиваленти), се доделувани на следниов начин. Ако еквивалентните зборови на парот споредувани јазици се пишуваат исто, доделениот тежински фактор е нула. Доколку корените на зборовите се исти и постои разлика во една, две или повеќе букви, соодветниот тежински фактор е еднаков на една четвртина, една половина, односно три четвртини. За зборови што се разликуваат целосно, факторот е еднаков на 1. Буква со дијакритички знак се смета за различна од буквата без таков знак. Доколку во македонскиот и/или бугарскиот јазик постојат синоними, земени се предвид тие што се поблиски или се идентични. Бугарските еквиваленти се преземени од двотомниот англиско-бугарски речник изработен од Т. Атанасова, Е. Машалова, М. Ранкова, Р. Русев и Г. Чакалов, редактиран од М. Минков и издаден во 1966 г.
Најденото средно растојание помеѓу зборовите од данскиот и норвешкиот јазик изнесува 0,25, помеѓу македонскиот и бугарскиот јазик е 0,36, помеѓу норвешкиот и шведскиот е 0,43, помеѓу данскиот и шведскиот е 0,47 и помеѓу португалскиот и шпанскиот е 0,49. Процена за грешката со која се одредени споменатите растојанија за соодветните парови изнесува 7, 7, 4, 5 и 3 отсто. Од разгледуваните 1.000 збора, во споредбата на данскиот и норвешкиот јазик, 498 се идентични, 257 се разликуваат во еден знак, 86 во два знака и 62 во повеќе од два знака, додека 97 збора со исто значење се пишуваат сосема различно.
Соодветните податоци за македонскиот и бугарскиот јазик се 389, 234, 102, 85 и 188; за норвешкиот и шведскиот се 248, 249, 187, 149, 167; за данскиот и шведскиот се 225, 218, 186, 171, 200 и за португалскиот и шпанскиот се 247, 200, 141, 135, 277.
И за други европски јазици може да се направат слични споредби, чешкиот и словачкиот, јазиците произлезени од српско-хрватскиот, босански, српски, хрватски и црногорски, луксембуршкиот јазик со неговите соседи и други. Очигледно е дека данскиот и норвешкиот јазик се многу поблиски од македонскиот и бугарскиот, а некакви претензии на таа основа не постојат.

Меѓу зборовите од различни јазици се среќаваат и лажни пријатели, термин воведен од француски лингвисти во 1928 г. за збор што има идентичен или близок изговор на различни јазици, но смислата на значењето на зборот во двата јазика не е иста, ниту блиска. На пример, дедо на португалски и шпански значи прст, англискиот збор за подарок (gift) на дански, норвешки и шведски значи отров. Вредност на македонски означува нешто што има цена, додека на бугарски означува нешто што е штетно. Самиот поим – лажни пријатели, се среќава и во секојдневниот живот и не само меѓу индивидуи.

Авторот е пензиониран професор на ПМФ