Sinhrono-diahroni pregled krajšav v slovenskem prostoru in sestava slovarja krajšav Avtorica: dr. Mojca Kompara September 2018 Naslov Sinhrono-diahroni pregled krajšav v slovenskem prostoru in sestava slovarja krajšav Title Synchronic and diachronic overview of abbreviation in Slovene and the compilation of the dictionary of abbreviations Avtorica doc. dr. Mojca Kompara Author (Univerza na Primorskem, Fakulteta za matematiko, naravoslovje in informacijske tehnologije) Recenzija izr. prof. dr. Ivo Fabijanić Review (Univerza v Zadru, Oddelek za anglistiko) doc. dr. Jernej Vičič (Univerza na Primorskem, Fakulteta za matematiko, naravoslovje in informacijske tehnologije) Jezikovni pregled Tjaša Benedičič, dipl. jezik posred (UN), mag. tur. Proofreading Tehnični urednik Jan Perša, mag. inž. prom. (Univerzitetna založba Univerze v Mariboru) Technical editor Oblikovanje ovitka Jan Perša, mag. inž. prom. (Univerzitetna založba Univerze v Mariboru) Cover designer Grafične priloge Avtorica Graphic material Izdajatelj in založnik / Published by Univerzitetna založba Univerze v Mariboru Slomškov trg 15, 2000 Maribor, Slovenija http://press.um.si, zalozba@um.si Izdaja Prva izdaja Vrsta publikacije e-knjiga Dostopno na http://press.um.si/index.php/ump/catalog/book/355 Izdano Maribor, september 2018 © Univerzitetna založba Univerze v Mariboru Vse pravice pridržane. Brez pisnega dovoljenja založnika je prepovedano reproduciranje, distribuiranje, predelava ali druga uporaba tega dela ali njegovih delov v kakršnemkoli obsegu ali postopku, vključno s fotokopiranjem, tiskanjem ali shranjevanjem v elektronski obliki. Tisk je sofinancirala Univerza v Marioboru, Fakulteta za turizem. CIP - Kataložni zapis o publikaciji Univerzitetna knjižnica Maribor 811.163.6:003.083(03) KOMPARA, Mojca Sinhrono-diahroni pregled krajšav v slovenskem prostoru in sestava slovarja krajšav [Elektronski vir] / avtorica Mojca Kompara. - 1. izd. - Maribor : Univerzitetna založba, 2018 Način dostopa (URL): http://press.um.si/index.php/ump/catalog/book/355. - Nasl. v kolofonu: Synchronic and diachronic overview of abbreviation in Slovene and the compilation of the dictionary of abbreviations ISBN 978-961-286-180-3 doi: 10.18690/978-961-286-180-3 1. Dr. vzp. stv. nasl. COBISS.SI-ID 95112449 ISBN 978-961-286-180-3 (PDF) 978-961-286-181-0 (Mehka vezava) DOI https://doi.org/10.18690/978-961-286-180-3 Cena brezplačni izvod Odgovorna oseba založnika red. prof. dr. Zdravko Kačič, rektor Univerze v Mariboru SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV M. Kompara Sinhrono-diahroni pregled krajšav v slovenskem prostoru in sestava slovarja krajšav MOJCA KOMPARA1 Povzetek Avtorica celovito preuči položaj krajšav v slovenskem prostoru, in sicer na diahroni in sinhroni ravni. Delo sestoji iz devetih poglavij, v katerih se dotakne klasifikacije krajšav in položaja krajšav v slovenskih pravopisih od leta 1899 do 2001 ter v izbranih jezikovnih priročnikih. V delu so podrobneje predstavljeni položaj krajšav v splošnih in specializiranih slovarjih, in sicer z vidika mikro- in makrostrukture, Župančičev slovar (1948), Slovarček krajšav (2006) in Slovar krajšav (2011). Avtorica preko problematike načrtnega sestavljanja krajšav bralca usmeri k potrebi po sestavi algoritma za samodejno prepoznavanje krajšav in krajšavnih razvezav ter podrobneje predstavi algoritme, ki so bili izdelani med letoma 1999 in 2016. Skozi celotno delo opozarja na potrebo po sestavi sodobnega slovarja krajšav, predstavi smernice za pridobitev gradiva za nastanek takega slovarja ter predstavi sestavo slovarskega sestavka novega slovarja krajšav. Ključne besede: • slovar • krajšava • algoritem • leksikografija • slovar krajšav • NASLOV AVTORICE: dr. Mojca Kompara, docentka, Univerza na Primorskem, Fakulteta za matematiko, naravoslovje in informacijske tehnologije, Glagoljaška ulica 8, 6000 Koper, Slovenija, e-pošta: mojca.kompara@famnit.upr.si. DOI https://doi.org/10.18690/978-961-286-180-3 ISBN 978-961-286-180-3 © 2018 Univerzitetna založba Univerze v Mariboru Dostopno na: http://press.um.si. SYNCHRONIC AND DIACHRONIC OVERVIEW OF ABBREVIATION IN SLOVENE AND THE COMPILATION OF THE DICTIONARY OF ABBREVIATIONS M. Kompara Synchronic and diachronic overview of abbreviation in Slovene and the compilation of the dictionary of abbreviations MOJCA KOMPARA2 Abstract The author presents the position of abbreviations in Slovene, highlights the need of a dictionary of abbreviations, and presents the guidelines for obtaining the compilation material and the dictionary article of the new dictionary of abbreviations on a diachronic and synchronic level. The monograph consists of nine chapters where the classification of abbreviations and the position of abbreviations in Slovene orthographic dictionaries from 1899 to 2001 and selected language manuals are presented. The detailed position of abbreviations in general and specialized dictionaries, in terms of micro- and macrotexture, as well as the dictionaries of abbreviations from 1948, 2006 and 2011 are presented. The algorithm for automatic recognition of abbreviations and expansions, and algorithms prepared between 1999 and 2016 are presented through systematic compilation of abbreviations. The author outlines the need of a modern dictionary of abbreviations and presents the dictionary article of the new dictionary of abbreviations. Keywords: • dictionary • abbreviation • algorithm • lexicography • dictionary of abbreviations • CORRESPONDENCE ADDRESS: Mojca Kompara, Ph.D., Assistant Professor, University of Primorska, Faculty of Mathematics, Natural Sciences and Information Technologie, Glagoljaška ulica 8, 6000 Koper, Slovenia, e-mail: mojca.kompara@famnit.upr.si. DOI https://doi.org/10.18690/978-961-286-180-3 ISBN 978-961-286-180-3 © 2018 Unviersity of Maribor Press Avaialble at: http://press.um.si. Zahvala Delo ne bi ugledalo luči sveta brez posluha in pomoči recenzentov izr. prof. dr. Iva Fabijanića in doc. dr. Jerneja Vičiča. Zahvala gre tudi lektorici mag. Tjaši Benedičič, ki je z jezikovnega stališča skrbno pregledala delo. Hvala tudi vsem, ki so mi stali ob strani pri pisanju dela in mislili name. Hvala mojemu Petru, staršema Marini in Milošu, Tjaši ter Marku in Vladki. SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV M. Komparai Kazalo UVOD .............................................................................................................................. 1 1 NASTANEK IN KLASIFIKACIJA KRAJŠAV ......................................... 5 1.1 Klasifikacija krajšav po Rodetu ....................................................................... 7 1.1.1 Okrajšave ............................................................................................................ 8 1.1.1.1 Nesestavljene okrajšave .................................................................................... 8 1.1.1.2 Sestavljene okrajšave ......................................................................................... 8 1.1.2 Kratice ................................................................................................................. 8 1.1.2.1 Inicialne kratice .................................................................................................. 8 1.1.2.2 Zlogovne kratice ................................................................................................ 9 1.1.2.3 Kombinirane kratice .......................................................................................... 9 1.1.3 Znamenja in simboli .......................................................................................... 9 1.2 Neustaljenost terminov ................................................................................... 10 2 DIAHRONO-SINHRONI ORIS KRAJŠAV V SLOVENSKEM PROSTORU .................................................................................................... 11 2.1 Krajšave v slovenskih pravopisih med letoma 1899 in 2001 .................... 11 2.1.1 Levčev pravopis iz leta 1899 .......................................................................... 11 2.1.2 Breznikov pravopis iz leta 1920 .................................................................... 12 2.1.3 Breznikov in Ramovšev pravopis iz leta 1935 ............................................ 13 2.1.4 Breznikov in Ramovšev pravopis iz leta 1937 ............................................ 14 2.1.5 Pravopis iz leta 1950........................................................................................ 14 2.1.6 Pravopis iz leta 1962........................................................................................ 16 2.1.7 Krajšave v Slovenskem pravopisu 1, pravila iz leta 1990 .......................... 18 2.1.8 Krajšave v Slovenskem pravopisu iz leta 2001 ........................................... 20 2.2 Krajšave v izbranih informativno-normativnih jezikovnih priročnikih .. 23 2.2.1 Krajšave v Slovarju novejšega besedja slovenskega jezika (2012) ............ 23 2.2.2 Krajšave v Konceptu Novega razlagalnega slovarja slovenskega knjižnega jezika (2015) ...................................................................................................... 29 2.2.3 Pregled krajšav v Slovarju pravopisnih težav (2014) oz. ePravopisu (2017) ............................................................................................................................ 31 ii Kazalo 2.2.4 Pregled okrajšav v Slovarju pravopisnih težav (2014) oz. ePravopisu (2017) ................................................................................................................. 31 3 KRAJŠAVE V SPLOŠNIH IN SPECIALIZIRANIH SLOVARJIH ... 37 3.1 Pregled krajšav v Slovarju slovenskega knjižnega jezika ........................... 37 3.2 Pregled krajšav v Slovarju slovenskega knjižnega jezika SSKJ2 (2014) .. 38 3.3 Primerjava SSKJ in SSKJ2.............................................................................. 47 3.4 Pregled krajšav v eSSKJ (2016) ..................................................................... 50 3.5 Krajšave v splošnih tujejezičnih slovarjih .................................................... 51 3.5.1 Krajšave v angleških slovarjih ........................................................................ 51 3.5.2 Krajšave v italijanskih slovarjih ..................................................................... 52 3.5.3 Krajšave v nemških slovarjih ......................................................................... 53 3.5.4 Krajšave v španskih in francoskih slovarjih ................................................ 53 3.6 Zastopanost krajšav v krajšavnih slovarjih .................................................. 54 3.6.1 Angleški krajšavni slovarji .............................................................................. 54 3.6.1.1 Everyman's Dictionary of Abbreviations .................................................... 54 3.6.1.2 The New Penguin Dictionary of Abbreviations ......................................... 56 3.6.1.3 Abbreviations Dictionary ............................................................................... 56 3.6.1.4 World Guide to Abbreviations of Organizations ....................................... 57 3.6.1.5 Dictionary of Abbreviations and Acronyms ............................................... 57 3.6.1.6 Abbreviations and Acronyms ........................................................................ 58 3.6.1.7 Acronyms, Initialisms and Abbreviations Dictionary ................................ 59 3.6.1.8 The Barnhart Abbreviations Dictionary ...................................................... 59 3.6.1.9 The Dictionary of Acronyms and Abbreviations in Applied Linguistics and Language Learning ................................................................................... 60 3.6.1.10 Elsevier's Dictionary of Acronyms, Initialisms, Abbreviations and Symbols ............................................................................................................. 60 3.6.2 Nemški krajšavni slovarji ................................................................................ 61 3.6.2.1 Das Wörterbuch der Abkürzungen .............................................................. 61 3.6.2.2 Großes Abkürzungsbuch ............................................................................... 62 3.6.2.3 Wörterbuch Abkürzungen ............................................................................. 63 3.6.3 Italijanski krajšavni slovarji ............................................................................ 63 3.6.3.1 Dizionario di Sigle, Abbreviazioni e Simboli .............................................. 63 3.6.3.2 Dizionario delle Sigle e degli Acronimi ........................................................ 64 3.6.4 Francoski in španski krajšavni slovarji ......................................................... 64 3.6.4.1 Dictionnaire des Abréviations et Acronymes ............................................. 64 3.6.4.2 Diccionario General de Abreviaturas Españolas ........................................ 65 Kazalo iii 4 SLOVENSKI SLOVARJI KRAJŠAV ......................................................... 67 4.1 Pregled značilnosti in slovarskega gesla v slovarju krajšav Kratice, Mala izdaja (Župančič, 1948) ................................................................................... 67 4.2 Pregled značilnosti in gesla v Slovarčku krajšav (Kompara, 2006) .......... 70 4.3 Kje še najdemo krajšave ................................................................................. 73 5 POLOŽAJ KRAJŠAV V POVEDI ............................................................. 77 5.1 Izjeme pri opuščanju veznika in predloga ................................................... 77 5.1.1 Raba predloga za v kratici in razvezavi ........................................................ 79 5.1.2 Raba predlogov v, o in na v kratici in razvezavi ........................................... 80 5.2 Krajšave na ravni kodnega preklopa ............................................................. 81 5.2.1 Elementi kodnega preklopa ........................................................................... 82 5.3 Kodni preklop pri krajšavah .......................................................................... 83 5.3.1 Primeri rabe matričnega modela pri krajšavah ............................................ 83 6 NAČRTNO SESTAVLJANJE KRAJŠAV IN SESTAVA POSEBNEGA SEZNAMA ...................................................................................................... 87 6.1 Pregled algoritmov za samodejno prepoznavanje krajšav in krajšavnih razvezav v elektronskih besedilih .................................................................. 89 6.1.1 Pristop Taghve in Gilbretha .......................................................................... 92 6.1.2 Pristop Yeatesa ................................................................................................. 92 6.1.3 Pristop Larkeyja ............................................................................................... 93 6.1.4 Pristop Byrda in Parka .................................................................................... 93 6.1.5 Pristop Schwartza in Hearsta ......................................................................... 94 6.1.6 Pristop Zaharieva ............................................................................................. 94 6.1.7 Pristop Juna Xuja in Yalouja Huanga ........................................................... 95 6.1.8 Zbirka ADAM .................................................................................................. 96 6.1.9 Pristop Šateve in Nikolova ............................................................................. 98 6.1.10 Pristop Cheng-Ju Kuoja idr. ........................................................................ 100 7 ALGORITEM ZA SAMODEJNO PREPOZNAVANJE KRAJŠAV IN KRAJŠAVNIH RAZVEZAV V ELEKTRONSKIH BESEDILIH ... 103 7.1 Časovni pregled gradnje algoritma .............................................................. 104 7.1.1 Začetki ............................................................................................................. 104 7.1.1.1 Prepoznavanje krajšav (akronimov in kratic) ............................................ 104 7.1.1.2 Prekrivne krajšave .......................................................................................... 105 7.1.1.3 Prepoznavanje krajšavnih razvezav iz sobesedila in sovpadanje............ 106 iv Kazalo 7.1.1.4 Programska oprema ...................................................................................... 106 7.1.1.5 Opis in delovanje ........................................................................................... 106 7.1.2 Nadaljnji razvoj .............................................................................................. 108 7.1.3 Tuji jeziki ......................................................................................................... 110 7.1.4 Gradivo ........................................................................................................... 113 7.1.5 Izsledki raziskave ........................................................................................... 113 7.1.5.1 Oris lažnih krajšavno-razvezavnih parov ................................................... 113 7.1.5.2 Oris ustreznih krajšavno-razvezavnih parov ............................................. 115 7.1.6 Nekaj novejših algoritmov, nastalih po letu 2011 .................................... 117 8 IZDELAVA SLOVARJA KRAJŠAV NA PODLAGI SAMODEJNEGA PREPOZNAVANJA ................................................ 119 8.1 Elektronsko slovaropisje .............................................................................. 121 8.2 Korpusno zasnovani slovarji ....................................................................... 122 8.3 Samodejno izdelan Slovar krajšav (Kompara, 2011) ................................ 123 8.3.1 Potek, zapleti in rezultati .............................................................................. 125 8.3.2 Prepoznavanje jezika in rezultati ................................................................. 125 8.3.3 Geslo v Termanii ........................................................................................... 126 9 SESTAVA NOVEGA SLOVARJA KRAJŠAV ...................................... 129 9.1 Sestava gesla ................................................................................................... 130 SKLEP .......................................................................................................................... 133 LITERATURA ................................................................................................................ 135 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV M. Kompara 1 UVOD Krajšave, ti nejasni skupki nekaj črk in znakov, ki v sebi razkrivajo očem navidezno skriti pomen, so pojem, ki ni tuj skoraj nobenemu jeziku. Vsak se je z njimi že srečal, vsak pozna vsaj nekaj pomenov, vsak pa zagotovo ne ve, da so z nami že zelo dolgo, celo Cicero jih je uporabljal. Krajšave, kratice, akronimi, okrajšave so pojmi, s katerimi se pogosto srečamo, zato v delu diahrono in sinhrono predstavimo značilnosti krajšav in razmejimo nekatera poimenovanja, opazujemo nastanek in umestitev slednjih v kodni preklop, pregledamo njihov položaj v povedi ter zastopanost krajšav v pravopisnih in slovarskih virih. V nadaljevanju opozorimo na potrebo po izgradnji slovenskega krajšavnega slovarja, ki je primerljiv tujim, in orišemo samodejno prepoznavanje krajšav in krajšavnih razvezav v elektronskih besedilih ter samodejno izgradnjo slovarja krajšav. Krajšave v jeziku nastajajo zelo hitro, zato jim je težko slediti, še težje pa jih je spraviti v slovarsko zbirko, saj se nekatere v jeziku ustalijo, spet druge po določenem obdobju poniknejo v pozabo. Izgradnja vsakega slovarja terja svoj časovni davek in nič drugače ni s krajšavnimi slovarji, saj je za sestavo slednjih potrebno veliko časa, znanja, izkušenj slovaropisca in recenzentov, kar nekaj časa pa vzame tudi sama objava dela, zato pogosto slišimo, da je slovar, pa naj bo to krajšavni ali kakšen drug, ob izdaji že zastarel. Slovar je zagotovo omejen na določeno časovno obdobje in pomisliti je treba, da od zadnjih vnosov do dela v rokah uporabnikov lahko preteče tudi kakšno leto. V sodobnem slovaropisju, ki se močno opira na sodobna računalniška orodja, prihranimo slovaropisci veliko časa, tako daleč smo že, da si 2 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV izgradnje slovarja brez pomoči računalnikov ne moremo več predstavljati. Elektronsko slovaropisje nedvomno postaja prihodnost, zato slovaropisci vse pogosteje sodelujemo z informatiki, saj brez računalniškega slovaropisja, angl. computational lexicography, kjer sta povezana informatika in slovaropisje, ne gre več. Prihodnost slovaropisja je iskanje novih rešitev za izgradnjo boljših, uporabnejših oz. uporabniku prijaznejših slovarjev, vključevanje informatike, poenostavljanje in zmanjšanje rutinskega dela slovaropisca ter tudi optimizacija procesa pisanja, prihranek časa in denarja. Nedvomno optimizacijo pri zbiranju krajšavnega gradiva za izdelavo krajšavnega slovarja predstavljajo algoritmi za samodejno prepoznavanje krajšavno-razvezavnih parov v elektronskih besedilih. Za izgradnjo slednjih je treba dobro poznati značilnosti krajšav in krajšavnih razvezav, z razmislekom o tipologiji in značilnostih pa lahko ob pomoči ustrezne računalniške podpore kot rezultat izdelamo samodejno sestavljen krajšavni slovar. Cilj raziskave je celovito preučiti položaj krajšav v slovenskem prostoru in opozoriti na potrebo po sestavi slovarja krajšav ter predstaviti smernice za pridobitev gradiva za nastanek takega slovarja, in sicer ob pomoči algoritma za samodejno prepoznavanje krajšav in krajšavnih razvezav, ter prikazati sestavo slovarskega sestavka novega slovarja krajšav. Delo sestoji iz teoretičnega in empiričnega dela, ki skupaj štejeta 9 poglavij. V prvem poglavju strnemo misli o nastanku in klasifikaciji krajšav, pri čemer se obsežneje osredinimo na Rodetovo klasifikacijo iz leta 1974. V drugem poglavju diahrono in sinhrono orišemo krajšave v slovenskem prostoru, in sicer pregledamo položaj krajšav v slovenskih pravopisih od leta 1899 do 2001 ter izbranih jezikovnih priročnikih, ki so bili izdani do leta 2016, npr. Slovarju novejšega besedja slovenskega jezika (2012), Konceptu Novega razlagalnega slovarja slovenskega knjižnega jezika (2015), Slovarju pravopisnih težav (2014) oz. ePravopisu (2017). V tretjem poglavju podrobneje predstavimo položaj krajšav v splošnih in specializiranih slovarjih, pri čemer se podrobneje osredinimo na zastopanost krajšav v SSKJ, SSKJ2 in eSSKJ. V nadaljevanju predstavimo še položaj krajšav v angleških, Uvod 3 italijanskih, nemških, španskih in francoskih splošnih in krajšavnih slovarjih, pri čemer obsežneje predstavimo mikro- in makrostrukturo krajšavnih slovarjev. V četrtem poglavju podrobneje obravnavamo slovenske krajšavne slovarje, in sicer predstavimo Župančičev slovar iz leta 1948 ter Slovarček krajšav (2006), bralcu pa poleg tega ponudimo še nekaj drugih del, ki vsebujejo krajšave. V petem poglavju pregledamo položaj krajšave v stavku, in sicer krajšave opazujemo z vidika kodnega preklopa ter rabe veznika in predloga v krajšavi. V šestem poglavju podrobneje obravnavamo problematiko načrtnega sestavljanja krajšav, tu omenimo projekt Krap, in sicer računalniški algoritem za sestavljanje krajšav in kratic, ki preprečuje dvoumnost krajšav in kratic v pravnem jeziku. Pozornost usmerimo na normiranje krajšav, ki ni smiselno samo s stališča pravnega jezika, ampak je nanj treba gledati širše. Na primeru krnjenja veznikov in predlogov opozorimo na nekonsistentnost pri tvorbi krajšav. V nadaljevanju opozorimo na potrebo po sestavi algoritma za samodejno prepoznavanje krajšav in krajšavnih razvezav ter podrobneje predstavimo algoritme, ki so bili izdelani med letoma 1999, ko je bil izdelan prvi algoritem, in 2016. V sedmem poglavju sledi empirični del raziskave, ki temelji na dognanjih predhodno obravnavanih algoritmov za samodejno prepoznavanje krajšav in krajšavnih razvezav v elektronskih besedilih. Raziskavo o gradnji algoritma smo razmejili s časovnico, ki zajema začetno in nadaljnjo stopnjo sestave algoritma. Na začetni stopnji se osredinimo na prepoznavanje krajšav, pri čemer se omejimo na število znakov, prekrivnost, rabo veznika in predloga ter tipologijo krajšav nasploh. Ukvarjamo se s prepoznavanjem krajšavnih razvezav iz sobesedila in sovpadanjem ter predstavimo program, v katerem je bil napisan algoritem. Na nadaljevalni stopnji sledi pregled delovanja algoritma, kjer nas je zanimalo, kako algoritem prepoznava krajšave v naključno zbranih besedilih in kje so pomanjkljivosti ter kje so še potrebne nadgradnje. Sledi druga stopnja razvoja algoritma, kjer nadgradimo pravila, med drugim povečamo niz črk pri krajšavah kandidatkah in uporabimo štiri možne vzorce pojavitve krajšave in razvezave v besedilu. V nadaljevanju sledi prikaz filtracije slovenskih in tujih besedil, saj nas je zanimalo, ali je algoritem besedilno univerzalen. Po opravljenih testiranjih sledi filtriranje besedil petih letnikov dnevnika Delo, in sicer od leta 2005 do leta 2009. Zbirka vsebuje 60 milijonov besed, algoritem 4 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV v 30 minutah izlušči 5820 krajšavno-razvezavnih parov. V okviru raziskave prikažemo izsledke ter orišemo ustrezne in lažne krajšavno-razvezavne pare. V okviru empiričnega dela sledi še osmo poglavje, v okviru katerega se osredinimo na samodejno izdelavo slovarja krajšav na podlagi samodejnega prepoznavanja, pri čemer izpostavimo, da je tipološko gledano slovar krajšav mogoče izdelati samodejno. Izpostavimo nekaj ključnih korakov, ki so bili potrebni pri samodejni izdelavi slovarja, in sicer lematizacijo ter prepoznavanje jezika. Slovar krajšav (2011) je bil izdelan ob pomoči slovarske maske Termania in je prosto dostopen na portalu Termania. V okviru empirične raziskave predstavimo značilnosti slovarskega sestavka samodejno izdelanega slovarja krajšav. Skozi vse delo opozarjamo na potrebo po sestavi sodobnega slovarja krajšav. Trditev podkrepimo z zastopanostjo in tipološkimi značilnostmi krajšav, pregledom krajšavnih slovarjev ter algoritmov za samodejno prepoznavanje krajšav, ki utegnejo biti v pomoč slovaropiscu pri sestavi slovarja. V sklepnem devetem poglavju predstavimo sestavo slovarskega sestavka novega slovarja krajšav, ki je v nastajanju in je zasnovan na podlagi Slovarčka krajšav (2006), Slovarja krajšav (2011) ter algoritma za samodejno prepoznavanje krajšav in krajšavnih razvezav. S slednjim sklenemo misli, ki bralca skozi sinhrono-diahroni položaj krajšav v slovenskem prostoru vodijo do sestave slovarja krajšav. SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV M. Kompara 5 1 NASTANEK IN KLASIFIKACIJA KRAJŠAV V slovnicah in jezikoslovju krajšave najdemo v okviru besedotvorja, in sicer navadno med sistemsko nepredvidljivimi tvorjenkami, pri katerih ni mogoče govoriti o besedotvorni podstavi in obrazilu ter skladenjski podstavi. Krajšave so nepredvidljive, pri tvorbi je od tvorca, enostavnosti izgovora in morda še česa odvisno, katere črke podstavne besede se ohranijo v krajšavi (Logar, 2005), pri izgovarjavi pa ima ključno vlogo raba (Bauer, 1983). V prvi polovici sedemnajstega stoletja so v ameriškem časopisju o njih zapisali, da so različica stenografije v govoru, ki je splošno razširjena med lenuhi in fino gospodo ter uredniki, ker olajša pisanje. Nato se pojavijo v znanosti, tehnologiji in na strokovnih področjih (Crystal, 2002). Slovenski pravopis iz leta 1950 omeni, da so se začele rabiti v izogib ponavljanju daljših lastnih imen in zaradi takratnega hitrega tempa življenja (Slovenski pravopis 1950). Krajšave nastajajo skladno s splošnim razvojem in potrebami, in sicer v splošnem ter v strokovnem jeziku. Težijo k jezikovni gospodarnosti, pripomorejo k jedrnatemu, kratkemu in zgoščenemu slogu (Crystal, 2002). Zadnja desetletja je na občnoimenski ravni tvorjenje oz. prevzemanje krajšav in tvorjenk iz njih pomemben vir novih poimenovanj, predvsem v znanosti, na lastnoimenski ravni pa se uporabijo predvsem kot način krajšanja ponavljajočih se imen ustanov, zemljepisnih imen in naslovov besedil (Logar, 2003), saj krajšave oz. v tem primeru kratice vse pogosteje zamenjajo dolga, zapletena in zato nepraktična opisna imena, npr. znanstvenih odkritij, podjetij, organizacij, (političnih) institucij ter služb (Klinar in Davis, 2001). Alenka Gložančev (1998) podrobneje proučuje kratična imena podjetij in pravi, da 6 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV so pogosta predvsem zato, ker gre za preprost postopek, ki omogoča inovativna imena. Nekoliko drugače je v strokovnem jeziku, kjer je termin skrajšan v krajšavo zato, da bi vsebino natančno poimenovali in skrajšali večbesedno razvezavo. Krajšave se uporabljajo, ker so sicer poimenovanja dolga in niso praktična (Logar, 2005). Krajšave pogosto zasledimo na specializiranih področjih, kjer označujejo npr. izdelke, pripomočke in procese, ter v neliterarnih besedilih (Newmark, 2000). Kratični in izkratični termini prednjačijo v naravoslovnih vedah, manj pa jih je v humanistki in družboslovju (Logar, 2005). V slovenščini tvorba krajšav ne predstavlja nobene posebnosti, v zadnjih desetletjih pa je mogoče opaziti, da je v slovensko in tujo terminologijo prišla množica v angleškem jeziku nastalih terminoloških kratic, od slednjih se je marsikatera razširila tudi v splošno rabo (Logar, 2005). Pri prevzetih kraticah je izgovarjava skoraj avtomatična, sklanjajo pa se skladno s pravili slovenskega jezika. Tudi besedotvorno se ne obnašajo nič drugače, kot se obnašajo kratice, tvorjene v slovenščini, zato se izrazna tujost prevzetih kratic praktično takoj izgubi (Logar, 2005). Krajšave imajo uporabno vrednost oz. so funkcionalno rabljene, imajo pa tudi drugotno rabo, in sicer z njihovo uporabo sogovorcem nekaj sporočamo, npr. višji družbeni sloji so jih uporabljali, da bi bili zabavni. Modna raba krajšav predstavlja neke vrste sleng, ki prihaja in odhaja, ampak nikoli popolnoma ne izgine (Crystal, 2002). Krajšave pogosto zasledimo tudi v žargonu in kažejo na družbeno identiteto, saj ob uporabi krajšave družbi sporočamo, da se na nekaj spoznamo, da smo del družbene skupine, ki ji krajšava pripada. Posamezniki brez znanja o določenem področju področnih krajšav ne morejo uporabljati, saj ne poznajo njihovega pomena (Crystal, 2002). Krajšave rabimo tudi za doseganje umetnega prestiža in spodbujanje razkrivanja pomena posameznih črk (Newmark, 2000), npr. pri kratici DARE (Dictionary of American Regional English) je bila razvezana oblika slovarja namenoma sestavljena tako, da je kratica enaka angleški besedi dare (ki pomeni upati si, drzniti si), ki ima izrazito pozitivno konotacijo. S kraticami se je ukvarjal Tomo Korošec, ki v svojem delu iz leta 1972 z naslovom Pet minut za boljši jezik obravnava le del kratic, in sicer tiste, ki pomenijo skrajšane oznake, naslove, poimenovanja organizacij, ustanov, društev, držav, tovarn, revij in časopisov. Prvi je obširneje klasificiral krajšave Matej Rode, in sicer leta 1974. Krovni 1 Nastanek in klasifikacija krajšav 7 pojem, ki ga uporablja, je krajšava, slednji postane nadpomenka in se deli na okrajšavo in kratico (Logar, 2003). Rode je prvi, ki uvede krovno poimenovanje krajšava, saj velja opozoriti, da je v pravopisih iz let 1950 in 1962 kratica nadpomenka za druge tipe krajšav, krajšava pa postane krovni pojem v Pravilih iz leta 1990 in pravopisu iz leta 2001. Starejši slovničarji se sicer s krajšavami podrobneje ne ukvarjajo, Rode pa pravi, da je Peter Dajnko v slovnici Lehrbuch der Windischen Sprache iz leta 1824 že definiral krajšavo (po Rodetu, 1974: 213). Rode meni, da je Anton Janežič v delu Slovenska slovnica s kratkim pregledom slovenskega slovstva ter z malim ciriliškim berilom za Slovence iz leta 1854 (po Rodetu, 1974: 213) prvi, ki je skušal definirati navodila o tvorbi krajšav in ločil štiri tipe krajšav. Prav tako je tudi Levec v delu Slovenski pravopis iz leta 1899 kratice razdelil na štiri skupine in menil, da navada narekuje, katere besede krajšati in kako jih krajšati. Levec je prvi omenil tudi znamenja in simbole. Simbole in kemične prvine pa je omenjal tudi Anton Breznik v delu Slovenska slovnica za srednje šole iz leta 1916 (Rode, 1974: 213), a je krajšavam posvečal le malo pozornosti in jih ni klasificiral. Rode je menil, da so se krajšave namenoma zanemarjale, da bi jih pregnali iz rabe, in prav slednje je po njegovem mnenju čutiti v pravopisih iz let 1920, 1935 in 1937. Rode pravi še, da so krajšave in kratice v slovenskem jezikoslovju premalo raziskane, vsekakor pa meni, da število kratic v pravopisih narašča. Leta 1948 so celo v Koledarju Mohorjeve družbe objavili kratice, istega leta pa je izšel prvi slovenski slovar kratic z naslovom Kratice, Mala izdaja avtorja Jožeta Župančiča. 1.1 Klasifikacija krajšav po Rodetu Pri krajšavah, Rode jih poimenuje abreviature, imamo dele pisanega sporočila, pri katerem se zapisuje le del celotnega besedila (Rode, 1974). Krajšava je uporabljena kot nadpomenka in se deli na okrajšave in kratice. Okrajšave zapisujemo z malimi črkami, za njimi stoji pika, pri branju jih vedno izgovorimo v celoti, tj. neokrajšano, npr. l., leto. Kratice pišemo z velikimi črkami in brez pik, pri branju jih ne razvezujemo, torej ne izgovorimo celega neokrajšanega besedila. Znamenja, simboli in okrajšanke ne sodijo med krajšave. Znamenja in simboli so dogovorjeni znaki, s katerimi zaznamujemo pojme, ne da bi izpostavili celotno ime pojma, pri branju izgovorimo ime pojma in ne znaka, npr. kg, kilogram in ne [ka-ge]. Okrajšanke so samostojne besede z lastno vsebino in obliko, ki so nastale iz kratic po besedotvornih pravilih in imajo lastno podstavo, iz katere tvorimo nove besede, npr. Skoj, skojevec, skojevka, skojevski (Rode, 1974: 215). 8 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV 1.1.1 Okrajšave Po Rodetu so okrajšave najstarejša oblika krajšav, loči pa priložnostne in ustaljene. Priložnostne si izmisli pisec ob določeni priložnosti, ko pa se raba takih okrajšav razširi in jo sprejme večji krog uporabnikov, postanejo ustaljene. Slednje naj bi znal razbrati vsak povprečen bralec. V jezikovni sistem sodijo le ustaljene okrajšave. Glede na obliko se okrajšave delijo na nesestavljene in sestavljene, in sicer gre za proces, po katerem prvotno, neokrajšano besedilo tvorijo ena beseda ali dve in več (Rode, 1974: 215). 1.1.1.1 Nesestavljene okrajšave Nesestavljene okrajšave se tvori s prekinitvijo ali krčenjem. Pri prekinitvi se zapiše le začetni del neokrajšanega besedila, npr. o. za oče ali tel. za telefon. Pri krčenju pa se zapiše le določene dele neokrajšanega besedila, npr. dr. za doktor, ga. za gospa, rkp. za rokopis (Rode, 1974: 216). 1.1.1.2 Sestavljene okrajšave Rode pri sestavljenih okrajšavah loči »take, katerih člene pišemo ločeno, in take, katerih člene pišemo skupaj« (Rode, 1974: 216). »Prve so lahko sestavljene iz dveh členov, npr. d. d., ing. arh. ali iz treh in več, npr. dr. h. c., z. z o. z.« (Rode, 1974: 216). Okrajšave tipa npr., itd. in ipd. pa se pišejo skupaj (Rode, 1974: 216). 1.1.2 Kratice Rode glede na način nastanka deli kratice na inicialne, zlogovne in kombinirane (Rode, 1974: 216). 1.1.2.1 Inicialne kratice Inicialne kratice sestojijo iz začetnic, tvorimo jih tako, da se posamezni besedi prvotnega neokrajšanega besedila vzame prvo črko, črke se nato združi, npr. Republiška izobraževalna skupnost – RIS (Rode, 1974: 216). Ko jih beremo, jih delimo na glasovne in črkovalne. Glasovne beremo »kot besedo, ki jo tvorijo inicialke, npr. NUK [nuk], VOS [vos]« (Rode, 1974: 216). »Črkovalne kratice 1 Nastanek in klasifikacija krajšav 9 tvorimo tako, da v besedo družimo imena inicialk« (Rode, 1974: 216). Lahko jih beremo po domače ali tuje, in sicer po domače jih izgovorimo poimensko ali s polglasnikom. Kratice beremo poimensko tako, da združimo v besedo imena posameznih inicialk, npr. UKV [u-ka-ve]. S polglasnikom izgovarjamo kratico tako, da vsakemu soglasniku dodamo še polglasnik, npr. PTT [pə-tə-tə]. Po tuje črkovalne kratice izgovarjamo tako, da v besede združimo inicialke, izgovorjene tako, kot to zahteva jezik, iz katerega smo jo prevzeli, npr. HJ [ha-jot], BBC [bi-bi-si], BCG [be- se-že] (Rode, 1974: 216). 1.1.2.2 Zlogovne kratice Pri zlogovnih kraticah vsaki besedi neokrajšanega besedila vzamemo prvi zlog ter slednje združimo v novo besedo, npr. Narodni magazin – NAMA, Tovarna sanitetskega materiala – TOSAMA (Rode, 1974: 217). 1.1.2.3 Kombinirane kratice S kombinacijami glasovno branih črk in zlogov nastanejo kombinirane kratice, npr. Industrija metalnih polizdelkov – IMPOL, Tovarna motorjev Sežana – TOMOS, Industrija kovinske opreme – INKOP (Rode, 1974: 217). 1.1.3 Znamenja in simboli Pri znamenjih in simbolih gre za znake, ki so mednarodno dogovorjeni in se v danem jeziku izgovarjajo skladno z zakoni jezika, oblikoslovno pa jih prilagodimo sobesedju, npr. 1 l, en liter, 2 l, dva litra, 3 l, trije litri (Rode, 1974: 218). Lahko jih pišemo s črkami, številkami, posebnimi znamenji in kombinacijami teh načinov, vedno pa brez pike. S črkami se pišejo mednarodne fizikalne enote, simboli za kemične prvine, oznake na avtomobilih itn. Črke imajo lahko funkcijo znakov tudi v geometriji, zemljepisu ali drugje, pogosto pa poleg črk naše abecede uporabljamo tudi črke grške abecede in črke drugih črkopisov. Izvorno so ta znamenja okrajšave, ko so prevzeta iz tujih jezikov, so razvrščena pod znamenja. Od okrajšav se ločijo po tem, da so zapisana brez pike. Med posebne znake sodijo vsa znamenja, s katerimi nadomestimo besede za določene pojme, npr. %, +, $. Pogosto predstavljajo znamenja kombinacijo črk, številk in posebnih znakov, npr. – 12 °C, 20 kW, 7,7 % (Rode, 1974: 218). Znamenja in simbole se piše dosledno, in sicer tako, kot je 10 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV mednarodno dogovorjeno. V primeru tvorjenja zloženk jih pišemo z vezajem, npr.: H-bomba, A-drog (Rode, 1974: 218). Po Rodetovi (1974) klasifikaciji krajšav je v slovenskem prostoru krovni pojem krajšava, slednji pa se deli na kratico, okrajšavo in akronim. Pred Rodetovo klasifikacijo je bila krovni pojem kratica, za številne uporabnike pa je slednja še danes razumljena kot krovni pojem za okrajšane besedne zveze. Pomembne zasluge pri klasifikaciji krajšav ima tudi Korošec (1972, 1993). 1.2 Neustaljenost terminov Vse pogosteje je mogoče opaziti, da so v slovenskem prostoru pogosto nejasno razumljeni in uporabljeni pojmi kratica, akronim, okrajšava in krajšava. Za lažji oris in razumevanje pomena terminov smo uporabili definicije iz Slovenskega pravopisa (2001) (dalje SP 2001) in Slovarja slovenskega knjižnega jezika (dalje SSKJ in SSKJ2). Po SP 2001 med krajšave sodijo kratice, formule, simboli in okrajšave. Kratico dobimo tako, da krne besednih zvez strnemo, npr. SAZU, kemijske simbole navadno strnemo v formulo, npr. H2O, če imamo samo en krn, ga uporabljamo kot simbol, npr. H (vodik). Okrajšave so besede ali besedne zveze, ki so zapisane okrajšano, znamenje okrajšanosti predstavlja pika, npr. oz. V SP 2001 akronimi niso obravnavani. Po SSKJ in SSKJ2 je krajšava vse, kar se okrajša, okrajšava je definirana kot »okrajšana beseda ali besedna zveza« in »glagolnik od okrajšati«, kratica pa je »ustaljena okrajšava večbesednih imen, navadno iz začetnih črk ali zlogov« ter tudi »okrajšana beseda ali besedna zveza«. Tudi akronim ima enako razlago, in sicer »ustaljena okrajšava večbesednih imen, navadno iz začetnih črk ali zlogov«. Za primerjavo izpostavimo še Toporišičevo Enciklopedijo slovenskega jezika (1992), ki ne vključuje akronima. Bralec je usmerjen na kratico, ki jo Enciklopedija definira kot besedo, nastalo iz sklopljenih krnov večbesedne zveze in je sopomenka kratice, krajšava pa je definirana kot vse, kar je okrajšano, tudi simbolno ali kratično. V slovenskem prostoru so se pravila za tvorbo in rabo krajšav v zgodovini spreminjala ter bila večkrat nejasna, kar velja tudi za poimenovanja krajšavnih vrst, prav slednje je povzročalo zmedo glede razumevanja krajšav, njihovega tvorjenja in pravilne rabe. Razlaga posameznih poimenovanj in razvoj poimenovanj bosta kronološko prikazana v poglavju o diahrono-sinhronem razvoju krajšav. SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV M. Kompara 11 2 DIAHRONO-SINHRONI ORIS KRAJŠAV V SLOVENSKEM PROSTORU V nadaljevanju nas je zanimalo, kako so obravnavane krajšave na diahroni in sinhroni ravni v slovenskem prostoru. Da bi to ugotovili, diahrono-sinhrono orišemo razvoj krajšav v slovenskih pravopisih, in sicer od leta 1899 do zadnje pridobitve iz leta 2001, ter v izbranih jezikovnih priročnikih, ki so bili izdani do leta 2016. 2.1 Krajšave v slovenskih pravopisih med letoma 1899 in 2001 V tem poglavju podrobneje preverimo položaj krajšav v slovenskih pravopisih, opozorimo na njihovo zastopanost v pravopisih, vključitev v slovarje in spremembe pri poimenovanju. 2.1.1 Levčev pravopis iz leta 1899 Levčev pravopis iz leta 1899 je prvi slovenski pravopis, sestavljen iz obsežnega teoretičnega dela in krajšega slovarskega dela. Krovni pojem, ki ga Levec uporablja za oris krajšav, je kratica. Krajšav v slovarskem delu ne najdemo, na to opozori tudi Logarjeva (2003), prisotne pa so v poglavju Pravila na začetku pravopisa ter v okviru seznama krajšav, ki se uporabljajo v slovarju z naslovom Opazke. V okviru pravil Levec navaja, da ni posebnega pravila, katere besede se krajšajo in kako se krajšajo, slednje temelji na navadi, navaja pa najpogostejše oblike krajšanja in seznam 12 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV najpogostejših krajšav. Levec pravi, da se krajša tako, da se piše samo začetna črka, npr. g. (gospod) ali t. m. (tega meseca), obstaja pa tudi različica zapisa prve in zadnje črke, npr. dr. (doktor), do. (detto). Omeni pa še primer z vmesno črko, in sicer mjr. (major) ter Nro. (numero). Po pravilih se lahko zapiše tudi več začetnih črk, ampak brez celega zloga, pri čemer se krajšava konča na soglasnik, npr. gosp. (gospod), ces. kr. (cesarski kraljev). Na samoglasnik se lahko konča samo v primeru, ko »se poleg prvega soglasnika vzame v kratico še poslednji zlog, n. pr. gpa. (gospa), gčna. (gospodična)« (Levec, 1899, 101). Med pogosto rabljenimi krajšavami navaja bl. (blaženi), dr. ali Dr. (doktor), kr. (kraljev, kraljevski) ipd. Navaja še, da se krstna imena krajšajo tako, da jih lahko razbere tudi preprost človek in dodaja, da mora za vsako kratico stati pika, le za merskimi enotami in utežmi ter denarnimi enotami pike ni. V Levčevem pravopisu krajšave v slovarskem delu niso našle mesta, ne najdemo jih niti v okviru drugih slovarskih gesel, kjer bi lahko bile omenjene, npr. profesor ali gospod. Krajšavo prof. kot samostojno geslo zasledimo izven slovarskega dela, in sicer v seznamu krajšav ter pri pravilu o opuščanju vezaja, kadar je prilastek skrajšan, npr. prof. Erjavčevi spisi. V Levčevem pravopisu so krajšave, ki se rabijo v slovarskem delu, navedene v poglavju Opazke, gre predvsem za slovnične krajšave, npr. pris. (prislov), rod. (rodilnik) in krajšave, ki zaznamujejo jezike, npr. češ. (češko), hs. (hrvaško). 2.1.2 Breznikov pravopis iz leta 1920 V Breznikovem pravopisu (1920) najdemo krajšave, ki jih Breznik poimenuje kratice, pred slovarskim delom. Na uporabo krajšav v Breznikovem pravopisu opozori tudi Logarjeva (2003). Breznik med »najbolj navadne kratice« (Breznik, 1920, 31) na eni strani zbere najbolj uporabljene krajšave tistega časa, npr. dr. (doktor), in gl. (glej). V opombah, ki jih Breznik imenuje opazke, so navedene tudi krajšave, ki se rabijo v slovarju, in sicer gre za krajšave besednih vrst, jezikov ipd., npr. rod. za rodilnik, angl. za angleški. V slovarskem delu pravopisa med gesli ne najdemo krajšav, omembo krajšav najdemo samo pri rabi pike, in sicer Breznik pravi, da se brez pike pišejo »kratice za denar, mero, utež in za kemične prvine« (Breznik, 1920, 26). Krajšave omeni še pri vejici, in sicer pravi, da mora vejica stati pred besedami in kraticami, ki napovedujejo naštevanje. Arh (2018) opozori na razlike v zastopanosti krajšav, in se osredini predvsem na tiste, ki v novejših pravopisnih izdajah izpadejo. V Breznikovem pravopisu se krajšava bl. uporablja za besedo blaženi in ne več za besedo blagorodni, ki se v Levčevem pravopisu krajša z blag. V pravopisu iz leta 1920 2 Diahrono-sinhroni oris krajšav v slovenskem prostoru 13 ni več sledečih krajšav: c. kr. za cesarski kraljev, cf. oz. cfr. za confer, primerjaj, d. d. oz. dto. za de dato oz. z dne, krajšav za gospoda, gospo, gospodično, gld. za goldinar, gimn. za gimnazijo, ibid. za ibidem, ravnotam. Krajšava to je se je leta 1920 zapisala kot t. j., leta 1899 pa i. e., v pomenu id est (to je). V Breznikovem pravopisu ni krajšave in tako dalje, p. t. oz. P. T. za pleno titulo oz. s polnim naslovom, krajšava kr. nima več pomena krajcar, ampak samo kraljevski, izpadejo še l. c. za loco citato oz. na navedenem mestu, pg. oz. pag. za stran oz. pagina. Arh (2018) dodaja, da Breznik v svoje delo uvede številne nove krajšave, npr. centiliter (cl), centimeter (cl), v obliki pole (fol), gram (g), hektar (ha), hektoliter (hl), kilometer (km), liter (l), meter (m), miligram (mg), miriameter, merski stot (q), ravno tam (r. t.), vštevši (všt.) (Breznik, 1920, 31). Tudi v poglavju Opazke Arh (2018) opazi razlike, npr. angl. (angleški), fr. (francosko), it. (italijansko), madž. (madžarsko), nem. (nemškega izvora), pren. (v prenesenem pomenu), prepr. (preprosta raba), rom. (romanska posebnost; romanskega izvora), ter spremembe, in sicer krajšava germ. ni več germanizem, ampak je germanska posebnost, gl. ni več glej, ampak glagol, prislov se ne krajša kot pris., ampak kot prisl. Krajšave za deležnik, dvojina, ednina, moški spol, množina, pridevnik, rodilnik, samostalnik, srednji spol, tožilnik, ženski spol se ne spremenijo, izginejo pa češ. (češko), hs. (hrvaško), mat. (matematičen izraz), nav. (navadno), prim. (primeri, primerjaj), rus. (rusko), stsl. (staroslovensko), trp. (trpni). Tako kot v Levčevem pravopisu, tudi v Breznikovem v okviru slovarskega gesla ne najdemo krajšav, niti pri geslu gospod. V slovarskem delu ne najdemo niti gesla profesor. 2.1.3 Breznikov in Ramovšev pravopis iz leta 1935 V Breznikovem in Ramovševem pravopisu iz leta 1935 krovni pojem ostaja kratica. Krajšave zasledimo za kolofonom na neoštevilčeni strani pred poglavjem Navodila in pravila. Gre za, kot jih poimenujeta avtorja, »najbolj navadne kratice«. Arh (2018) nabor primerja s tistim iz prejšnje izdaje, torej 1920, in ugotovi, da pravopis iz 1935 nima več krajšav za »uradno, službeno« (ex offo), fr. za fraterja, brata, r. t. za ravno tam, sl., ki v SP 1920 pomeni »slavni, slavna, sledeč, sledeča stran«, ima v SP 1935 pomen »sledeč, sledeča stran«. Nove krajšave, gre predvsem za slovnične, na katere opozori, so; del. za deležnik, din za dinar, dv. za dvojino in edn. za ednino, izg. za izgovori, m. za moški spol, mn. za množino, pog. za pogovorno obliko, prid. za pridevnik, pris. za prislov, rod. za rodilnik, sam. za samostalnik, s. za srednji spol, tož. za tožilnik in ž. za ženski spol. Tudi v pravopisu iz leta 1935 je v navodilih pri rabi pike navedeno, da se brez pike pišejo »kratice za denar, mero, utež in za kemične prvine, n. pr. din (dinar), km (kilometer), S (sulphur, žveplo), CO2 (oglenčeva kislina)« (Breznik in Ramovš, 14 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV 1935: III). Dodajata še, da se pika lahko piše za kraticami, npr. Fr. Ks. Meško in Družbo sv. Mohorja (Breznik in Ramovš, 1935). Krajšave, ki se uporabljajo v slovarju, pred slovarskim delom niso navedene. Krajšav tudi ne zasledimo kot samostojnih slovarskih gesel, so pa nekatere slovnične krajšave prisotne v slovarskih geslih, npr. m. in ž. za moški in ženski spol. Krajšave so prisotne v slovarskih geslih za centimeter (cm), ta čas (t. č.), Češkoslovaško (ČSR), dekagram (dkg), dinar (din), junior (jun.), monsignor (mgr.), na primer (n. pr). (Breznik in Ramovš, 1935). 2.1.4 Breznikov in Ramovšev pravopis iz leta 1937 Leta 1937 je izšla mala izdaja Slovenskega pravopisa, in sicer gre za izdajo, posneto po Slovenskem pravopisu, namenjena in prirejena pa je bila zgolj za pravopisne potrebe ter skrajšana predvsem za rabo šolske mladine. Kot imajo njene predhodnice, ima tudi ta izdaja krovni pojem poimenovanja kratica ter na začetku poglavje Kratice. V slednjem najdemo »najbolj navadne kratice«, Arh (2018) ugotovi, da se na novo pojavijo sledeče slovnične krajšave: daj. (deležnik), mest. (mestnik), orod. (orodnik) ter nekaj drugih, in sicer: dir. (direktor, ravnatelj), g. za gospod, ga. za gospa in gdč. za gospodična, ipd. za in podobno, itd. (in tako dalje), jun. (junior, mlajši), ki se krajša tudi z ml., kg za kilogram, lt. l. (letošnjega leta), mag. za magister, msgr. za monsinjor, N. B. za nota bene oz. posebej pomni, p (para), r. t. za ravno tam, sen. za senior, starejši, sp. (spodaj), st. (starejši), sv. za sveti oz. sveta, sveto, t. č. (ta čas) ter zg. za zgoraj. Krajšavi, ki iz SP 1937 izgineta, sta se pa pojavili v SP 1935, sta po besedah Arha (2018) pog. za » pogovorno obliko« in Št. za » Šent«. Breznik in Ramovš (1937) krajšave omenita pri rabi pike, in sicer se brez pike pišejo kratice za denar, mero, utež in za kemične prvine, dodajata še, da se pika piše tudi po kraticah, slednje ponazorita z zgledi, in sicer n. pr., Fr. Ks. Meško, Družba sv. Mohorja. Pravopis sestoji iz pravil in slovarskega dela, pred slovarskim delom pa ne zasledimo seznama v slovarju uporabljanih krajšav. Krajšave v slovarju nimajo samostojnega gesla, tudi v okviru drugih slovarskih gesel ne najdemo krajšav, npr. profesor, gospod. 2.1.5 Pravopis iz leta 1950 Leta 1950 izide novi pravopis, in sicer gre za prvi povojni pravopis, ki temelji na SP iz leta 1935 oz. 1937. SP 1950 se ponaša z razširjeno strukturo in že znano obliko, torej sestoji iz pravil in slovarja. Krovni pojem še vedno ostaja kratica. V pravopisu iz leta 1950 najdemo seznam krajšav, ki se uporabljajo v slovarju in jih avtorji 2 Diahrono-sinhroni oris krajšav v slovenskem prostoru 15 (Ramovš idr., 1950) poimenujejo kratice, na začetku slovarja, in sicer pred slovarskim delom. Gre za 225 krajšav besednih vrst in drugih krajšav, ki se uporabljajo v slovarskih geslih, torej je glede na SP 1937 nabor krajšav zelo spremenjen in razširjen. Omeniti velja, da seznam sestoji iz krajšav, ki jih še danes najdemo v sodobnih slovarjih, npr. anat. za anatomijo, bot. za botaniko. V primerjavi s predhodnimi pravopisnimi izdajami, kjer je bilo krajšav, ki se uporabljajo v slovarju, le za peščico, jih je v izdaji iz leta 1950 bistveno več, in sicer po troje stolpičev na dveh straneh. Seznamu sledijo izčrpna pravila z razlago kratic in njihovo rabo, že pri rabi velike in male začetnice je navedeno, da se krajšave, ki so v pravopisu poimenovane s krovnim poimenovanjem kratice, pišejo s samimi velikimi črkami in tako zaznamujejo ime ali naslov, npr. AFŽ. Okrajšave tipa prof. so omenjene pri rabi malih črk, in sicer »kot prilastki, ki niso lastna imena« (Ramovš idr., 1950, 12) z njimi označimo samo poklic, čast ali svetost, npr. dr. (doktor), prof. (profesor), inž. (inženir), pl. (plemeniti), sv. (sveti). Omenjeni so tudi razločevalni dodatki, in sicer ml. (mlajši), st. (starejši) ter tujke jun. (junior), sen. (senior). Krajšave oz. kratice so omenjene tudi pri rabi pike, npr. l. (leto), t. m. (tega meseca). Navedeno je, da se brez pike pišejo »kratice za denar, uteži, kemične prvine in take kratice, ki se pišejo z velikimi začetnicami« (Ramovš idr., 1950, 44). V pravilih, ki stojijo pred slovarskim delom, so izčrpno obravnavane krajšave, in sicer se kot krovni pojem uporablja kratica. Krajšave tipa m (meter), l (liter), kg (kilogram), ki jih avtorji poimenujejo kratice, se »redno zaznamuje z določenimi črkami ali znaki« (Ramovš idr., 1950, 52), beremo pa jih razvezano. Omenjene so domače in mednarodne krajšave ter natančnost zapisa, »da ne nastane zmeda« (Ramovš idr., 1950, 52), in sicer pri npr. l (liter) in l. (leto) ali g (gram) in g. (gospod). Pri tvorbi novih krajšav je treba paziti, da bo pomen jasen, ob prvi pojavitvi mora biti razložen. Ramovš idr. (1950) navajajo še, da se krajšave berejo razvezano, čeprav povedo, da pride tudi do odstopanj, ko omenijo valuto din (dinar). Omenjena je tudi okrajšava, ki jo enačijo s kratico, in sicer pri kemijskih simbolih, ki se jih bere nerazvezano in jih v nadaljevanju enačijo s formulami. Dodajajo še, da se krajšave uporabljajo »pri navajanju sestavljenih in zmeraj enakih naslovov« (Ramovš idr., 1950, 53), in sicer gre za države, organizacije ipd., npr. Beneluks (Belgija, Nizozemska, Luksemburg), in omenjajo, da so nekatere krajšave prešle v navadno pisano besedje, kar je razvidno tudi iz zapisa in rabe velikih in malih črk. Ramovš idr. (1950) dodajajo še, da se krajšave, ki so zapisane z velikimi črkami, berejo razvezano ali črkovalno, v pisavi ne dobivajo obrazil in so nepregibne. Prav tako je glede na ta pravopis nesprejemljiva tvorba zloženk, npr. LZ-ov urednik, pravilno je urednik LZ. Pri pravilu za zapis pike je navedeno, da se pika piše za kraticami, npr. 4. t. m. (četrtega tega meseca), l. 1848 (leta 1848), zv. II, str. 240 16 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV (zvezek II, stran 240), čl. 5. ustave. V SP 1950 se krajšave prvič pojavijo kot samostojno geslo, in sicer pri geslu g v pomenu gram, ha v pomenu hektar, ing. v pomenu inženir, v slovarskem delu najdemo tudi kratico PEN v pomenu poezija, esej, novela. Vse pogosteje so prisotne v okviru drugih slovarskih gesel, npr. ČSR pri geslu Čehoslovak, g za gram, pri čemer imamo tudi navzkrižno kazalko na geslo gram in krajšavo g, Hz pri herc ipd. 2.1.6 Pravopis iz leta 1962 Na začetku pravopisa iz leta 1962 (Bajec idr.) najdemo obsežen seznam krajšav, uporabljenih v slovarju. Bajec idr. kot krovni pojem uporabljajo besedo kratica. Seznam je primerljiv s tistim iz leta 1950, v novejšem sicer izpadejo krajšave, kot so afr. (afriški), avg. (avgust), bajesl. (bajeslovje), dcl (deciliter), dec. (december), din (dinar), določna oblika oz. določilo ostane v seznamu zapisano s krajšavo doc., spremeni pa se opis, in sicer jo novejši pravopis poimenuje določen. V primerjavi s SP 1950 izpadejo še: dr. (doktor), elektr. (elektrika), enozl. (enozložen), filol. (filologija), glag. (glagol), gosp. (gospodarstvo), gram. (gramatika), ind. (industrija), indoevr. (indoevropski), jan. (januar), jun. (junij), kg (kilogram), klas. (klasičen), krat. (kratica), l. (leto), m. (meseca), mak. (makedonski), manjš. (manjšalnica), mednar. (mednaroden), nagl. (naglašen), naspr. (nasprotno), nenagl. (nenaglašen), nepr. (nepravi), nov. (november), ok. (okoli), os. priim. (osebni priimek), pis. (pisatelj), pos. (posebno), povr. (povraten), pr. (pravo), pred. (prednji), predm. (predmet), preds. (predsednik), prih. (prihodnjik), priim. (priimek), prip. (pripona), pritrd. (pritrdilnica oz. pritrdilen), rastl. (rastlinstvo), rep. (republika), revol. (revolucija), rodb. (rodbinski), samogl. (samoglasnik), sept. (september), sklad. (skladatelj), slovan. (slovanski), sogl. (soglasnik), sovj. (sovjetski), sp. (spol), srb. (srbski), st. (stavek), stgerm. (starogermanski), stol. (stoletje), sv. (svet, sveta, sveto), t. j. (to je), zač. (začetek), zemlj. (zemljepis), zv. (zvalnik), žel. (želelen). Arh (2018) ugotavlja, da je nemogoče z gotovostjo ugotoviti, zakaj so iz novejšega pravopisa izpadle. Dodaja, da mogoče zato, ker so bile preveč splošne oz. logične in poznane. Arh (2018) opozori tudi na veliko število krajšav, ki se pojavljajo v obeh izdajah, a v drugačni obliki, npr. agronomija je v letu 1950 agron., v letu 1962 pa agr. Diplomacija se iz diplom. spremeni v dipl., elektrotehnika se iz elektroteh. skrajša v el., filozofija, filozof in filozofski se v SP 1950 pišejo fil. oz. filoz., novejši pravopis iz leta 1962 pa omenja zgolj krajšavo fiz. za filozofija ipd. Arh še ugotavlja, da primerjava SP 2 Diahrono-sinhroni oris krajšav v slovenskem prostoru 17 1950 in SP 1962 nudi največji nabor razlik. Dodaja še, da pravopis iz leta 1962 uveljavi krajšave, ki jih v predhodnem pravopisu ne najdemo, npr.: antr. (antropologija), ar. (arabski), atom. (atomski, atomistika), avt. (avtomobilizem), bakt. (bakteriologija), biz. (bizantinski), čeb. (čebelarstvo), čl. (členek), den. (denarstvo), dij. (dijaški), dom. (domače), dop. (dopusten), ekon. (ekonomija), etnogr. (etnografija), etnol. (etnologija), farm. (farmacija), filat. (filatelija), film. (filmska umetnost), fin. (finance), fitop. (fitopatologija), frig. (frigijski), fuž. (fužinarstvo), gastr. (gastronomija), geod. (geodezija), gozd. (gozdarstvo), hebr. (hebrejski), kit. (kitajski), les. (lesna stroka), let. (letalstvo), ling. (lingvistika), lj. (ljudski, ljudsko), log. (logika), madž. (madžarski), meh. (mehanika), met. (metalurgija), metr. (metrologija), namen. (namenilnik), onom. (onomatopoetičen), pal. (paleontologija), ped. (pedagogika), polj. (poljski), prazg. (prazgodovina), pril. (prilastek), ret. (retorika), rib. (ribištvo), sadj. (sadjarstvo), skl. (sklon), SP (Slovenski pravopis), s stal. poud. (s stalnim poudarkom), stal. (stalen), star. (starinski, starinsko), stroj. (strojništvo), stvb. (stavbarstvo), štud. (študentovski), tekst. (tekstilstvo), tel. (telovadba), um. zg. (umetnostna zgodovina), usnj. (usnjarstvo), vet. (veterina), vulg. (vulgaren, vulgarno), zastar. (zastarel izraz, zastarelo), žarg. (žargon). V uvodnem delu, podobno kot pri pravopisu iz leta 1950, sledi razlaga o pravilni rabi kratic, kjer Bajec razlaga, da »ponekod preraščajo že v poseben jezik« (Bajec idr., 1962, 97). Omenjene so tudi vrste krajšav, in sicer od mednarodnih in domačih do priložnostnih ter izgovarjava in pregibnost. Dodana je še razlaga o sestavi krajšav, in sicer iz črk (malih in/ali velikih) ter ostalih znamenj. Za razliko od SP 1950, kjer v okviru samostojnega slovarskega gesla že najdemo peščico krajšav, v SP 1962 avtorji naredijo korak nazaj in odstranijo krajšave, ki so se kot samostojna gesla pojavile v SP 1950, krajšav tudi ni zaznati v okviru drugih slovarskih gesel, izjema je geslo doktor, kjer se pojavi dr. V pravilih z naslovom o Rabi velikih in malih črk pravi, da se same velike črke uporabljajo pri krajšavah in kemijskih elementih. Krajšave so omenjene tudi pri rabi pike, kjer je navedeno, da se pišejo pri npr. l. (leto), gl. (glej), ne pišejo pa se pri denarnih enotah, merah, utežeh, kemičnih prvinah ter krajšavah, ki se pišejo z velikimi črkami. V nadaljevanju pravil sledi izčrpno poglavje o krajšavah, kot krovni pojem je uporabljeno poimenovanje kratica. Avtor pravi, da je prednost krajšav nedvomno v kratkosti, slabost pa v nenazornosti in nerazumljivosti. Krajšava svoj namen doseže, če je dovolj jasna in razumljiva. V nadaljevanju so predstavljene vrste krajšav, in sicer mednarodne, ki se uporabljajo predvsem za mere, uteži, kemijske prvine, države in organizacije, sledijo domače, in sicer za društva, ustanove in predvsem vsakdanjo rabo. Omenjene so tudi priložnostne krajšave, ki se rabijo v strokah, strokovni literaturi, slovarjih ipd. Navedeno je še, da se je treba krajšavam 18 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV izogibati predvsem v leposlovni literaturi. Izrednega pomena je tudi zapis, ki mora biti dosleden, in sicer tako pri domačih kot pri tujih krajšavah. Ob prvi pojavitvi je treba krajšavo vedno razložiti. Beremo jih različno, in sicer razvezano, npr. km (kilometer), črkovalno, npr. AFŽ (afeže), tudi s pregibanjem, npr. pri Unicefu. Krajšavam, ki se pišejo z velikimi črkami, ne dodajamo obrazil, npr. z AFŽ-jem, iz njih ne delamo zloženk, npr. JiSovo uredništvo. Nekaj besed je tudi o sestavi krajšav, kjer so dejansko omenjene kratice in krajšave. Sestavljene so lahko iz samih malih črk, npr. t (tona), iz samih velikih črk, npr. ZDA (Združene države Amerike), iz malih in velikih črk, npr. Na (natrij), iz drugih znamenj, npr. t. i. (tako imenovani). Na koncu slovarja sledi obsežen nabor najpogostejših krajšav in razvezav na osmih straneh. V seznamu zasledimo od najbolj navadnih slovenskih krajšav, npr. g., ga., gdč., do tujih, npr. IRO (International Refugee Organization), NATO ipd. Krajšave, ki so bile v SP 1950 vključene v slovarska gesla, in sicer samostojno ali kot del slovarskega gesla, so v SP 1962 vključene v obsežen seznam na koncu dela, ki vsebuje slovenske in tuje krajšave, tuje so dosledno prevedene, tu mislimo na vse tuje, ki niso hrvaške ali srbske, npr. SKOJ ni prevedena. Kot zanimivost izpostavimo krajšavo PEN, ki je vključena v seznam krajšav, in sicer v zapisu PEN, v slovarskem delu je zapisana kot Pen in z možnostjo različice PEN. Pri slednjem ni navedbe, da gre za kratico. 2.1.7 Krajšave v Slovenskem pravopisu 1, pravila iz leta 1990 V pravopisnih pravilih iz leta 1990 (Toporišič idr.) je kot krovni pojem prvič uporabljeno poimenovanje krajšava, ki se ne zamenjuje več z vrstnimi poimenovanji. V poglavju z naslovom Krajšave pravopis ločuje med kraticami, formulami, simboli ter okrajšavami, kot nadpomenko pa uporablja krajšavo. Kratice kot podvrsta krajšav so najprej omenjene pri rabi velikih črk, in sicer je navedeno, da se same velike črke uporabljajo pri »kraticah, kemijskih simbolih in drugih simbolih« (Toporišič idr., 1990, 23). V opombah je navedeno, da lahko kratice, pisane z velikimi črkami, »prehajajo med navadna lastna ali občna imena« (Toporišič idr., 1990, 23) in se skladno s tem izgovarjajo in pišejo, npr. UNESCO, Unesco. V opombi je navedeno še, da se končnice kratičnih imen pišejo na dva načina, in sicer »z malo, z vezajem, če se kratično ime končuje na soglasnik« (Toporišič idr., 1990, 23), npr. AVNOJ, AVNOJ-a, na enak način se pišejo tudi podaljšave osnov, npr. SLO, SLO-ja ter »z veliko, kadar se kot sklonilo obravnava zadnji samoglasnik kratičnega imena« (Toporišič idr., 1990, 23), npr. UNESCO, UNESCA, UNESCU, 2 Diahrono-sinhroni oris krajšav v slovenskem prostoru 19 čeprav je taka imena bolje »sklanjati v navadni pisni obliki lastnih imen: Unesco, Unesca, Unescu« (Toporišič idr., 1990, 23). V poglavju z naslovom Krajšave sledi podpoglavje z naslovom Kratice, formule in simboli, kjer je navedeno, da ima slovenščina vedno več kratic in simbolov, slednji nastajajo tako, da se stalne besedne zveze okrnejo do začetnih črk, npr. meter – m, dobljeni krni pa so nato strnjeni v kratico, npr. temeljna organizacija združenega dela – TOZD, ali v formulo, npr. NaCl – natrijev klorid, v primerih, ko je krn en sam, se slednji uporablja kot simbol, npr. H – vodik. Navadno se prvotne krne v kratici piše z velikimi črkami, lahko pa tudi mešano, npr. BiH, a je slednje manj pogosto. Pri branju kratice beremo kot navadne besede ali črkovalno, izjemoma lahko tudi po tuje, npr. BBC – bibisi. Formule in simboli so zapisani z velikimi ali malimi črkami, pri čemer se formule berejo črkovalno CO – ceo, simboli pa se berejo črkovalno zgolj pri narekovanju, sicer se razvezujejo, npr. Na – natrij, v nekaterih primerih se celo prevedejo, npr. t – čas. Krajšavnih pik ne pišemo za kraticami, formulami in simboli. Kratice, ki se berejo nečrkovalno, lahko s pogosto rabo prehajajo v navadno pisano besedje in se kot tako tudi pišejo, npr. Unesco. Dva naglasa lahko ohranijo dvozložne črkovalno brane kratice, npr. SP – [espé] ali [èspé]. Kratice se navadno pišejo samo z velikimi črkami, stilizirano pa tudi z malimi, npr. ptt (Toporišič idr., 1990). »Kratice, formule in simboli so večinoma samostalniki moškega spola (TOZD, UNESCO, SAZU), ženskega spola pa so kratice na nenaglašeni -a, npr. INA, NAMA« (Toporišič idr., 1990, 126). Toporišič pravi še, da »kopičenje kratic ni priporočljivo« (Toporišič idr., 1990, 126), saj naj bi slednje oteževalo razumevanje. Sledi poglavje z naslovom Okrajšave. Gre za »okrajšano zapisane besede ali besedne zveze« (Toporišič idr., 1990, 126), pri katerih je znamenje okrajšanosti pika, npr. oz. – oziroma, navadno so samo pisne, pri branju jih razvežemo, npr. prim. – primerjaj, izjemoma jih lahko črkujemo, npr. itd. V pravopisu najdemo tudi Slovarček manj znanih jezikoslovnih izrazov, v katerem je definirana krajšava, kratično ime, krn in okrajšava. Krajšava je definirana kot »ohranjeni del zapisane besede, okrnjene v nezačetnem delu; skrajšano besedo (ali besedno zvezo) imenujemo simbol, če jo beremo črkovalno (npr. s [es] iz spatium 'pot' ali 'srednji spol'); če jo beremo, kakor da je izpisana v celoti, jo imenujemo okrajšava (npr. t. i. za tako imenovani)« (Toporišič idr., 1990, 202). Kratično ime je »samostalnik, nastal iz začetnih delov večbesednega poimenovanja, npr. TOMOS/Tomos iz Tovarna motorjev Sežana, TOZD/tozd iz temeljna organizacija združenega dela, CK iz centralni komite; sopomenka kratica« (Toporišič idr., 1990, 202). Krn je »beseda, nastala z osamosvojitvijo kakšnega dela navadne besede (besed), npr. izem iz besed kot naturalizem, simbolizem ali Bogo iz Bogomir« (Toporišič idr., 1990, 202). Okrajšava je »ohranjeni del zapisane besede (besedne zveze), okrnjene v 20 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV desnem delu, recimo prim. (primerjaj), t. i. (tako imenovani), npr. (na primer); na koncu okrajšave pišemo piko« (Toporišič idr., 1990, 205). Poglavje s krajšavami najdemo na začetku Pravil, gre za seznam krajšav z naslovom Nekaj krajšav, ki je močno okrnjen v primerjavi z izdajo iz leta 1962, poudarek pa je na slovničnih krajšavah (Arh, 2018). V seznamu najdemo sledeče krajšave: čl. (členek), daj. (dajalnik), dov. (dovršnik), dv. (dvojina), ed. (ednina), gl. (glej), glav. (glavni), idr. (in drugi), im. (imenovalnik), ipd. (in podobno), itd. (in tako dalje), itn. (in tako naprej), izg. (izgovori), kor. (koroško), lat. (latinsko), m (moški spol, moškega spola), madž. (madžarsko), medm. (medmet), mest. (mestnik), mn. (množina), nam. (namesto), nedov. (nedovršnik), neživ. (neživost), npr. (na primer), or. (orodnik), os. (oseba, osebni), oz. (oziroma), predl. (predlog), prekm. (prekmursko), prid. (pridevnik), prim. (primerjaj), primor. (primorsko), prisl. (prislov), rod. (rodilnik), s (srednji spol, srednjega spola), sam. (samostalnik), sh. (srbohrvaško), str. (stran), štaj. (štajersko), štev. (števnik), t. i. (tako imenovan oz. tako imenovana), tj. (to je), tož. (tožilnik), vez. (veznik), zaim. (zaimek), ž (ženski spol, ženskega spola), živ. (živost) (Toporišič, 1990). 2.1.8 Krajšave v Slovenskem pravopisu iz leta 2001 Tako kot v Pravilih iz leta 1990 je tudi v pravopisu iz leta 2001 krovni pojem krajšava. V pravopisu iz leta 2001 najdemo krajšave že v uvodnem delu, in sicer gre za seznam krajšav in slovarskih oznak, ki zajema štiri strani. Krajšave so nato omenjene v pravilih, ki so vsebinsko enaka različici iz leta 1990, le primeri so posodobljeni, pretežno zamenjani s sodobnejšimi krajšavami, namesto TOZD in AVNOJ se uporablja krajšava SAZU (SP, 2001). V pravopisu je navedeno, da ima slovenščina vedno več kratičnih in simbolnih poimenovanj, slednja so lahko domača ali prevzeta in se izoblikujejo z okrnitvijo besed ali stalnih besednih zvez, ki jih navadno okrnimo do začetnih črk, npr. meter – m, tempus – t. Dobljene krne nato strnemo v kratico in iz S, A, Z, U dobimo kratico SAZU, lahko pa jih strnemo v zapis formule in dobimo npr. NaCl (natrijev klorid). Če pa je krn en sam, ga uporabljamo kar kot simbol in ne kot kratice, npr. H (vodik) in t (čas). Simbole za merske enote pišemo s presledkom in vedno za številko, npr. 35 m, 5 a (pet arov), krne v kraticah pa pišemo z velikimi začetnicami in tudi mešano, npr. TAM, SAZU, BiH. Kratice beremo kakor druge besede, npr. TAM [tám], ali 2 Diahrono-sinhroni oris krajšav v slovenskem prostoru 21 črkovalno, npr. SP [espé], samo izjemoma pa tudi s tujimi imeni črk, npr. BBC [bibisì]. Formule navadno beremo črkovalno CO [ceó], simbole pa črkovalno zgolj pri narekovanju. Simbole razvezujemo v prvotna poimenovanja, velikokrat jih tudi prevajamo, npr. Na – natrij, t – čas. Za kraticami, formulami in simboli ne pišemo pike. Dvo- in večzložne črkovalno brane kratice so naglašene na koncu, npr. SP [espé], RTV [ertevé]. S pogosto rabo nečrkovalno brane kratice prehajajo med navadno pisano besedje in se pišejo kot besede, npr. sit, Unesco, Tam. Skladno s pravopisom so kratice, formule in simboli običajno samostalniki moškega spola, npr. TAM, SIT, UNESCO, ženskega spola so navadno kratice na nenaglašeni -a, npr. EFTA, INA, NAMA. Množinska vrednost pri kraticah je redkost, npr. ZDA. V pravopisu so opredeljene tudi okrajšave, in sicer v istoimenskem poglavju, kjer je navedeno, da so to besede ali besedne zveze, ki so zapisane okrajšano, pika pa predstavlja znamenje okrajšanosti, npr. oz. – oziroma, t. i. – tako imenovani, d. d. – delniška družba. Okrajšave so samo pisne, pri branju jih besedno razvezujemo, npr. prim. - primerjaj(te) in ne kot prim., le pri narekovanju lahko okrajšave beremo tudi črkovalno. Okrajšave besednih zvez so zapisane s presledkom, in sicer za vsako okrajšano besedo, npr. n. m. (navedeno mesto), red. prof. (redni profesor), d. d. (delniška družba). Pri zloženkah dele, ki so okrajšani, pišemo brez odmika, vendar z vezajem, če je tako pisana neokrajšana beseda, npr. l.r. (lastnoročno), lit.zg. (literarnozgodovinski). Skupaj pišemo okrajšave, npr. itd., ipd., npr., tj., brez vmesne pike pišemo okrajšave ene same besede, iz katere jemljemo značilne črke za besedno razločevanje: sle. (slovenski), jsl. (južnoslovanski), plpf. (pluskvamperfekt), ide. (indoevropski) (SP, 2001). Pravopis iz leta 2001 vsebuje obsežen seznam krajšav, vrste krajšav pa so v pravopisnih pravilih jasno opredeljene in temeljijo na tistih iz leta 1990 ter so ustrezno posodobljene. V pravopisu imajo kratice, simboli in okrajšave svoje geslo v slovarju, okrajšave in simboli imajo tudi dodatni kvalifikator, kratice ga nimajo. Če je možno pomen kratic razbrati iz posameznih sestavin, je slednji zapisan brez posebnih oznak, npr. SR – Slavistična revija. Ko sam pomen ni jasno razviden iz črk, ki so sestavni deli kratice, je v pokončnih oklepajih pojasnjen pomen kratice, npr. LCD – |zaslon s tekočimi kristali|. Pri tujejezičnih kraticah je poleg slovenskega pomena pomemben tudi izvorni pomen, zato je smiselno in primerno kratico razvezati najprej v tujem jeziku in ji nato dodati slovenski pomen, na tak način rešuje to problematiko pravopis iz leta 1962, pravopis iz leta 2001 pa ne, npr. NATO ima v pokončnih oklepajih podano samo slovensko ustreznico |Severnoatlantska 22 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV zveza|. Pravopis iz leta 2001 dodaja tuje razvezave in slovenske ustreznice samo pri latinskih okrajšavah, in sicer v pokončnem oklepaju doda slovensko ustreznico, npr. e.g. okrajš. exempli gratia |na primer|. Ker nastajajo krajšave skladno z razvojem in s potrebami jezika, bi moral pravopis odražati sinhrono stanje jezika, zato bi bilo smiselno kraticam, kot so NOB, JLA ali ZSSR dodati časovni kvalifikator. Po področni zastopanosti najdemo v pravopisu krajšave s področja prava, npr. Uradni list (Ur. l. in UL, ni pa navzkrižnih kazalk med obema različicama zapisa) in kazenski zakonik (KZ), kratico za Evropsko unijo (EU) pa tudi kratico ZEU (Zahodnoevropska unija), ki je do leta 1954 predstavljala povezavo držav na obrambnem področju, ki so jo leta 2000 ukinili. Pravopis vsebuje kratice s področja telekomunikacij, npr. CD, GSM, PC in RTV. Manjkajo še okrajšava za marec, kratice za ministrstva v Sloveniji, poleg avtomobilske kratice BMW bi lahko npr. dodali tudi kratico VW. Pravopisna pravila opozarjajo na variantnost zapisa kratic, ko slednje prehajajo v navadno pisano besedje in se pišejo z velikimi tiskanimi črkami in kot navadne besede, npr. TÁM in Tám. Področna raba krajšav vodi v pomensko variantnost, zato bi bilo smiselno poenotiti oznake za okrajšave, npr. št. : štev. Variantnost nastopi tudi pri črkovalnem branju kratic. Omeniti velja še variantnost pomenov ene kratice, ki lahko povzroči dvoumnost, ko sta oba pomena kratice povezana tako, da ju je sobesedilno težko ločiti, npr. VŠ – visoka šola; višja šola. Pojavljajo se tudi dodatne variante pomena, npr. cit. – citatno : cit. okrajš. citiran, citat, ter tudi dodatne domače in tuje okrajšave slovničnih izrazov, npr. adj. okrajš. adjektiv |pridevnik|. V posameznih slovarskih geslih so v pravopisu krajšave iz različnih strokovnih in znanstvenih področij. Krajšave so načeloma prikazane sistemsko, v posameznih elementih pa le prihaja do razhajanja z dejansko rabo v jeziku. Nove tvorbe omogočata oblikovna in pomenska variantnost, in sicer ob upoštevanju, da so glede na pomen okrajšave variantno najbolj tolerantna vrsta krajšave, simboli in formule pa so mednarodno standardizirani. Pri kraticah je variantnost dopustna le, dokler je kratica sobesedilno razumljiva (Jarnovič, 2000/2001). Sinhrono-diahroni oris krajšav v slovenskih pravopisih nam jasno prikaže, da so krajšave pereče vprašanje, s katerim so se ukvarjali pravopisni snovalci in sestavljavci že vse od prvih pravopisnih začetkov, in sicer že od leta 1899. Priča smo tudi izmenjavi terminoloških konceptov; poimenovanje kratica je zamenjala krajšava, ki 2 Diahrono-sinhroni oris krajšav v slovenskem prostoru 23 se je ustalila v slovenskem jeziku, kratica pa zaznamuje podvrsto krajšave. Korošec (1993) pravi, da so krajšave vedno spadale k obrobni pravopisni problematiki in so klasificirane glede na sestavo, tj. glede na to, iz katerih delov besed ali besedne zveze nastanejo (prva črka, zlog), glede na izvor (tuje ali domače), glede na to, kako se pišejo (velika, mala začetnica ter velike in male črke, uporaba ločil), kako se izgovarjajo, ali so standardizirane ali priložnostne itd. V različnih obdobjih so jim namenjali več ali manj pozornosti in jih celo preganjali iz rabe, so si pa utrle pot v pravopisna dela in v slovarju pravopisa iz leta 2001 jih najdemo v zavidljivem naboru. 2.2 Krajšave v izbranih informativno-normativnih jezikovnih priročnikih V nadaljevanju pregledamo zastopanost krajšav v informativno-normativnih jezikovnih priročnikih, ki so bili izdani do leta 2016. 2.2.1 Krajšave v Slovarju novejšega besedja slovenskega jezika (2012) V Slovarju novejšega besedja slovenskega jezika iz leta 2012 najdemo krajšave na začetku slovarja, in sicer na dveh straneh, poleg tega pa tudi v slovarju, npr. ABS, CD ipd. Krajšave, ki so vključene v slovar, nastopajo kot samostojna gesela, in sicer v spletni različici Slovarja novejšega besedja slovenskega jezika ob preprostem iskalnem nizu, ko v iskalnik vpišemo besedo krat., najdemo 41 kratic in 3 okrajšave, poizvedba je bila narejena decembra 2017. V nadaljevanju predstavimo značilnosti slovarskega gesla. Kot je razvidno iz slovarskih krajšavnih gesel s spodnje slike, najdemo v geslu podatek o pregibnosti, izgovarjavi ter naglasnih znamenjih, spolu, sledi tipološka oznaka krat., slovenska razlaga, slovenska razvezava in primer rabe ter slovenska razvezava ali tuja razvezava krajšave z oznako izvornega jezika in pri tuji še slovenski prevod. Če ima tuja krajšava slovenski sinonim, npr. pri kratici BSE ali CD, stoji ta za razlago in pred primeri rabe, npr. bolezen norih krav. V etimološkem delu najdemo oznako za jezik in razvezavo v izvornem jeziku, v enojnih narekovajih stoji prevod v slovenščini. Tuja in slovenska razvezava razmeji način krnjenja, in sicer do začetne črke v primeru ABS ali BSE. Krajšave, ki imajo več pomenov, slovar rešuje na dva načina; pri geslu CD sta oba pomena uvedena z arabskima številkama, in sicer vključena v okviru enega gesla, saj gre za pomensko sorodno področje. Za krajšavo CT pa imamo dve slovarski gesli, saj gre za dva konceptualno ločena termina. 24 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV Področnih kvalifikatorjev načeloma ni, opazimo ga samo pri kratici DNK, in sicer biol. Kot je navedeno v zgradbi slovarja, so v slovar vključene tudi pogosto rabljene kratice, in sicer tiste, ki ustrezajo vsaj eni od naslednjih postavk: »1. da je njihova besedotvorna podstava tip novejšega besedja (BSE: bovina spongiformna encefalopatija); 2. da je kratica sestavina novih tvorjenk (SMS-sporočilo); 3. da je zanje že uveljavljeno črkovalno branje kratice (SMS: esemes); 4. da so izhodišče za nove pomene (EMŠO – ‘enotna matična številka občana’: emšo – ‘starejše obdobje, starost’); 5. da so kratičnice izhodišče za nove tvorjenke (CD cedejka)« (Slovar novejšega besedja slovenskega jezika, 2012). 2 Diahrono-sinhroni oris krajšav v slovenskem prostoru 25 ABS -- in -a [abeès in abẹès -êsa] m (ȅ ȇ) krat. zavorni sistem, ki pri zaviranju preprečuje blokiranje koles motornega vozila: Vozniki, ki imajo avtomobile z ABS, so zmotno prepričani, da je njihova zavorna pot krajša E ← agl. ABS, kratica za a(nti-lock) b(raking) s(ystem) ‘protiblokirni zavorni sistem’ BSE -- in -ja [bẹesé -êja in bəsəé -êja] m (e ̣̑ ȇ) krat. nevarna bolezen zlasti goveda, ki prizadene možgane in se prenaša tudi na človeka; bolezen norih krav, bovina spongiformna encefalopatija, goveja spongiformna encefalopatija, nore krave: imeti BSE; izbruh BSE; pojav BSE; Država je že sprejela ukrepe na področju diagnosticiranja BSE (bolezni norih krav) E ← agl. BSE, kratica za b(ovíne) s(pongiform) e(ncephalopathy) ‘bovina spongiformna encefalopatija’ BTC -- in -ja [bẹtẹcé -êja in bətəcə̀] m (e ̣̑ ȇ; ə̏) krat. velik kraj, prostor s trgovskimi, poslovnimi objekti; betece, blagovno-trgovinski center: Glede na uspeh in privlačnost BTC-ja, trgovine v centru mesta ne bodo vitalne s ponujanjem enakega E kratica za B(lagovno)-t(rgovinski) c(enter) CD -ja in -- [cẹdé -êja] m (e ̣̑ ȇ) krat. 1. optična digitalna plošča za shranjevanje podatkov; CD-plošča (1), CD-rom, cede (1), cedejka (1), cederom, kompaktni disk, kompaktna plošča, zgoščenka (1): Pred nekaj meseci je izšel CD s koncertnimi posnetki 2. podatki, navadno glasba, posneti na taki plošči; CD-plošča (2), cede (2), cedejka (2), zgoščenka (2): Ko sem si prvič zavrtel CD v avtu, nisem mogel verjeti, da sta en človek in ena električna kitara lahko tako močna E ← agl. CD, kratica za c(ompact) d(isk), dobesedno ‘zgoščen disk’ kot opozicija do 12-palčnega laserskega diska, agl. laser disk CT1 -- in -ja [cẹté -êja] m (e ̣̑ ȇ) krat. 1. rentgensko slikanje organov v različnih presekih z uporabo računalnika; računalniška tomografija: Pri CT glave prikažejo del, kjer bi utegnil potekati bolezenski proces 2. naprava za rentgensko slikanje organov v različnih presekih z uporabo računalnika; računalniški tomograf: nakup CT-ja; Zdajšnji CT ni samo tehnološko zastarel, zaradi pogostih okvar je tudi nezanesljiv 3. rentgenska slika organov v različnih presekih, sestavljena s pomočjo računalnika; računalniški tomogram: Poleg običajne slike skeleta bi si želeli še CT E ← agl. CT, kratica za c(omputer) t(ommography) ‘računalniška tomografija’ CT2 -- [cẹté] m (e ̣̑) krat. ustanova, ki na ozemlju svoje države skrbi za tujce brez ustreznih dokumentov za bivanje; center za tujce: Odgovorni za problematiko tujcev so intenzivno iskali novo lokacijo, ki bi ustrezala mednarodnim humanitarnim standardom in zakonu o tujcih, kamor bi preselili CT E kratica za c(enter za) t(ujce) DDV -ja in -- in ddv -ja in -- [dẹdẹvé -êja in dədəvə̀] m (e ̣̑ ȇ; ə̏) krat. davek na dodano vrednost; dedeve: obračun DDV-ja; stopnja DDV-ja; uvedba DDV-ja; zakon o DDV; Vlada želi pokriti delni izpad prihodkov z naslova DDV-ja s povišanjem stopnje tega davka E kratica za d(avek na) d(odano) v(rednost) DJ -ja in -- [dídžêj] m, člov. (ȋ-ȇ) krat. 1. kdor izbira, organizira in predvaja glasbo ter dodaja komentarje, navadno v diskoklubih, na radiu; didžej (1), diskdžokej (1): Oder bo po koncertu klasične glasbe zasedel DJ in namesto Bachovih melodij bodo po dvorani odmevali razigrani in udarni ritmi 2. poustvarjalec elektronske glasbe s tehniko mešanja izvornih glasb; didžej (2), diskdžokej (2): DJ je izdal lastni album E ↑dískdžôkej DNK -- in -ja [dẹenká] m (ȃ) krat. , biol. nukleinska kislina, ki nosi zapis genske informacije v vseh živih bitjih; dezoksiribonukleinska kislina: Preiskave DNK omogočajo natančno identifikacijo osebe in preverjanje sorodstvenih povezav med posamezniki E ↑d(ezóksiribo)n(ukleínska) k(islína) DVD -ja in -- in dvd -ja in -- [dẹvẹdé -êja in dəvədə̀] m (e ̣̑ ȇ; ə̏) krat. 1. optična digitalna plošča za shranjevanje večje količine podatkov; devede: posneti na DVD; Na DVD lahko shranimo za dve uri visokokakovostnega videa 2. predvajalnik digitalnih videoplošč: večnamenski DVD E ← agl. DVD, kratica za d(igital) v(ersatile) d(isk) ‘vsestransko uporabni digitalni disk’ DZU -- in -ja in dzu -- in -ja [dəzəú] m (ȗ) krat. družba, ki se ukvarja z upravljanjem (investicijskih) skladov; družba za upravljanje: lastniki DZU-jev; predsednik uprave DZU; prodaja deležev v DZU Atena; DZU te dni 26 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV živahno trguje s svežnji še neunovčenih certifikatov E kratica za d(ružba) z(a) u(pravljanje) EEG -- in -ja [ẹẹgé -êja] m (e ̣̑ ȇ) krat. 1. snemanje razlik v električnih potencialih v možganih prek elektrod na površini glave; elektroencefalografija: Možgansko smrt (iz katere ni vrnitve, čeprav so drugi organi še vitalni) je mogoče ugotoviti s pomočjo preiskave EEG in nuklearne medicine 2. naprava za snemanje razlik v električnih potencialih v možganih; elektroencefalograf(SSKJ): Psiholog in njegovi sodelavci so poskusnim osebam, ki so bile priključene na EEG, kazali čustveno nabite prizore in obraze 3. grafični prikaz razlik v električnih potencialih v možganih; elektroencefalogram(SSKJ): Iz elektroencefalograma (EEG) zdravnik razbere, kateri deli možganov so v določenem trenutku aktivni E ← agl. EEG, kratica za e(lectro)e(ncephalo)g(raphy) ‘elektroencefalografija’ EKG -- in -ja [ẹkagé -êja] m (e ̣̑ ȇ) krat. 1. snemanje, zapisovanje razlik v električnih potencialih v srčni mišici prek elektrod na različnih delih telesa; elektrokardiografija: naprava za EKG; Ko opravite EKG in zdravnik ugotovi, da je ta normalen, obsežne dodatne preiskave navadno niso potrebne 2. naprava za snemanje, zapisovanje razlik v električnih potencialih v srčni mišici; elektrokardiograf(SSKJ): Denar bo bolnišnica porabila za nakup EKG za otroke in mladostnike, saj želijo bolezni srca in ožilja, ki so glavni vzrok smrti pri odraslih, preprečevati že v zgodnji mladosti 3. grafični prikaz razlik v električnih potencialih v srčni mišici; elektrokardiogram(SSKJ): Zdravniki so jo pregledali, posneli EKG in vzeli kri E kratica za (↑)e(léktro)k(ardio)g(rám) ÉMŠO -- in -a in émšo1 -- in -a m (e ̣̑) krat. osebna identifikacijska številka, pod katero je evidentiran državljan v svoji matični državi; enotna matična številka občana: Uslužbenec vtipka EMŠO ali davčno številko kupca in dobi iz centralnega računalnika vse potrebne podatke o kupcu, njegovo ime in priimek, naslov stalnega bivališča E kratica za e(notna) m(atična) š(tevilka) o(bčana) GSM -a in -- in gsm -a in -- [gẹesèm -êma] m (ȅ ȇ) krat. 1. manjši brezžični prenosni telefon, s katerim lahko v mobilnem omrežju vzpostavimo telefonsko zvezo s katerim koli telefonskim naročnikom; mobi1; mobilec, mobilnik, mobilni telefon, mobitel, prenosni telefon: kupiti nov GSM; poklicati po GSM-u; Predrzneži, ki so ga napadli, so zahtevali GSM, in ker jim ga ni takoj dal, so si ga vzeli sami 2. mobilno telekomunikacijsko omrežje, izdelano v skladu s svetlobnim standardom digitalne mobilne telefonije: GSM je digitalni sistem, ki ga je mogoče uporabljati v skoraj vseh državah E ← agl. GSM, kratica za g(lobal) s(ystem for) m(obile communications) ‘svetovni sistem mobilnih komunikacij’ GSO -- [gẹesó] m (o ̣̑) nav. mn. , krat. organizem, katerega genski material je spremenjen z metodami genske tehnologije; genetsko spremenjeni organizem, gensko spremenjeni organizem: vsebovati GSO; register GSO; gojenje GSO; Delo z GSO v laboratorijih poteka po pravilih dobre laboratorijske prakse z upoštevanjem mednarodnih varnostnih pravil E kratica za g(ensko) s(premenjeni) o(rganizem) HÍV -- in -a in hív1 -- in -a m (ȋ) krat. virus, ki se prenaša z nekaterimi telesnimi tekočinami in povzroča aids; hiv2: okužiti se s HIV; Slovenija ima po podatkih Inštituta za varovanje zdravja med uporabniki drog zelo nizko okuženost z virusom hepatitisa in HIV-a, kar kaže na pravočasno izvajanje ustreznih ukrepov E ← agl. HIV, kratica za h(uman) i(mmunodeficiency) v(irus) ‘virus človeške imunske pomanjkljivosti’ HTML -- in -ja in html -- [hətəmələ̀] m (ə̏) krat. računalniški jezik za izdelavo, oblikovanje dokumentov, zlasti spletnih strani: priročnik za kodirni jezik HTML; stran HTML; znanja s področja HTML-ja;Novice je mogoče gledati in posredovati neposredno kot dokumente HTML ali kot navadno besedilo s pripadajočimi slikami E ← agl. HTML, kratica za h(yper)t(ext) m(ark-up) l(anguage) ‘jezik za označevanje nadbesedila’ ÍRC -- in -a m (ȋ) krat. program, ki omogoča istočasno komunikacijo med uporabniki: IRC sicer lahko uporabljamo tudi za bolj ali manj zasebni klepet v dvoje, a načeloma je namenjen skupinskim pogovorom E ← agl. IRC, kratica za i(nternet) r(elay) c(hat) ‘klepet prek interneta’ 2 Diahrono-sinhroni oris krajšav v slovenskem prostoru 27 ISDN -- in -ja in -a [isədənə̀ in iesdeèn in iesdẹèn -êna] m (ə̏; ȅ ȇ) krat. digitalno omrežje za prenos zvoka in podatkov po telefonskem kanalu: Monter je na zid pritrdil škatlico ISDN-ja E ← agl. ISDN, kratica za i(ntegrated) s(ervices) d(igital) n(etwork) ‘celostne storitve prek digitalnega omrežja’ JP -- [jəpə̀] m (ə̏) krat. podjetje v lasti države ali lokalne skupnosti, ustanovljeno za zagotavljanje in uporabo javnih dobrin in storitev; javno podjetje: Ribiči bodo izstavili račun izvajalcu in ne JP Komunala, kot je napisano v članku E kratica za j(avno) p(odjetje) KC1 -- in -ja [kacé -êja in kəcə̀] m (e ̣̑ ȇ; ə̏) krat. bolnišnica, ki združuje več klinik; klinična bolnišnica(SSKJ), klinični center: predsednik sveta KC; strokovni direktor KC; vodstvo KC; V nesreči se je hudo ranil, zato so ga s helikopterjem odpeljali v KC E kratica za k(linični) c(enter) KC2 -- in -ja [kacé -êja in kəcə̀] m (e ̣̑ ȇ; ə̏) krat. ustanova, ki usmerja in vodi kulturno dejavnost; kulturni center: KC Srečko Kosovel E kratica za k(ulturni) c(enter) LCD -ja in -- [elcẹdé -êja] m (e ̣̑ ȇ) krat. tanek, ploščat zaslon, ki prikazuje sliko s pomočjo tekočih kristalov; LCD-zaslon: Slika LCD-jev je izredno ostra, poleg tega ploski zasloni ne generirajo sevanja E ← agl. LCD, kratica za l(iquid) c(rystal) d(isplay) ‘zaslon s tekočimi kristali’ LSD -ja [elesdé -êja] m (e ̣̑ ȇ) krat. močno sintetično mamilo, ki povzroča halucinacije; acid: pivnik LSD; mamilo LSD; Opravili so test in ugotovili, da so bili keksi prepojeni z LSD E ← nem. LSD, kratica za L(yserg)s(äure-)d(iäthylamid) ‘dietilamid lizergične kisline’ MBA -- in -ja [embeá in embẹá] m (ȃ) krat. 1. mednarodni podiplomski študij menedžmenta: Na največji poslovni šoli v Evropi lahko študirate management na stopnjah od certifikata do MBA-ja 2. šola, ustanova, kjer se izvaja ta študij: Po končani ekonomski fakulteti je vpisal še študij na MBA 3. člov. kdor konča mednarodni podiplomski študij menedžmenta; embeajevec, MBA-jevec: vodilni MBA; Vsak četrti novi magister v ZDA je MBA E ← agl. MBA, kratica za M(aster of) b(usiness) a(dministration) ‘magisterij poslovodenja in organizacije’ MŔSA -e in -- in mŕsa1 -e in -- ž (ȓ) krat. patogena bakterija, odporna proti več znanim antibiotikom in v posebnih okoliščinah glavna povzročiteljica bolnišničnih okužb; mrsa2: širjenje MRSE; Zdravljenje okužb z MRSA je problematično, ker so antibiotiki, ki še ostajajo na voljo, vse manj učinkoviti – oziroma so bakterije vse bolj odporne E ← agl. MRSA, skrajšano iz m(ethicil in)-r(esistant) s(taphylococcus) a(ureus) ‘sev bakterije Staphylococcus aureus, odporen na meticilin’ NLP -- in -ja [nələpə̀] m (ə̏) krat. predmet ali svetlobni pojav, ki se za kratek čas pojavi na nebu in katerega vzrok nastanka nekateri povezujejo z obstojem nezemljanov; neznani leteči predmet(SSKJ): NLP so večinoma neslišni, včasih povzročajo tudi nenavadno brnenje E kratica za n(eznani) l(eteči) p(redmet) ÔVE -- m (ȏ) krat. vir energije, ki se zajema iz stalnih naravnih procesov, kot so sončno sevanje, veter, vodni tok, in ki se ne izčrpa; obnovljivi vir energije: V prihodnjih sto letih bodo morali OVE povsem nadomestiti fosilna goriva E po kratici OVE za o(bnovljivi) v(ir) e(nergije) PC -ja [písí in pẹcé -êja in pəcə̀] in písí -- m (ȋ-ȋ; e ̣̑ ȇ; ə̏) krat. računalnik z operacijskim sistemom za enega uporabnika; osebni računalnik: datotečni sistem PC-ja; Podjetje bi še vedno izdelovalo izvirni PC E ← agl. PC, kratica za p(ersonal) c(omputer) ‘osebni računalnik’ iz (↑)personálen in (↑)kompjúter PCB -- in -ja [pẹcẹbé -êja in pəcəbə̀] m (e ̣̑ ȇ; ə̏) krat. strupena, rakotvorna, težko razgradljiva umetna organska spojina iz skupine kloriranih cikličnih ogljikovodikov, ki se uporablja zlasti v industriji; poliklorirani bifenil: onesnaženje s PCB; Pred kratkim so v ZDA in na Nizozemskem raziskovalci odkrili, da visoka raven PCB vpliva na intelektualni razvoj otrok E ← nem. PCB, kratica za P(oly)c(hlor)b(iphenyle) ‘poliklorirani bifenili’ PÍN -a in pín -a m (ȋ) krat. zaporedje številk, navadno štirimestno, ki posamezniku omogoča uporabo plačilne kartice, mobilnega telefona; osebna številka, PIN-koda: odtipkati svoj PIN; PIN moramo hraniti ločeno od kartice E ← agl. PIN, kratica za p(ersonal) i(dentification) n(umber) ‘osebna identifikacijska številka’ 28 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV PMS -- in -ja [pəməsə̀] m (ə̏) krat. skupek simptomov, značilnih za čas pred menstruacijo; predmenstrualni sindrom: sindrom PMS; Če vam nagaja predmenstrualni sindrom (PMS), vas bodo zagotovo razveselili izidi raziskav, ki potrjujejo večplastno delovanje soje pri težavah s PMS E ← agl. PMS, kratica za p(re)m(enstrual) s(yndrome) ‘predmenstrualni sindrom’ PR -- [píjár] m (ȋ-ȃ) krat. načrtovano in usmerjano komuniciranje med organizacijo in javnostjo z namenom doseganja medsebojnega razumevanja, uresničevanja skupnih interesov; odnosi z javnostmi, piar1 (1); piarovstvo, stiki z javnostmi: strokovnjak za PR; Še pred nekaj dnevi je bila vodja marketinga in PR za blagovno znamko E ← agl. PR, kratica za p(ublic) r(elations) ‘odnosi z javnostmi’ RÁM -a in -- in rám -a in -- m (ȃ) krat. računalnikov delovni pomnilnik: V zadnjih petih letih se je število proizvajalcev pomnilniških enot RAM prepolovilo z 28 na 14 E ← agl. RAM, kratica za r(andom) a(ccess) m(emory) ‘bralno-pisalni pomnilnik’ RÓM -a in RÔM -a m (o ̣̑; ȏ) krat. neizbrisljiv bralni računalniški pomnilnik: Cena kartice je 700 dolarjev, če pa podjetju vrnete stari procesor in ROM, vam vrnejo 200 dolarjev E ← agl. ROM, kratica za r(ead-)o(nly) m(emory) ‘bralni pomnilnik’ SÍT -- in sít -- m (ȋ) krat., od 8. oktobra 1991 do 31. decembra 2006 denarna enota Republike Slovenije; slovenski tolar: Prva nagrada na razpisu je 800.000 SIT, druga 400.000 SIT E po mednarodni tričrkovni kratici iz S(loven)i(ja) + t(olar) SMS -a in -ja in sms -a in -ja [esemès -êsa in səməsə̀] m (ȅ ȇ; ə̏) krat. kratko, s številom znakov omejeno pisno sporočilo, navadno poslano po mobilnem telefonu; esemes, message: poslati SMS; Moje nerganje je prekinjal glas gospodične na drugi strani, ki je mirno pojasnjevala, da bodo napako z nenehnim pošiljanjem enega in istega SMS-a poskusili čim prej odpraviti E ← agl. SMS, kratica za s(hort) m(essage) s(ervice) ‘podpora za kratka sporočila’ UMTS -- in umts -- [uemteès in uemtẹès] m (ȅ) krat. sistem mobilnih telekomunikacij, ki omogoča hitrejši in kakovostnejši prenos podatkov: koncesija za UMTS; licenca za UMTS; UMTS je omogočil prenos velikih paketov podatkov, internetnih strani in celo vrsto operacij, kar so nekoč zmogli le hišni računalniki E ← agl. UMTS, kratica za u(niversal) m(obile) t(elecommunications) s(ystem) ‘univerzalni sistem mobilnih telekomunikacij’ USB -- in -ja [uesbé -êja] m (e ̣̑ ȇ) krat. 1. vodilo za povezavo različnih zunanjih naprav z računalnikom, namenjeno predvsem za prenos podatkov: Vse naprave, ki jih priključujemo na USB, so samodejno nastavljive, kar poenostavi začetno namestitev 2. prenosna pomnilniška naprava s takim vodilom; ključek, USB-ključ, USB-ključek: Datoteka je shranjena na USB-ju E ← agl. USB, kratica za u(niversal) s(erial) b(us) ‘univerzalno serijsko vodilo’ VÍP -- m, člov. (ȋ) krat. kdor je zaradi svojega vpliva, pomembnosti, slave deležen posebnih ugodnosti: Prenova zajema poslovne prostore, sejno sobo, prostor za VIP, novo vhodno avlo in poslovne prostore športnih organizacij E ← agl. VIP, kratica za v(ery) i(mportant) p(erson) ‘zelo pomembna oseba’ Slika 1: Kratice v Slovarju novejšega besedja slovenskega jezika; Vir: Slovar novejšega besedja slovenskega jezika 2012. Okrajšave, ki se pojavijo v Slovarju novejšega besedja slovenskega jezika, so zgolj tri, in sicer ddr., d. n. o. in d. o. o. Kot je razvidno s slike 2, je slovarsko geslo sestavljeno tako kot pri kraticah; sestoji iz podatka o pregibnosti, izgovarjavi ter naglasnih znamenjih, spolu, sledi tipološka oznaka okrajš., slovenska razlaga in primer rabe ter slovenska razvezava ali tuja razvezava krajšave z oznako izvornega jezika in pri tuji še slovenski sinonim. 2 Diahrono-sinhroni oris krajšav v slovenskem prostoru 29 ddr. -ja [dədərə̀] m (ə̏) okrajš. pristavek k imenu za dvojni doktorat: prof. ddr. Janez Novak E ← nem. DDr., okrajšano iz D(oktor) D(okto)r d. n. o. -ja [dẹenó in dənəó] m (o ̣̑) okrajš. družba, ki nima osnovnega kapitala in za katero družbeniki odgovarjajo z vsem svojim premoženjem; družba z neomejeno odgovornostjo: Založbi Notes d. n. o. iz Motnika in Prešernova družba iz Ljubljane bosta knjigo prodajali na prireditvenem prostoru v Planici E okrajšano iz d(ružba z) n(eomejeno) o(dgovornostjo) d. o. o. -ja [dẹọó in dəọó] m (o ̣̑) okrajš. družba, za ustanovitev katere je potreben osnovni kapital, sestavljen iz vložkov družbenikov, in za katero ti načeloma odgovarjajo le do višine svojega vložka; družba z omejeno odgovornostjo: Slovenski producenti so vsi – razen dveh izjem – d. o. o.-ji, ne kulturni zavodi E okrajšano iz d(ružba z) o(mejeno) o(dgovornostjo) Slika 2: Okrajšave v Slovarju novejšega besedja slovenskega jezika; Vir: Slovar novejšega besedja slovenskega jezika 2012. 2.2.2 Krajšave v Konceptu Novega razlagalnega slovarja slovenskega knjižnega jezika (2015) V Konceptu Novega razlagalnega slovarja slovenskega knjižnega jezika (2015) je zapisano, da so kratice in okrajšave načeloma obravnavane kot vse ostale iztočnice, vsebujejo enake slovarske podatke, dodatno pa je navedena tujejezična ali slovenska razvezava, podanih je nekaj primerov slovarskih gesel. V slovarju so krajšave predstavljene v okviru iztočnic, in sicer kot leksikalizirane krajšave oz. kratična poimenovanja, npr. DDV, kot simboli, npr. cm, in kot okrajšave, npr. itd., ki so obravnavane kot posebna skupina iztočnic. Poleg besednovrstne oznake imajo leksikalizirane krajšave pripisano še oznako kratica (krat.) ali simbol (simb.). S slike 3 je razvidno, da se razvezave kratic in okrajšav s slovensko podstavo nahajajo pred pomensko razlago, npr. DDV, DNK, g., razvezave s tujejezično podstavo pa v etimološkem razdelku, kjer najdemo tudi podatke o izvornem jeziku, npr. CD1, WC. Navedeno je še, da so lahko razvezave izvorno slovenskih kratic in okrajšav delno pomensko prozorne, saj že same po sebi pripomorejo k razumevanju pomena, tujejezične razvezave pa povprečnemu uporabniku služijo le kot dodatna informacija, in sicer zlasti v primeru manj razširjenih jezikov. Slovenski prevod tujejezične razvezave se lahko nahaja v pomenski razlagi, npr. CD2, etc. V Konceptu so simboli razvezani in opremljeni s slovničnim pojasnilom, nimajo pa posebnega pomenskega opisa, npr. cm, kWh, izvor simbolov pa je dodatno opredeljen v etimološkem razdelku, npr. S. V nadaljevanju sledijo primeri krajšav. Slovarsko geslo slovenske krajšave, npr. DDV, je sestavljeno iz krajšave, slovničnega pojasnila, npr. krat. ali okr., sledi slovenska razlaga ter primer rabe. Slovarsko geslo tujejezične krajšave, npr. CD1, je sestavljeno iz krajšave, slovničnega pojasnila, npr. krat. ali okr., sledi slovenska razlaga, izvorni jezik ter krajšava v izvornem jeziku, ki prikazuje tudi 30 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV način krnjenja, tuja razvezava in dobesedni prevod. Slovarsko geslo slovenske okrajšave, npr. g., je sestavljeno iz slovničnega pojasnila okr., sledi razlaga in primer rabe. Slovarsko geslo tuje okrajšave, npr. etc., je sestavljeno iz slovničnega pojasnila okr., sledi slovenski prevod oz. ustreznica in razlaga ter primer rabe, sledi podatek o izvornem jeziku in tuja razvezava krajšave s ponazoritvijo krnjenja in pomena. Slovarsko geslo simbolov sestoji iz slovničnega pojasnila (simbol) ter razlage, pri kemijskih elementih najdemo še podatek o izvornem jeziku in tujo razvezavo. CD1 /…/ krat. optična digitalna plošča za shranjevanje podatkov /…/ E ← agl. CD, kratica za c(ompact) d(isk), dobesedno ʿzgoščen diskʾ, iz kompakten in disk CD2 /…/ krat. diplomatski zbor, skupina vseh poverjenih diplomatov neke države v drugi državi /…/ E ← frc. CD, kratica za c(orps) d(iplomatique), dobesedno ʿdiplomatsko teloʾ, iz diplomatski in korpus DDV /…/ krat. davek, ki se obračuna glede na razliko med prodajno in osnovno, izvorno ceno izdelka ali storitve: Vlada želi pokriti delni izpad prihodkov z naslova DDV-ja s povišanjem stopnje tega davka DNK /…/ krat. nukleinska kislina, ki nosi zapis genske informacije v živih bitjih in nekaterih virusih: Preiskave DNK omogočajo natančno identifikacijo osebe in preverjanje sorodstvenih povezav med posamezniki WC /…/ krat. stranišče: Stanovanje obsega predsobo, kuhinjo, dve sobi in kopalnico z WC /…/ E ← angl. WC, kratica za w(ater) c(loset), dobesedno ʿmajhna soba z vodoʾ, iz water ʿvodaʾ in closet ʿmajhna zaprta sobaʾ A. D. /…/ okr., v krščanski tradiciji leta Gospodovega, oznaka pred navedbo letnice po štetju od Kristusovega rojstva: Besedilo je datirano z A. D. 1047 E ← nlat. A.D., kratica za lat. a(nno) D(omini) ʿleta gospodovega’ iz annus ʿletoʾ in Dominus ʿgospodʾ etc. /…/ okr. in tako dalje, nakazuje nadaljevanje naštevalnega niza: Vzrok za obolenje so neugodne delovne razmere (vremenski vplivi, klima, prepih etc.) E (← angl. etc.) ← lat. etc., okrajšano iz et c(ētera) ʿin ostaloʾ iz et ʿinʾ in cēterum ʿostalo, ostanekʾ g. okr. pred imenom, nazivom, poimenovanjem poklica naslov za odraslega moškega: Sestanka se je udeležil tudi g. Novak; Spoštovani g. župan! itd. /…/ okr. nakazuje nadaljevanje naštevalnega niza: Temu sledijo drugi pokazatelji, kot so padavine, suše, višina morske gladine itd. tj. okr. napoveduje natančnejšo opredelitev, razlago: V karolinški dobi, tj. v 8. in 9. stoletju, se je na Frankovskem uveljavila rimska liturgija cm simbol za enoto centimeter kWh simbol za enoto kilovatna ura S simbol za kemijski element žveplo E ← nlat. S po lat. sulfur ʿžveploʾ Slika 3: Krajšave v Konceptu Novega razlagalnega slovarja slovenskega knjižnega jezika (2015); Vir: Koncept Novega razlagalnega slovarja slovenskega knjižnega jezika (2015). Obsežen nabor krajšav pa najdemo v Slovarju pravopisnih težav (2014). Na začetku slovarja najdemo seznam uporabljenih krajšav v slovarju, poleg tega krajšave zasledimo tudi med gesli. Nabor krajšav je zelo bogat in upamo si trditi, da gre za najbogatejšo zbirko, ki je trenutno prisotna v normativno-informativnih priročnikih. 2 Diahrono-sinhroni oris krajšav v slovenskem prostoru 31 2.2.3 Pregled krajšav v Slovarju pravopisnih težav (2014) oz. ePravopisu (2017) Izvorno je ePravopis začel nastajati pod imenom Slovar pravopisnih težav. Slovar pravopisnih težav je začel nastajati v okviru projekta Slovenski pravopisni priročnik v knjižni, elektronski in spletni različici (2008–2011). Priročnik je bil zasnovan kot specializiran za pravopisna oz. normativna vprašanja in naj bi prenovil pravopisna pravila. Slovarsko delo je zasnovano problemsko, tj. po problemskih sklopih, in se zato lahko odvija vzporedno s prenovo pravopisnih pravil, ki naj bi se spreminjala na osnovi predlogov za spremembe in s slovarjem tvori normativno delo z utemeljevalno-aplikativnim značajem. Iz zgradbe dela je razvidno, da so se avtorji odločili za ponazoritev rabe posamezne iztočnice z ilustrativnimi zgledi, slednji so prisotni tudi pri simbolih, okrajšavah in lastnih imenih. Zasledimo tudi neokrajšano navajanje pojasnil o rabi in uvajanje novih pojasnil, tudi pri okrajšavah. Med zgledi rabe najdemo skladenjsko rabo pisnih leksikalnih krajšav oziroma simbolov, okrajšav, kratic, s primeri pa je ponazorjena njihova stičnost ob vključevanju v besedilo in tudi raba, kadar gre za sestavni del tvorjenk ali besednih zvez. V slovarju najdemo 470 okrajšav in 124 simbolov, slovarska gesla pa še niso potrjena in so vnesena kot predlog. Utegnemo pa trditi, da je to normativni priročnik z najobširnejšo zbirko krajšav. V nadaljevanju prikažemo strukturo gesla za krajšavna gesla. Ker je ePravopis elektronski slovar in je prosto dostopen na podatkovni zbirki Fran, smo do njega dostopali spletno. V slovarju najdemo raznovrstne krajšave, in sicer izključno okrajšave in simbole, saj kratic in akronimov še ne vsebuje. Vključene pa niso zgolj slovenske krajšave, ampak tudi tuje, npr. latinske. V nadaljevanju sledi predstavitev okrajšav in simbolov. 2.2.4 Pregled okrajšav v Slovarju pravopisnih težav (2014) oz. ePravopisu (2017) Kot je razvidno s slike 4, je slovarsko geslo sestavljeno iz iztočnice, sledijo slovnični podatki, in sicer podatek, da gre za okrajšavo, sledijo zgledi in opozorila, kjer med poševnicama najdemo razvezavo krajšave, pred njo stoji okrajšan izvorni jezik lat., za razvezavo pa prevod. Pod razvezavo in prevodom najdemo še zgled, v kategoriji povezane iztočnice pa še kazalko na slovensko krajšavo pr. Kr., pr. n. št. 32 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV Slika 4: Primer slovarskega gesla – tuja krajšava; Vir: ePravopis (2017). Na sliki 5 je razvidno slovarsko geslo za okrajšavo abs. Za iztočnico najdemo slovnične podatke in nato med poševnicama, pri kategoriji zgledi in opozorila, razvezavo. V našem primeru sta pri razvezavi ohranjeni moška in ženska razvezava, za dvopičjem sledi pravopisni napotek o položaju v zapisu in ločilu, sledijo zgledi rabe. Slika 5: Primer slovarskega gesla – okrajšava; Vir: ePravopis (2017). S slike 6 je razvidno slovarsko geslo z več pomeni, in sicer so slednji razmejeni s poševnicami, vsak v svoji vrsti. Zgledov ni pri pomenu adverb, prislov, pri ostalih pa so navedeni. 2 Diahrono-sinhroni oris krajšav v slovenskem prostoru 33 Slika 6: Primer slovarskega gesla – okrajšava z več pomeni;Vir: ePravopis (2017). Pregled simbolov v Slovarju pravopisnih težav (2014) oz. ePravopisu (2017) V slovarju najdemo tudi simbole, slika 7 prikazuje slovarsko geslo za simbol Bq. Slovarskemu geslu je dodana besedna vrsta in pravopisna oznaka ter podatek o izgovarjavi, najdemo še razvezavo, in sicer slovensko in tujo, sledita zgled ter ponazoritev besedne zveze. Slika 7: Primer slovarskega gesla – simbol; Vir: ePravopis (2017). V slovarju zasledimo tudi krajšave za akademske nazive, kemijske simbole, slovnične okrajšave tipa prisl., ne najdemo pa kratic in ostalih krajšavnih podzvrsti. Splošno menimo, da je slovarsko geslo dobro urejeno, podatki so sistematično prikazani, ponekod je dodana tudi izgovarjava, gesla so sistematično in konsistentno urejena, primeri rabe so konsistentno uporabljeni in so smiselni, večpomenske okrajšave so jasno razložene, posamezni pomeni so prikazani nedvoumno in za uporabnika jasno. 34 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV V okviru ePravopisa (2017) so obravnavani problemski sklopi, ki zajemajo tudi krajšave, in sicer leksikalizirane okrajšave, pri čemer problemski sklop obsega štiri leksikalizirane okrajšave; dede, deoo, espe, vede. Gre za črkovano brane okrajšave, ki postopoma prehajajo med občna poimenovanja in se zato sklanjajo kot navadni samostalniki, npr. dede dedeja. Novost, ki je bila vpeljana decembra 2017, je, da »so vse iztočnične oblike v različnih skladenjskih položajih prikazane v ponazarjalnem gradivu, v oblikoslovnem gnezdu pa so tudi onaglašene« (Problemski sklopi ePravopisa, 2017). Beremo jih na način, ki je v uporabi za kratice, in sicer se prednostno naglašuje vsak zlog, neprednostno le zadnjega. Problemski sklop pri okrajšavah obsega 475 okrajšav, nabor slednjih pa je prenovljen oz. aktualiziran glede na SP 2001 in je dopolnjen z novimi okrajšavami. Problemski sklop poleg običajnih okrajšav zajema:  okrajšave s piko spredaj (.com 'company'),  okrajšave z vezajem, tj. okrajšave prirednih zloženk (č.-b. 'črno-bel'),  okrajšave s stično piko, tj. okrajšave podrednih zloženk (nar.zab. 'narodnozabavni'),  okrajšave lastnih imen (Dol. 'Dolenji', 'Dolnji'),  okrajšave besednih zvez (dipl. inž. 'diplomirani inženir') in  okrajšave delov besedila (itd. 'in tako dalje') (Problemski sklopi ePravopisa, 2017). Med novosti sodijo »s pomočjo oznakovnih pojasnil izpostavljeni posebni položaji, ko postavimo okrajšavo za ločilo (»z vejico«) ali ko se pojavlja okrajšava v zvezi okrajšav (»v zvezi okrajšav«)« (Problemski sklopi ePravopisa, 2017). Okrajšave nazivov imajo prikazan položaj rabe glede na lastno ime, in sicer »pred imenom«, »za imenom«. Izgovarjava je podana tudi pri tistih okrajšavah, ki jih beremo črkovalno ali jih sploh ne razvezujemo, npr. itd., b. p., d. o. o., v. d. »Pri nestično pisanih okrajšavah so naglašene vse sestavine, pri stično pisanih in leksikaliziranih pa le zadnje sestavine« (Problemski sklopi ePravopisa, 2017). Prevladujoča raba in usmerjevalni zapis v pravno-upravnih besedilih sta bila povod, da je bil pravopisni komisiji pri SAZU in ZRC SAZU predlagan zapis okrajšav gospodarskih subjektov, in sicer d. o. o., d. d., s. p., z. b. o., z. o. o., v položajih za imenom tudi stično (Helidrom, d.d.). Komisija je predlog sprejela. 2 Diahrono-sinhroni oris krajšav v slovenskem prostoru 35 Po pregledu zastopanosti krajšav v izbranih informativno-normativnih jezikovnih priročnikih smo ugotovili, da krajšav ne najdemo v Sprotnem slovarju slovenskega knjižnega jezika, ki je začel izhajati leta 2014 in predstavlja tip slovarja, ki nastaja sproti ter popisuje leksiko, ki še ni bila uslovarjena. Prav zato bi pričakovali, da bo popisal tudi krajšave, saj so v drugih slovarjih še vedno precej zapostavljene, v jeziku pa vse bolj prisotne. V Slovarju slovenskih frazemov iz leta 2011 ne zasledimo krajšav, sicer ima slovar na začetku seznam krajšav, ki so uporabljene v slovarju. Po diahrono-sinhronem pregledu položaja krajšav v slovenskih pravopisih in drugih izbranih informativno-normativnih priročnikih lahko zatrdimo, da se je položaj krajšav čez čas spreminjal, in sicer podobno, kot se je spreminjalo krovno poimenovanje, začenši s kratico, ki se po letu 1974 ustali v krajšavo, ki je v uporabi še danes. Če je bil položaj krajšav, po pregledu pravopisov, velikokrat drugoten, saj jim po večini ne namenjajo veliko pozornosti, je njihov položaj danes občutno boljši, saj so krajšave kot samostojna gesla vključena v izbrana odmevna dela, ki jih predstavimo, npr. Slovar novejšega besedja slovenskega jezika, Slovar pravopisnih težav (2014) oz. ePravopis (2017), še vedno pa v slovenskem prostoru nimamo ustreznega slovarja, namenjenega samo krajšavam. Slednji so pogosti v številnih tujih jezikih in bodo podrobneje predstavljeni v 3. poglavju. 36 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV M. Kompara 37 3 KRAJŠAVE V SPLOŠNIH IN SPECIALIZIRANIH SLOVARJIH S krajšavami smo se vsi že kdaj srečali, saj se jim skoraj ne moremo ogniti, prisotne so tako rekoč prav povsod, od dnevnega časopisja do televizije, radia, spleta, spletnih klepetalnic, SMS sporočil ipd. Krajšave so vsesplošno prisoten rastoči pojav, z njimi pa se poleg pravopisov ukvarjajo tudi specializirani krajšavni slovarji. Krajšave in njihove pomene ali krajšavne razvezave največkrat iščemo v različnih slovarjih, lahko pa posežemo tudi po drugih virih, kot je npr. splet. Gabrovšek pravi, da so s krajšavami »križi in težave« (1994: 164), saj jih je izredno veliko in se težko opredeli njihovega uporabnika. Pri razpletanju pomena krajšav si velikokrat pomagamo z najrazličnejšimi slovarji, pri uporabi slednjih pa je zelo pomembno, da so kar najsodobnejši, saj se nove krajšave pojavljajo iz dneva v dan (Gabrovšek, 1994). V krajšavnih slovarjih poleg krajšav pogosto najdemo še razna imena, nadimke, simbole ipd. V nadaljevanju orišemo položaj krajšav v splošnih eno- in dvojezičnih slovarjih ter ustreznih virih za iskanje krajšav. 3.1 Pregled krajšav v Slovarju slovenskega knjižnega jezika Slovar slovenskega knjižnega jezika je enojezični informativno-normativni razlagalni slovar z okrog 110.000 gesli in podgesli in predstavlja temeljno slovaropisno delo v slovenskem prostoru. Prvi enojezični Slovar slovenskega jezika je med letoma 1935 in 1936 izdal Joža Glonar. Lazar (1994) trdi, da besedni zaklad sodobnega knjižnega jezika v širšem smislu zajema 350.000 besed, v ožjem pa 110.000. V širšem smislu 38 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV jih je 350.000 zato, ker so zajete tudi stalne besedne zveze, frazemi in termini itd., izvzete pa so kratice in formule ter lastna imena. SSKJ razlag za kratice in krajšave namreč nima. To je za enojezični slovar zelo nenavadno, saj tuji enojezični slovarji, npr. italijanski ali angleški, ki jih predstavimo v nadaljevanju, običajno vsebujejo tudi kratice in krajšave. V Slovarju slovenskega knjižnega jezika najdemo na začetku slovarja na dveh straneh seznam kratic in kvalifikatorjev, rabljenih v slovarju, v samem slovarju pa ni krajšav in niti okrajšav tipa itd. 3.2 Pregled krajšav v Slovarju slovenskega knjižnega jezika SSKJ2 (2014) V novem Slovarju slovenskega knjižnega jezika (2014), v nadaljevanju SSKJ2, je mogoče zaslediti 38 krajšavnih slovarskih gesel, ki jih predstavimo v nadaljevanju. V predgovoru in uvodu ni zapisano, po kakšnem ključu so bila izbrana krajšavna gesla, so se pa slovaropisci pri izboru gesel ravnali po korpusu Gigafida. V nadaljevanju predstavimo tudi konkordance za posamezno krajšavo iz omenjenega korpusa. Skupna tipološka značilnost vseh 38 krajšavnih gesel je, da so kratice, slednje je tudi navedeno pri vsakem posameznem geslu, in sicer z oznako krat. Slovarsko geslo sestoji iz podatkov o pregibanju, izgovarjavi in naglasnih znamenjih, spolu ter področnih kvalifikatorjih, ki pa niso uporabljeni dosledno. Vsa gesla so opremljena z razlago oz. opisom krajšave, razvezav tujih kratic ni, sledijo pa primeri rabe. V nadaljevanju so prikazani primeri za posamezno črko. Iskanje krajšav je potekalo tako, da je bil v iskalnik vnesen niz krat., najdenih je bilo 47 nizov, a od tega v devetih primerih ne gre za krajšave, npr. najdeni sta bili tudi beseda krat in kraten. ABS -- in -a [abẹès in abeès -êsa] m (ȅ ȇ) avt., krat. zavorni sistem, ki pri zaviranju preprečuje blokiranje koles motornega vozila: serijski ABS; štirikolesni pogon z ABS-om; prvi del zloženk: ABS-sistem; ABS-volan; ABS-zavore Slika 8: Primer krajšavnega gesla ABS iz SSKJ2 (2014). Kot je razvidno iz primera krajšavnega gesla ABS, v geslu najdemo podatek o pregibnosti, izgovarjavi ter naglasnih znamenjih, spolu, in sicer gre za moški spol, naveden je še področni kvalifikator, in sicer avt. (avtomobilizem), sledi tipološka oznaka krat. Geslo je opremljeno z razlago ter zgledi rabe, npr. ABS-zavore, pri slednjem ima funkcijo prvega dela zloženke, ni pa razvezave kratice. Za krajšavo ABS najdemo v korpusu Gigafida 8.578 konkordanc. 3 Krajšave v splošnih in specializiranih slovarjih 39 CD -ja in -- [cẹdé -êja] m (ȇ ȇ) krat. optična digitalna plošča za shranjevanje podatkov; zgoščenka: CD s koncertnimi posnetki; posneti ploščo CD // podatki, navadno glasba, posneti na taki plošči: poslušati CD-je; uničiti ploščo CD; prvi del zloženk: CD- player CD-predvajalnik; CD-predvajalnik naprava za predvajanje zvočnih posnetkov z zgoščenk; CD- plošča in CD-rom zgoščenka CT -- in -ja [cẹté -êja] m (ȇ ȇ) med., krat. rentgensko slikanje organov v različnih presekih z uporabo računalnika; računalniška tomografija: pri CT glave se preiskuje del, kjer bi utegnil potekati bolezenski proces // naprava za rentgensko slikanje organov v različnih presekih z uporabo računalnika; računalniški tomograf: nakup CT-ja; obstoječi CT je tehnološko že zastarel in zaradi pogostih okvar tudi nezanesljiv // rentgenska slika organov v različnih presekih, sestavljena s pomočjo računalnika; računalniški tomogram: CT skeleta; prvi del zloženk: CT-aparat; CT-preiskava; CT-posnetek Slika 9: Primer krajšavnih gesel CD in CT iz SSKJ2 (2014). Iz primera krajšavnega gesla CD je razvidno, da manjka podatek o področnem kvalifikatorju, slednje je sicer pričakovano, saj gre za splošno uveljavljeno krajšavo, ki praviloma nima kvalifikatorja. Opazimo tudi, da je za razlago naveden še drugi uveljavljeni pojem, in sicer zgoščenka, ki je uveden s kazalko, SSKJ2 uvaja samo nadredne sinonime, torej CD usmerja k zgoščenki. Geslo je opremljeno z dvema razlagama, in sicer optična digitalna plošča za shranjevanje podatkov in podatki, navadno glasba, posneti na taki plošči, in nizom zgledov rabe, manjka pa razvezava kratice. V korpusu Gigafida najdemo 44.359 konkordanc za CD. Krajšavno geslo CT je pripravljeno skladno z zasnovo gesla, dodan je tudi področni kvalifikator, in sicer med. Kot geslo CD ima tudi geslo CT več kot eno samo razlago, ima jih tri, in sicer nanašajoč se na rentgensko slikanje, na napravo za rentgensko slikanje ter na rentgensko sliko. Dodani so še drugi uveljavljeni pojmi, ki zaznamujejo vse tri razlage, npr. računalniška tomografija, in sicer kot kazalke, saj SSKJ2 uvaja samo nadredne sinonime, sledijo zgledi rabe pri posameznih pomenih, razvezave kratice CT ni. V korpusu Gigafida najdemo 2.341 konkordanc za CT. Tako v primeru CD kot v primeru CT gre za tujo kratico, v slovarskem geslu pa ni podatka o razvezavi kratice, in sicer CD compact disc ter CT computer tomography, v geslu najdemo samo prevod oz. razlago kratice. 40 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV DÍN -- in -a m (ȋ) krat. nemške industrijske norme: velikost, format je po DIN // fot. enota za občutljivost fotografskega materiala: občutljivost tega filma je sedemnajst DIN; prvi del zloženk: DIN-določanje občutljivosti filma ♦ tisk. DIN-format format pol papirja s stalnim razmerjem stranic, katerih izhodiščna mera je 841 × 1.189 mm DJ -ja in -- [dídžêj -êja] m (ȋ-ȇ) krat. kdor izbira, organizira in predvaja glasbo ter dodaja komentarje, navadno v diskoklubih, na radiu; didžej: radijski DJ; DJ v diskoteki, klubu; delal je kot DJ // poustvarjalec elektronske glasbe s tehniko mešanja izvornih glasb: DJ je izdal lastni album; prvi del zloženk: Dj-program; DJ-producent DNK -- in -ja [dẹenká] m (ȃ) biol., krat. nukleinska kislina, ki nosi zapis genske informacije v vseh živih bitjih; dezoksiribonukleinska kislina: opraviti analize DNK; prvi del zloženk: DNK-analiza; DNK-test; DNK-vzorec DVD in dvd -ja in DVD in dvd -- [dẹvẹdé -êja tudi dəvədə̀] m (ȇ ȇ; ə̏) krat. 1. optična digitalna plošča za shranjevanje večje količine podatkov: posneti na DVD; na DVD lahko shranimo za dve uri visokokakovostnega videa 2. predvajalnik digitalnih videoplošč; DVD-predvajalnik: večnamenski DVD; prvi del zloženk: DVD-predvajalnik; DVD-zapisovalnik; DVD-plošča; izdelava DVD-ROM-ov Slika 10: Primeri krajšavnih gesel DIN, DJ, DNK in DVD iz SSKJ2 (2014). Tudi pri geslu DIN ni področnega kvalifikatorja, ki običajno pri drugih geslih stoji za oznako za spol. Imamo pa podatek, da gre za kratico »nemške industrijske norme«, in sicer gre za velikost oz. format. V slovarskem geslu sicer najdemo področni kvalifikator tiskarstvo (tisk.), ki ga uvede znak za terminološko gnezdo ♦, in sicer označuje termin DIN, podani so tudi podatki o merah. V korpusu Gigafida najdemo 6.192 konkordanc. Tako kot pri kratici DIN, tudi pri kratici DJ področni kvalifikator ni potreben, kot kazalka pa je pri kratici DJ dodatno razvezano besedno imenovanje, in sicer didžej. Geslo je opremljeno z dvema razlagama in zgledi rabe, pri čemer je dopusten tudi zapis Dj, v primeru Dj-program, in sicer kot prvi del zloženke, razvezave kratice DJ ni. V korpusu Gigafida najdemo 15.160 konkordanc. Pri geslu DNK najdemo kvalifikator biologija biol., sledi razlaga, za njo pa razvezana oblika krajšave dezoksiribonukleinska kislina, in sicer kot kazalka, ter zgledi rabe. V korpusu Gigafida najdemo 10.051 konkordanc. Tudi krajšavno geslo DVD ni opremljeno s področnim kvalifikatorjem, v geslu sta dva pomena, ki sta označena z zaporedno številko, pri predhodnih geslih razlage niso bile številčno označene, saj gre za podpomene, ki so označeni z //. Sledi sinonim na DVD-predvajalnik ter zgledi rabe. V korpusu Gigafida najdemo 31.408 konkordanc. Z izjemo kratice DNK, ki je slovenska, vse ostale, ki so tuje, nimajo podatka o razvezavi oz. sinonimu, a uporabniku vsekakor nudijo zadostno razlago okrajšanega pojma. 3 Krajšave v splošnih in specializiranih slovarjih 41 EEG -- in -ja [ẹẹgé -êja] m (ȇ ȇ) med., krat. snemanje razlik v električnih potencialih v možganih prek elektrod na površini glave; elektroencefalografija: ugotoviti možgansko smrt s pomočjo preiskave EEG // naprava za snemanje takih razlik; elektroencefalograf: biti priključen na EEG // grafični prikaz takih razlik; elektroencefalogram: razbrati trenutno aktivnost dela možganov iz EEG; prvi del zloženk: EEG-koherenca; EEG-signal; EEG-zapis EKG -- in -ja [ẹkagé -êja] m (ȇ ȇ) med., krat. snemanje, zapisovanje razlik v električnih potencialih v srčni mišici prek elektrod na različnih delih telesa; elektrokardiografija: opraviti EKG; naprava za EKG // naprava za tako snemanje, zapisovanje takih razlik; elektrokardiograf: nakup EKG-jev za otroke in mladostnike // grafični prikaz takih razlik; elektrokardiogram: posneti EKG in vzeti kri; prvi del zloženk: EKG-naprava; EKG-pregled; EKG-zapis Slika 11: Primer krajšavnih gesel EEG in EKG iz SSKJ2 (2014). Gesli EEG in EKG sta pripravljeni skladno z zasnovo slovarskega gesla, tudi področni kvalifikatorji so uporabljeni. V geslu so tudi razvezave kratic, npr. elektroencefalografija, ki so predstavljene kot sinonimi. Za slednjimi sledijo zgledi rabe. Za EEG v korpusu Gigafida najdemo 509 konkordanc, za EKG pa 947. GSM in gsm -a in GSM in gsm -- [gẹesèm -êma] m (ȅ ȇ) krat. 1. manjši brezžični prenosni telefon, s katerim lahko v mobilnem omrežju vzpostavimo telefonsko zvezo s katerimkoli telefonskim naročnikom; mobilni telefon, mobilnik: kupiti nov GSM; predrzneži, ki so ga napadli, so zahtevali GSM; poklicati po GSM-u 2. mobilno telekomunikacijsko omrežje, izdelano v skladu s svetlobnim standardom digitalne mobilne telefonije: GSM je mogoče uporabljati v skoraj vseh državah; prvi del zloženk: GSM-omrežje; GSM-aparat; GSM-telefon Slika 12: Primer krajšavnega gesla GSM iz SSKJ2 (2014). Pri geslu GSM najdemo dvojični zapis gsm takoj za iztočnico, in sicer za veznikom in, ki predstavlja enakovrednost. Kratica ima dva pomena, gre sicer za izvorno tujejezično krajšavo oz. kratico, a razvezave v geslu ni, prav tako ni področnih kvalifikatorjev. Dodani pa so zgledi rabe. V korpusu Gigafida najdemo 22.411 konkordanc. HTML in html -- in HTML in html -ja [hətəmələ̀] m (ə̏) rač., krat. računalniški jezik za izdelavo, oblikovanje dokumentov, zlasti spletnih strani: novice je mogoče gledati kot dokumente HTML; priročnik za kodirni jezik HTML; stran HTML; znanja s področja HTML-ja Slika 13: Primer krajšavnega gesla HTML iz SSKJ2 (2014). Podobno kot pri geslu GSM je sestavljeno geslo za kratico HTML. Uporabljen je dvojični zapis, razvezave ni, naveden je sicer samo en pomen, uporabljen pa je področni kvalifikator. 42 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV Tako kot pri ostalih geslih tudi tu najdemo zglede rabe. V korpusu Gigafida najdemo 6.935 konkordanc. ÍRC -a in -- m (ȋ) krat. protokol, ki omogoča sočasno komunikacijo med uporabniki na internetu: fanta je spoznala na IRC-u / mreža IRC; prvi del zloženk: IRC-kanal; IRC-strežniki ISDN -- in -a in -ja [iesdẹèn in iesdeèn -êna in isədənə̀] m (ȅ ȇ; ə̏) krat. digitalno omrežje za prenos zvoka in podatkov po telefonskem kanalu: monter je na zid pritrdil škatlico ISDN; prvi del zloženk: ISDN-modem; ISDN-priključek; ISDN-linija Slika 14: Primer krajšavnih gesel IRC in ISDN iz SSKJ2 (2014). Tako v primeru IRC kot ISDN razvezave v geslu ni, prav tako manjkata področna kvalifikatorja, za razlago pa najdemo zglede rabe. Za IRC v korpusu Gigafida najdemo 6.923 konkordanc, za ISDN pa 5.486. JÚS -- in -a m (ȗ) krat. jugoslovanski standardi: izdelki z oznako JUS / suknjič je izdelan po JUS-u; prvi del zloženk: konfekcija po JUS-standardih Slika 15: Primer krajšavnega gesla JUS iz SSKJ2 (2014). Tudi pri geslu JUS ni področnega kvalifikatorja, za pomenom stojijo zgledi rabe. Sprašujemo se, po kakšnem ključu so bile izbrane krajšave kandidatke za vnos v slovar, saj v uvodu slovarja tega podatka ni bilo. Če primerjamo kratici JUS in GSM, se prva v korpusu Gigafida pojavi 1.179-krat, slednja pa 22.411-krat. LCD -ja in -- [elcẹdé -êja] m (ȇ ȇ) krat. tanek, ploščat zaslon, ki prikazuje sliko s pomočjo tekočih kristalov: podatki so se izpisovali na velikem LCD-ju; računalnik z LCD-jem; LCD, bralnik in zvočniki / barvni LCD; prvi del zloženk: LCD-zaslon; LCD-prikazovalnik; LCD-televizor; LCD-zaslon LÉD tudi léd -- ž (ȇ ) elektr., krat. dioda, ki ob prevajanju električnega toka sveti; svetleča dioda: pri vožnji na plin svetijo zelene LED; prvi del zloženk: LED-bliskavica; LED-osvetlitev; LED-svetilo / LED-dioda LSD -ja in -- [elesdé -êja] m (ȇ ȇ) krat. močno sintetično mamilo, ki povzroča halucinacije: poskusiti LSD; opravili so test in ugotovili, da so bili keksi prepojeni z LSD-jem; pivniki LSD-ja; učinek, vpliv LSD-ja; ekstazi, heroin in LSD / mamilo LSD Slika 16: Primer krajšavnih gesel LCD, LED in LDS iz SSKJ2 (2014). Iz zgornjih gesel opazimo, da je področni kvalifikator uporabljen pri kratici LED, in sicer elektrotehnika, elektr., pri kratici LCD pa področnega kvalifikatorja ni, kljub temu da spadata kratici v sorodno področje. Pri kratici LED je dodan še sinonim svetleča dioda. Pri nobenem ni razvezave, za razlago stojijo primeri rabe. Tudi pri kratici LSD ni področnega kvalifikatorja in razvezave, za razlago pa stojijo primeri rabe. V 3 Krajšave v splošnih in specializiranih slovarjih 43 korpusu Gigafida najdemo 15.395 konkordanc za LCD, 55.587 za LED in 96.833 za LDS. MBA -- in -ja [embẹá in embeá] m (ȃ) krat. 1. mednarodni podiplomski študij menedžmenta: študirati menedžment na stopnjah od certifikata do MBA-ja // šola, ustanova, kjer se izvaja ta študij: po končani ekonomski fakulteti je vpisal še študij na MBA 2. kdor konča mednarodni podiplomski študij menedžmenta; embeajevec: vsak četrti novi magister v ZDA je MBA; vodilni MBA; prvi del zloženk: MBA-jevec; MBA-program; MBA-študij; MBA-diploma MŔSA in mŕsa -e in MŔSA in mŕsa -- ž (ȓ) biol., krat. patogena bakterija, odporna proti več znanim antibiotikom in v posebnih okoliščinah glavna povzročiteljica bolnišničnih okužb: širjenje MRSE; zdravljenje okužb z MRSA Slika 17: Primer krajšavnih gesel MBA in MRSA iz SSKJ2 (2014). Pri geslu MBA področnega kvalifikatorja ni, prav tako ni razvezave. Dva pomena sta številčno razmejena, podpomen pa je vključen v sklopu prvega, dodani so primeri rabe. V korpusu Gigafida najdemo 1.990 konkordanc. Geslo MRSA je opremljeno s področnim kvalifikatorjem, razvezave ni, je pa navedena še druga možnost zapisa, in sicer marsa, za razlago sledijo primeri rabe. V korpusu Gigafida najdemo 944 konkordanc. NÉP in nép -- tudi NÉP in nép -a m (ȇ ) krat. ekonomska politika v Sovjetski zvezi pod Leninom v 20. letih 20. stoletja: Slika 18: Primer krajšavnega gesla NEP iz SSKJ2 (2014). Tudi pri kratici NEP zasledimo še drugo obliko zapisa, in sicer nep, ni pa področnega kvalifikatorja in razvezave, tudi zgledov rabe ni za razlago, kar predstavlja izjemo in ni konsistentno z ostalimi gesli. V Gigafidi ima ta kratica zgolj 952 konkordanc. 44 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV PÍN in pín -a m (ȋ) krat. osebna številska koda, navadno štirimestna, ki posamezniku omogoča uporabo plačilne kartice, mobilnega telefona; osebna številka: odtipkati svoj PIN; PIN moramo hraniti ločeno od kartice; prvi del zloženk: PIN-koda PR -- [píjár] m (ȋ-ȃ) krat. načrtovano in usmerjano komuniciranje med organizacijo in javnostjo z namenom doseganja medsebojnega razumevanja, uresničevanja skupnih interesov; odnosi z javnostmi: strokovnjak za PR; vodja PR in marketinga za blagovno znamko; prvi del zloženk: PR-agencija; PR-kampanja; PR-služba PTT1 in ptt -ja [pẹtẹté -êja tudi pətətə̀] m (ȇ ȇ; ə̏) krat. pošta, telegraf, telefon: razvoj PTT-ja / biti v službi pri PTT-ju / prvi del zloženk: PTT-promet; PTT-storitve; PTT-podjetje PTT2 in ptt -- ž [pẹtẹté tudi pətətə̀] (ȇ ; ə̏) krat. pošta, telegraf, telefon: razvoj naše PTT / biti v službi pri PTT / PTT Maribor PVC in pvc -ja tudi PVC in pvc -- [pẹvẹcé -êja tudi pəvəcə̀] m (ȇ ȇ; ə̏) kem., krat. polivinilklorid: proizvajati PVC; izdelki iz PVC-ja; prvi del zloženk: PVC-okno; PVC-folija; PVC-vrečka Slika 19: Primer krajšavnih gesel PIN, PR, PTT1, PTT2 in PVC iz SSKJ2 (2014). Kratici PIN in PR sta sicer tuji, ampak sprejeti v slovenskem prostoru, PIN lahko zapišemo tudi pin, pri obeh geslih pa ni podatka o področnih kvalifikatorjih, prav tako ni izvorne razvezave, za razlago stojijo primeri rabe. V korpusu Gigafida za PIN najdemo 2.769 konkordanc, za PR pa 17.267. Kratica PTT nastopa v dveh ločenih geslih, čeprav pomenskih razlik ni, področnih kvalifikatorjev tudi ni, v prvem primeru je naveden moški spol, ki je ponazorjen s primeri, v drugem pa ženski, ki je prav tako ponazorjen s primeri. V korpusu Gigafida najdemo 2.266 konkordanc. Podobno kot pri PIN in PR tudi kratica PVC, ki se lahko zapiše tudi pvc, nima razvezave in področnega kvalifikatorja, sicer najdemo prevodno ustreznico polivinilklorid, in sicer v vlogi razlage, sledijo še zgledi rabe. V korpusu Gigafida za PVC najdemo 4.346 konkordanc. RÁM in rám -a in RÁM in rám -- m (ȃ) rač., krat. delovni pomnilnik: 64-bitni operacijski sistemi lahko trenutno učinkovito izkoristijo do 8 GB RAM-a; RAM za prenosnike; proizvajalci RAM-a; procesor, trdi disk in RAM RÓM in RÔM -a m (ȏ ; ȏ) rač., krat. neizbrisljiv bralni pomnilnik: procesor in ROM / pomnilnik ROM; prvi del zloženk: ROM-pogon; ROM-pomnilnik; ROM-enota RTV1 in rtv -ja [ertẹvé -êja] m (ȇ ȇ) krat. radiotelevizija: razvoj RTV-ja / delati na RTV-ju; prvi del zloženk: RTV-prispevek; RTV-servis; RTV- naročnina; RTV-postaja RTV2 in rtv -- [ertẹvé] ž (ȇ ) krat. radiotelevizija: razvoj RTV / stavba RTV / RTV Ljubljana Slika 20: Primeri krajšavnih gesel RAM, ROM, RTV1 in RTV2 iz SSKJ2 (2014). Pri kraticah RAM, ki se zapiše tudi ram, in ROM najdemo področni kvalifikator, in sicer rač., razvezave pa ni, čeprav gre za tuji kratici, za razlago pomena najdemo 3 Krajšave v splošnih in specializiranih slovarjih 45 zglede rabe. V korpusu Gigafida najdemo 28.227 konkordanc za RAM in 7.801 za ROM. Podobno kot pri kratici PTT tudi RTV nastopa v dveh ločenih geslih, ki se pomensko ne razlikujeta, razlikujeta se le v spolu, kar je razvidno iz zgledov. Področnih kvalifikatorjev ni. V korpusu Gigafida najdemo 73.941 konkordanc za RTV. SMS in sms -a in SMS in sms -ja [prva oblika esemès -êsa; druga oblika səməsə̀] m (ȅ ȇ; ə̏) krat. kratko, s številom znakov omejeno pisno sporočilo, navadno poslano po mobilnem telefonu: poslati SMS; glasovati, obveščati prek SMS-a, po SMS-ju; napaka pri pošiljanju SMS-a; cene za SMS-e; klici in SMS-ji; prvi del zloženk: SMS-glasovanje; SMS-obveščanje; SMS-sporočilo SOS -- in -a [esọès -êsa tudi sós] m (ȅ ȇ; ȏ ) krat. mednarodni radiotelegrafski znak, s katerim se kliče na pomoč v veliki nevarnosti: ladijski radiotelegrafist je začel spet oddajati: SOS SOS SOS; ladja v bližini je prestregla SOS ● publ. pozimi z gor velikokrat prihajajo klici SOS na pomoč; prvi del zloženk: SOS-klici Slika 21: Primer krajšavnih gesel SMS in SOS iz SSKJ2 (2014). Pri kratici SMS, ki se zapiše tudi sms, ne najdemo razvezave in področnega kvalifikatorja, za razlago stojijo zgledi. Kratica SOS prav tako nima razvezave in področnega kvalifikatorja, za pomenom so podani zgledi. Z znakom za frazeološko gnezdo ● je zaznamovan poseben pomen. Znak je različen od tistega pri kratici DIN. V korpusu Gigafida najdemo 35.024 konkordanc za SMS in 4.675 za SOS. TBC in tbc -- [tẹbẹcé tudi təbəcə̀] ž (ē ; ə̏) krat. tuberkuloza: imeti hudo TBC; prvi del zloženk: TBC-bolnik; TBC-obolenje TV1 in tv -ja [tẹvé -êja] m (ȇ ȇ) krat. televizija: sporočiti po TV-ju; prvi del zloženk: TV-film; TV-sprejemnik; TV-igrica; TV-oddaja TV2 in tv -- ž [tẹvé] (ȇ ) krat. televizija: ljubljanska TV; sporočiti po TV Slika 22: Primer krajšavnih gesel TBC, TV1 in TV2 iz SSKJ2 (2014). Tudi pri kratici TBC ni razvezave in področnega kvalifikatorja, sicer je prisoten prevod tuberkuloza. Kratica TV nastopa v dveh ločenih geslih, čeprav pomen ostaja enak, zamenja se samo spol, kar je ponazorjeno z zgledi. Ker geslo ne more imeti dveh spolov, je uvrščeno v dve gesli. V korpusu Gigafida najdemo 451 konkordanc za TBC in 317.347 za TV. 46 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV UKV -- in -ja [ukavé -êja] m (ȇ ȇ) rad., krat. ultrakratki valovi: naprava za proizvajanje UKV / poslušati oddajo na UKV; prvi del zloženk: UKV-oddajnik; UKV-sprejemnik; UKV-postaja UMTS in umts -- in UMTS in umts -a [uemtẹès in uemteès] m (ȅ ȇ) krat. sistem mobilnih telekomunikacij, ki omogoča hitrejši in kakovostnejši prenos podatkov: koncesija, licenca, razpis za UMTS; pokritost z UMTS; GSM in UMTS; prvi del zloženk: UMTS-aparat; UMTS-mobilnik; UMTS- telefon; UMTS-storitev; UMTS-tehnologija; UMTS-omrežje USB -- in -ja [uesbé -êja] m (ȇ ȇ) rač., krat. vodilo za povezavo različnih zunanjih naprav z računalnikom, namenjeno predvsem za prenos podatkov: priključiti v računalnik prek USB; podpora za USB; računalnik z USB // prenosna pomnilniška naprava s takim vodilom: datoteka je shranjena na USB-ju; prvi del zloženk: USB- ključek ali USB-ključ prenosna pomnilniška naprava s priklopom USB Slika 23: Primer krajšavnih gesel UKV, UMTS in USB iz SSKJ2 (2014). Kratica UKV ima področni kvalifikator, razvezava je navedena. Pri kratici UMTS, ki se zapiše tudi umts, področnega kvalifikatorja ni, prav tako ni razvezave. Pri kratici USB razvezave ni, je pa naveden področni kvalifikator, navedena sta dva pomena. Vsa tri gesla imajo razlago in primere rabe. V korpusu Gigafida najdemo 6.067 konkordanc za UKV, 7.016 za UMTS in 1.116 za USB. VÍP -- m (ȋ) krat. kdor je zaradi svojega vpliva, pomembnosti, slave deležen posebnih ugodnosti: prostor za VIP; prvi del zloženk: VIP-loža; VIP-šotor Slika 24: Primer krajšavnega gesla VIP iz SSKJ2 (2014). Tudi kratica VIP nima razvezave in področnega kvalifikatorja, za razlago pa stojijo zgledi. V korpusu Gigafida najdemo 13.059 konkordanc. Po pregledu 38 gesel, ki so vključena v SSKJ2 (2014), se sprašujemo, na podlagi česa so bila krajšavna gesla izbrana, saj v predgovoru in uvodu v slovar tega podatka ne najdemo. Po pregledani pogostosti kratice GSM in NEP v korpusu Gigafida opazimo obsežen konkordančni odklon, pri čemer se prva pojavi več kot dvaindvajsetkrat pogosteje kot druga. Struktura gesla je nedvomno dobro zastavljena in usmerjena v uporabnika, tako v geslu najdemo podatke o pregibnosti, spolu, tipološki značilnosti krajšave, pri čemer gre v vseh primerih za kratice, ki so označene s krat., ponekod – a nekonsistentno – tudi podatke o področnih kvalifikatorjih, ki naj bi bili samo pri strokovnih geslih, sledi še razlaga ter ponekod razvezava in zgledi rabe. Opozorimo še na izbor pretežno tujih kratic, ki so sicer ustrezno in izčrpno razložene, a razvezav slednjih v slovarskem geslu ni, npr. GSM, CD, DVD, USB. Področni kvalifikatorji niso uporabljeni konsistentno, tako jih ne najdemo pri telekomunikacijskih kraticah tipa GSM, ISDN, IRC, slednja bi utegnila spadati tudi 3 Krajšave v splošnih in specializiranih slovarjih 47 v kategorijo računalništva. Tudi kratici DVD in CD nimata področnega kvalifikatorja, utegnili bi jih povezovati z računalništvom, tako kot kratico USB, ki področni kvalifikator ima. Tudi pri kratici LED in LCD je podobno, pri prvi najdemo področni kvalifikator, pri drugi pa ne. Kratica NEP nima zgledov rabe, prav tako se sprašujemo, zakaj v slovar niso vključene v slovenskem prostoru pogosteje rabljene krajšave, npr. NUK, DZ, EU, BDP, SAZU, ZRC ipd., in zakaj ni vključenih več krajšav, saj v slovenskem prostoru še nimamo sodobnega slovarja krajšav. 3.3 Primerjava SSKJ in SSKJ2 V nadaljevanju primerjamo vključenost krajšav v SSKJ in SSKJ2, in sicer število gesel ter značilnosti slovarskega gesla. Ob vnosu niza kratica v iskalnik SSKJ najdemo 64 primerov, ki so bili tako označeni. Med slednjimi pa vsi niso kratice, saj so kot kratice označene tudi abreviatura, akronim, sigla, simbol in skrajšanka. Krajšave, ki so prisotne v SSKJ in SSKJ2, so DIN, JUS, NEP, PTT, PVC, RTV, SOS, TV, TBC in UKV. 48 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV DIN [dín] m neskl. (ȋ) kratica nemške industrijske norme: velikost, format je po DIN // fot. enota za občutljivost fotografskega materiala: občutljivost tega filma je sedemnajst DIN; neskl. pril.: DIN določanje občutljivosti filma ♦ tisk. DIN format format pol papirja s stalnim razmerjem stranic, katerih izhodiščna mera je 841 x 1.189 mm JUS [jús] m neskl., tudi sklonljivo, zlasti v izgovoru, JUS JUS-a (ȗ) kratica jugoslovanski standardi: izdelki z oznako JUS / suknjič je izdelan po JUS; neskl. pril.: konfekcija po JUS standardih nep -a in NEP NEP-a [nép] m, tudi neskl. (ȇ ) zgod., kratica nova ekonomska politika v Sovjetski zvezi po letu 1921 ptt in PTT [peteté] ž neskl., tudi ptt ptt-ja in PTT PTT-ja m (ȇ ) kratica pošta, telegraf, telefon: razvoj naše ptt / pog. biti v službi pri ptt / PTT Maribor; neskl. pril.: ptt promet; ptt storitve pvc in PVC pvc-ja in PVC-ja [pevecé in pəvəcə̀] m, tudi neskl. (ē ; ə̏) kem., kratica polivinilklorid: proizvajati pvc; neskl. pril.: pvc vrečka rtv in RTV [ertevé] ž neskl., tudi rtv rtv-ja in RTV RTV-ja m (ȇ ) kratica radio televizija: razvoj rtv / stavba rtv / RTV Ljubljana; neskl. pril.: rtv postaje SOS [èsóès tudi sós] m neskl. (ȅ-ō -ȅ; ȏ ) kratica mednarodni radiotelegrafski znak, s katerim se kliče na pomoč v veliki nevarnosti: ladijski radiotelegrafist je začel spet oddajati: SOS SOS SOS; ladja v bližini je prestregla SOS ● publ. pozimi z gor velikokrat prihajajo klici SOS na pomoč; neskl. pril.: SOS klici tbc [tebecé tudi təbəcə̀] ž neskl. (ē ; ə̏) žarg., kratica tuberkuloza: imeti hudo tbc; neskl. pril.: tbc ambulanta TV in tv [tevé] ž neskl., tudi TV TV-ja in tv tv-ja m (ȇ ) kratica televizija: sporočiti po radiu in TV; neskl. pril.: TV sprejemnik UKV [ukavé] m neskl., tudi UKV-ja m (ȇ ) rad., kratica ultrakratki valovi: naprava za proizvajanje UKV / poslušati oddajo na UKV; neskl. pril.: UKV oddajnik, sprejemnik; UKV postaja Slika 25: Krajšave v SSKJ. V nadaljevanju pregledamo značilnosti slovarskega gesla, in sicer primerjamo krajšavi, ki sta vključeni v SSKJ in SSKJ2. Kot je razvidno iz preglednice, je krajšava PTT v SSKJ vnesena kot eno geslo, in sicer zapisana ptt, podana je tudi možnost zapisa PTT. V SSKJ2 je zapis obrnjen, torej PTT in sledi ptt, podobno se zapiše tudi PVC. V obeh geslih stoji v oglatih oklepajih izgovarjava, v SSKJ2 je dodana še izgovarjava s polglasnikom. V SSKJ2 nastopa PTT v dveh ločenih geslih, v prvem primeru je naveden moški spol, v drugem pa ženski. Sledi pomen, ki je v obeh geslih enak, in sicer pošta, telegraf, telefon. Primerov rabe je nekoliko več v SSKJ2. ptt in PTT [peteté] ž neskl., tudi ptt ptt-ja in PTT PTT-ja m (ȇ ) kratica pošta, telegraf, telefon: razvoj naše ptt / pog. biti v službi pri ptt / PTT Maribor; neskl. pril.: ptt promet; ptt storitve PTT1 in ptt -ja [pẹtẹté -êja tudi pətətə̀] m (ȇ ȇ; ə̏) krat. pošta, telegraf, telefon: razvoj PTT-ja / biti v službi pri PTT-ju / prvi del zloženk: PTT-promet; PTT-storitve; PTT-podjetje PTT2 in ptt -- ž [pẹtẹté tudi pətətə̀] (ȇ ; ə̏) krat. pošta, telegraf, telefon: razvoj naše PTT / biti v službi pri PTT / PTT Maribor Slika 26: Krajšava PTT v SSKJ in SSKJ2. Številne krajšave, ki so bile v SSKJ označene kot kratice in so bile posledično najdene z iskalnikom, v SSKJ2 niso več označene kot kratice, saj so postale del navadnega pisanega besedja, npr. agitprop ipd. Ob pregledu krajšavnih gesel iz SSKJ opazimo 3 Krajšave v splošnih in specializiranih slovarjih 49 širši nabor zgodovinsko in politično obarvanih krajšav, ki se danes redkeje uporabljajo, npr. agítpróp, gestápo, infórmbiró, komintêrna, kómpártija, komsomól, polítbiró, polítdelegát, polítkomisár. Gesla so opremljena z navedbo spola, sledi oznaka kratica, razlaga in primeri rabe. Iz nabora krajšav opazimo, da se te redkeje zapišejo z velikimi tiskanimi črkami, če pa se, so te navedene kot druga možnost zapisa, npr. pvc. Zanimiv je tudi zapis krajšav tipa OF in WC, ki se po SSKJ zapišejo oèf in vecé. agítpróp -a m (ȋ-ȏ ) kratica, med narodnoosvobodilnim bojem in prva leta po 1945 agitacijsko-propagandni oddelek političnih organizacij: prevzel je agitprop; član agitpropa cíf prisl. (ȋ) ekon., kratica stroški prevoza, natovarjanja in zavarovanja blaga so všteti v ceni: prodati blago cif / cena žitu je bila cif Reka; neskl. pril.: cif cena čéka -e ž (ȇ ) zgod., kratica izredna komisija za boj proti kontrarevoluciji in špekulaciji v Sovjetski Rusiji od leta 1917 do 1922: ustanoviti čeko / čeka ga je aretirala čekisti día m neskl. (ȋ) kratica diapozitiv: barvni dia; neskl. pril.: dia okvirčki in okvirčki dia diamát -a m (ȃ) žarg., polit., kratica dialektični materializem: učbenik diamata díd -a m (ȋ) pog., kratica, prva leta po 1945 dom igre in dela, otroški vrtec: otroka imajo v didu dópika -e ž (ó ) fin., kratica dvojno knjigovodstvo durál -a m (ȃ) teh., kratica duraluminij enobé -ja m, tudi neskl. (ȇ ) pog., kratica narodnoosvobodilni boj (jugoslovanskih narodov med drugo svetovno vojno): ima odlikovanja iz enobeja [NOB] fób prisl. (ȏ ) ekon., kratica stroški natovarjanja blaga, navadno na ladjo, so všteti v ceni: sladkor so ponudili fob; neskl. pril.: fob cena gestápo -a m, tudi ž neskl. (ȃ) kratica, v nacistični Nemčiji tajna državna policija: vse talce je gestapo obsodil na smrt; šef gestapa; zločini gestapa / aretiral ga je gestapo pripadniki gestapa infórmbiró -ja m (ō -ȏ ) kratica Informacijski biro komunističnih in delavskih partij: ustanovitev informbiroja / resolucija informbiroja o Jugoslaviji Ínterpol in ínterpol -a m (ȋ) kratica mednarodna organizacija policije za odkrivanje, raziskovanje in preprečevanje nepolitičnih kaznivih dejanj: članice Interpola / pog. tega tihotapca išče tudi Interpol pripadniki Interpola kló -ja m (ȏ ) žarg., kratica, prva leta po 1945 krajevni ljudski odbor: kloji so že razposlali vabila komintêrna -e ž (ȇ) zgod., kratica Komunistična internacionala: kongres kominterne; odnos kominterne do nekaterih komunističnih partij kómpártija -e ž (ȏ -á) žarg., polit., kratica komunistična partija: odnosi med kompartijami komsomól -a m (ȏ ) kratica, v Sovjetski zvezi organizacija komunistične mladine: izključili so ga iz komsomola; delegacija komsomola komsomólec -lca m (ȏ ) kratica, v Sovjetski zvezi član komsomola: proslavo so organizirali komsomolci komsomólka -e ž (ȏ ) kratica, v Sovjetski zvezi članica komsomola: postala je komsomolka oèf oêfa m, tudi neskl. (ȅ ȇ) pog., kratica Osvobodilna fronta: bil sem povezan z oefom Orjúna in orjúna -e ž (ȗ) kratica organizacija jugoslovanskih nacionalistov: preprečiti ustanovitev Orjune óvra -e ž (ȏ ) kratica, v fašistični Italiji tajna državna policija: delovanje ovre ózd -a m (ȏ ) kratica organizacija združenega dela: uspehi našega ozda ózna in Ózna -e ž (ȏ ) kratica, med narodnoosvobodilnim bojem in prva leta po 1945 Oddelek za zaščito ljudstva: odpeljati koga na ozno; biti v službi pri ozni pártòp -ôpa m, mn. pártôpi in pártopóvi (ȃ-ȍ ȃ-ó) žarg., kratica top, izdelan med narodnoosvobodilnim bojem v Kočevskem Rogu: v napadu so uporabili partop pénklúb in Pénklúb -a m (ȇ -ȗ) kratica mednarodno združenje književnikov: kongres penkluba polítbiró -ja m (ȋ-ȏ ) kratica, v nekaterih komunističnih partijah politični biro: član politbiroja; dejavnost politbiroja / do 1952 politbiro centralnega komiteja Komunistične partije Jugoslavije 50 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV polítdelegát -a m (ȋ-ȃ) kratica, med narodnoosvobodilnim bojem in prva leta po 1945 politični delegat: politdelegat in politkomisar polítkomisár -ja m (ȋ-á) kratica, med narodnoosvobodilnim bojem in prva leta po 1945 politični komisar: za komandantom je borcem spregovoril še politkomisar; politkomisar Cankarjeve brigade pòp neskl. pril. (ȍ) žarg., kratica popart: majice s pop motivi ● pop glasba zabavna glasba različnih glasbenih zvrsti v drugi polovici 20. stoletja s poudarkom na preprosti muzikalnosti; pop skupina skupina, ki igra pop glasbo pózd -a m (ȏ ) kratica pogodbena organizacija združenega dela: ustanovitev pozda prolétkúlt -a m (ȇ -ȗ) kratica kulturno-prosvetna dejavnost v Sovjetski zvezi po prvi svetovni vojni, ki odklanja tradicionalno umetnost in zahteva posebno kulturo za proletarce: zagovorniki proletkulta rédoks neskl. pril. (ȇ ) kem., kratica redukcijski in oksidacijski hkrati: redoks reakcija / redoks sistem sís -a m (ȋ) kratica samoupravna interesna skupnost: ustanavljati sise / sis za družbene dejavnosti sózd -a m (ȏ ) kratica sestavljena organizacija združenega dela: ustanovitev sozda; sozd in tozdi sténčas -a m (ȇ ) kratica stenski časopis: napisati za stenčas pregled političnih dogodkov / obesiti članek na stenčas típski -a -o prid. (ȋ) nanašajoč se na tip: tipsko pohištvo / tipska izvedba stroja; gradnja objektov je tipska / tipske skupine; tipske značilnosti ♦ teh. tipska oznaka kratica, dodana k imenu proizvoda típsko prisl.: tipsko opredeliti kaj tózd -a m (ȏ ) kratica, do 1989 temeljna organizacija združenega dela: ukiniti, ustanoviti tozde; samoupravljanje v tozdih údba in Údba -e ž (ȗ) pog., kratica uprava državne varnosti: dela pri udbi / udba ga je zasliševala pripadniki uprave državne varnosti únra in Únrra -e [unra] ž (ȗ) kratica, od 1943 do 1949 Uprava Združenih narodov za pomoč in obnovo: ustanovitev unre; neskl. pril.: unra paket vecé -ja m (ȇ ) pog., kratica stranišče: kje je vece [WC] / iti na vece vekapebé -ja m, tudi neskl. (ȇ ) pog., kratica, v Sovjetski zvezi, od 1925 do 1952 Vsezvezna komunistična partija (boljševikov): zgodovina vekapebeja [VKP(b)] Slika 27: Nabor krajšav v SSKJ, ki v SSKJ2 niso več označene kot kratice. Kot zanimivost izpostavimo še krajšavi mio in Rh, ki sta v SSKJ označeni kot kratici, v SSKJ2 pa kot simbol. mío neskl. pril. (ȋ) fin., kratica milijon: stroški znašajo pet mio dinarjev Rh [èrhá] neskl. pril. (ȅ-ā) med., kratica, v zvezi Rh faktor Rhesus faktor: ugotavljati Rh faktor; negativni, pozitivni Rh faktor Slika 28: Krajšavi mio in Rh v SSKJ. 3.4 Pregled krajšav v eSSKJ (2016) V predgovoru Slovarja slovenskega knjižnega jezika oz. eSSKJ (2016), ki predstavlja nov temeljni informativno-normativni razlagalni slovar slovenskega knjižnega jezika, je navedeno, da so slovarski sestavki pripravljeni na novo, in sicer na podlagi analize sodobnega jezikovnega gradiva in skladno s Konceptom novega razlagalnega slovarja slovenskega knjižnega jezika (2015). Delo ponuja rešitve za izbrane aktualne slovaropisne probleme, jezikovni podatki so opisani, organizirani in prikazani tako, 3 Krajšave v splošnih in specializiranih slovarjih 51 da je slovar čim bolj uporaben in razumljiv. Iztočnice so celostno pomensko obravnavane, leksikalizirane krajšave in okrajšave pa so opremljene s polnimi razlagami. Slovarski sestavki se vsako leto dodajo na slovarski portal Fran in tako uresničujejo zamisel o rastočem Slovarju slovenskega knjižnega jezika, slednji opisuje jezikovno stanje in pojmovni svet sodobnega slovenskega jezika, kakor ga dokumentirajo besedilni korpusi slovenskega jezika. Žal v slovarju najdemo samo eno krajšavo, in sicer gre za krajšavo WC. V nadaljevanju sledi prikaz gesla, in sicer je sestavljeno iz iztočnice, sledijo podatki o pregibanju in besedni vrsti ter izgovarjavi, sledi slovenska razlaga, etimološka razlaga, ki vsebuje podatek o izvornem jeziku, na koncu pa najdemo še podatek o tuji razvezavi, ki nakazuje način krnjenja ter prvotni pomen. WC WC-ja; tudi vecé samostalnik moškega spola [vẹcé] 1. urejen zaprt prostor za opravljanje potrebe 1.1. opravljanje potrebe 2. kot pridevnik ki je v zvezi z urejenim zaprtim prostorom za opravljanje potrebe ETIMOLOGIJA: prevzeto iz angl. w. c., okrajšave za w(ater) c(loset) v prvotnem pomenu ‛majhen prostor z vodo’; Slika 29: Primer gesla WC; Vir: eSSKJ (2017). 3.5 Krajšave v splošnih tujejezičnih slovarjih V nadaljevanju pregledamo položaj krajšav v tujejezičnih splošnih slovarjih. Zanima nas, kako so zastopane v izbranih enojezičnih slovarjih v angleškem, italijanskem, nemškem, španskem in francoskem prostoru. 3.5.1 Krajšave v angleških slovarjih V angleškem jeziku kar mrgoli krajšavnih slovarjev, krajšave pa so dobro zastopane tudi v enojezičnih angleških slovarjih, npr. v angleškem enojezičnem slovarju Collins COBUILD English Dictionary (Sinclair, 1999), žal pa jim tam ni namenjeno posebno poglavje na začetku ali koncu slovarja, kjer bi bile sistematično zbrane kot pri nekaterih drugih sorodnih tujih slovarjih, predstavljenih v nadaljevanju. Če se dotaknemo dvojezičnih slovarjev, ki so v paru s slovenskim jezikom, je stanje sledeče: splošni dvojezični Veliki angleško-slovenski slovar (Grad, 1998) vsebuje 100.000 gesel in na koncu kar 32 strani namenja krajšavam. Slovensko-angleški slovar (Grad in Leeming, 1997), ki prav tako šteje 100.000 gesel, ima na začetku nekaj slovarskih krajšav, vendar nima posebnega poglavja, namenjenega krajšavam, niti ne vsebuje krajšav. Nikakor ne gre spregledati Velikega angleško-slovenskega 52 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV slovarja Oxford-DZS, ki je s sodelovanjem založb Oxford University Press in DZS izšel med letoma 2005 in 2006. Iz besedilnih korpusov Bank of English in British National Corpus ter Fida je bil izdelan sodoben angleško-slovenski slovar, ki spremlja stanje sodobne angleščine in slovenščine ter odseva aktualna sporazumevalna razmerja med jezikoma. Slovar, ki celovito pokriva splošno angleško besedišče in strokovno izrazje, vključuje tudi britanske in ameriške različice, krajšave in lastna imena, najdemo torej številne krajšave, pretežno kratice, pogrešamo pa npr. kemijske simbole, simbole za trdoto svinčnikov, mednarodne avtomobilske oznake itd. Slovar je izšel v dveh knjigah, krajšave so v slovarju, ni pa posebnega poglavja, namenjenega krajšavam. Založba je pred leti načrtovala tudi obratni slovar, in sicer slovensko-angleški, a do izdaje ni prišlo. Angleščina ima bogat nabor enojezičnih slovarjev krajšav, npr. A Dictionary of Abbreviations (Vance, 2011), ki v spletni različici ponuja preko 100.000 krajšavnih gesel, in sicer od krajšav letališč ter valut do mednarodnih organizacij, medicinskih in vojaških krajšav. Ker je spletno pregledovanje slednjega možno zgolj ob registraciji in plačilu, ne bo predmet diskusije in nadaljnje obravnave. Med enojezičnimi krajšavnimi slovarji najdemo tudi The Dictionary of Acronyms and Abbreviations in Applied Linguistics and Language Learning (Jung, 1991) ali Penguinov Everyman's Dictionary of Abbreviations (Paxton, 1983), ki vsebuje 27.000 gesel. Angleški prostor je nedvomno bogat s krajšavnimi slovarji, nikakor pa ne zaostajajo tudi ostali jeziki. 3.5.2 Krajšave v italijanskih slovarjih V italijanskem splošnem enojezičnem slovarju Vocabolario della lingua italiana (Zingarelli, 2000) najdemo v prilogi seznam krajšav na štiriindvajsetih straneh. Veliki slovensko-italijanski slovar (Šlenc, 2006) zajema 80.000 gesel, v slovar so vključene krajšave, nima pa posebnega dodatka s krajšavami. Na začetku slovarja je sicer seznam okrajšav, kvalifikatorjev in simbolov, uporabljenih v slovarju. Veliki italijansko-slovenski slovar (Šlenc, 1997) prav tako šteje 80.000 gesel in ima na začetku seznam okrajšav, kvalifikatorjev in simbolov, ki so uporabljeni v slovarju, na koncu slovarja pa je 15 strani italijanskih krajšav in slovenskih prevedkov. V italijanščini sta še dva specializirana slovarja krajšav, in sicer Dizionario di sigle, abbreviazioni e simboli (Righini, 2001), ki šteje 10.000 gesel, in Dizionario delle sigle e degli acronimi (Malossini, 1999) z 8.000 gesli. 3 Krajšave v splošnih in specializiranih slovarjih 53 3.5.3 Krajšave v nemških slovarjih Nemški enojezični slovar Deutsches Universal Wörterbuch (Drosdowski, 1989) ima krajšave, a nima dodatka. Prav tako vsebujeta Veliki slovensko-nemški slovar (Debenjak, 2003) in Veliki nemško-slovenski slovar (Debenjak, 2001) krajšave le v slovarju. Nemci imajo tudi krajšavni slovar Das Wörterbuch der Abkürzungen (Steinhauer, 2005) s 50.000 nemškimi in tujimi gesli. Žal pa tuje krajšave niso prevedene v nemščino. Slovar z enakim številom gesel, tj. 50.000, nosi naslov Wörterbuch Abkürzungen (Kronseder, 2008), žal pa tudi v slednjem tuje krajšave niso prevedene v nemški jezik. 3.5.4 Krajšave v španskih in francoskih slovarjih V španskem prostoru enojezični slovar Clave: Diccionario de Uso del Español (Márquez, 2002) vsebuje krajšave v slovarju, na koncu slovarja pa ima še seznam krajšav, in sicer na petnajstih straneh. Krajšave zasledimo tudi v spletnem španskem slovarju DLE (Diccionario de la lengua Española 2017). Slovensko-španski slovar (Grad, 2000) nima krajšav v slovarju, pa tudi dodatka nima, le na začetku ima seznam slovarskih krajšav. V Špansko-slovenskem slovarju (Grad, 2001) najdemo slovarske krajšave na začetku slovarja, v slovarju jih ne najdemo, na koncu knjige pa na enajstih straneh najdemo seznam španskih krajšav. V francoskem prostoru ima Le Nouveau Petit Robert (Robert, 1996) krajšave v slovarju, dodatka slovar nima. Pri Slovensko- francoskem slovarju (Jesenik, 2005) krajšav ne najdemo, Francosko-slovenski slovar (Grad, 2004) prav tako ne vsebuje krajšav v slovarju, ima pa šest strani dodatka s francoskimi krajšavami. Francozi in Španci imajo številne krajšavne slovarje, sem spadata predvsem slovar angleških in francoskih krajšav Dictionnaire des Abreviations et Acronymes (Murith in Bocabeille, 1992) ter španski krajšavni slovar Diccionario General de Abreviaturas Españolas (Galende, 1997, 2001). Po pregledu zastopanosti krajšav v slovarjih opažamo, da krajšav ne vsebujejo predvsem slovarji za enkodiranje, razen novega Velikega slovensko-italijanskega slovarja (Šlenc, 2006) in Velikega slovensko-nemškega slovarja (Debenjak, 2003). Krajšave pretežno zajemajo slovarji za dekodiranje in enojezični slovarji. Treba pa je opozoriti, da so zelo pogosti tudi specializirani slovarji krajšav, nekateri jeziki jih imajo celo več. V nadaljevanju sledi pregled mikrostrukture slovarjev krajšav. 54 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV 3.6 Zastopanost krajšav v krajšavnih slovarjih V nadaljevanju pregledamo slovarska gesla slovarjev krajšav, primerjamo angleške, nemške ter italijanska, francoski in španski slovar krajšav in povzamemo poglavitne značilnosti ter prednosti in pomanjkljivosti omenjenih del. 3.6.1 Angleški krajšavni slovarji 3.6.1.1 Everyman's Dictionary of Abbreviations V angleškem slovarju Everyman's Dictionary of Abbreviations (Paxton, 1983) najdemo 25.000 abecedno urejenih gesel in več kot 37.000 pomenov ter dodatek. V slovarju poleg angleških krajšav najdemo še tuje, npr. latinske, nemške ali francoske krajšave, ki so dosledno prevedene v angleški jezik. V preglednici 1 so prikazane mikrostrukturne značilnosti slovarja. 3 Krajšave v splošnih in specializiranih slovarjih 55 Preglednica 1: Krajšave v slovarju Primer Značilnosti d.c. dead centre; direct current (elec.); double Sestava gesla je preprosta, neposredno za column; double crochet; drift correction (nav.); geselsko iztočnico, ki je zapisana krepko, stojijo It. da capo, repeat from the beginning (mus.) pomeni krajšave, ločeni s podpičjem. Pri posameznem pomenu v oklepajih stoji področni kvalifikator, npr. (elec.) in (nav.), oznaka za jezik pa stoji pred pomenom oz. razvezavo in je okrajšana, npr. It. Tuji pomen krajšave je zapisan ležeče, npr. da capo, za vejico stoji prevod. Pomeni so v geslu abecedno urejeni, kar uporabniku olajša iskanje. DBD Demokratische Bauernpartei Pri nemški krajšavi opazimo nekaj Deutschlands, Democratic Peasants' Party of nekonsistentnosti, saj v geslu ni naveden jezik, Germany (E. Ger.) kar kaže na nekonsistentno rabo jezikovne oznake pri posameznih geslih, zanimiv pa je podatek, ki nakazuje območje rabe krajšave, in sicer (E. Ger.), Vzhodna Nemčija, ne pa področja rabe s področnim kvalifikatorjem. d/B decibel, unit of noise measurement Pri geslih so prisotni tudi enciklopedični podatki, kjer za razvezavo stoji še dodatni opis têrmina, ki uporabniku nedvomno koristi. Pogrešamo pa rabo področnega kvalifikatorja, morda ga ni, ker je decibel dovolj splošno rabljen. dbl., dble. double Krajšave se pogosto zapisujejo na več načinov. Everyman's Dictionary of Abbreviations (Paxton 1983) to rešuje tako, da oba zapisa poda v enem geslu. Opozoriti pa je treba, da drugi zapis gesla ne stoji vedno kot samostojno geslo, tako v slovarju ne najdemo gesla dble., torej ni dvojične obravnave v enem geslu. D/B d.b. day book Izpostavimo še eno nekonsistentnost, pri kateri ni zaznati pomena krajšave day book. Slednji ima d.b. double bed; double-breasted; draw bar dve različici zapisa krajšave, to sta D/B in d.b., med pomeni enako zapisanega gesla d.b., ki je v nadaljevanju slovarja, razvezave day book ni. 56 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV 3.6.1.2 The New Penguin Dictionary of Abbreviations Angleški krajšavni slovar The New Penguin Dictionary of Abbreviations (Fergusson, 2000) zajema 40.000 abecedno urejenih gesel, na začetku slovarja pa stoji še obširen, po sklopih abecedno urejen dodatek, ki vključuje krajšave, uporabljene v oglaševanju, spletne krajšave, tuje krajšave s področja podjetništva, krajšave za kemijske elemente itn. V slovarju poleg angleških krajšav najdemo še tuje, slednje so konsistentno prevedene. V preglednici 2 so prikazane značilnosti slovarja na ravni mikrostrukture. Preglednica 2: Krajšave v slovarju Primer Značilnosti CME Chicago Mercantile Exchange; Geslo je preprosto, sestoji iz krepko Conférence mondiale de l'énergie (French: World zapisane geselske iztočnice, ki ji sledijo Power Conference); [astronomy] coronal pomeni krajšave, med seboj ločeni s mass ejection; [USA] cost and podpičjem. Tujejezične razvezave so manufacturability expert zapisane ležeče, sledi jim izpisana oznaka za jezik, in sicer v oklepaju, za oznako jezika pa stoji še prevod krajšave. V geslu so uporabljeni področni kvalifikatorji, npr. [astronomy], in sicer izpisani v oglatih oklepajih. V geslu najdemo še oznako za območje rabe krajšave, ki tudi stoji v oglatih oklepajih, npr. [USA]. Cmd Command Paper (1919–56) (in Tudi enciklopedične podatke oz. dodatno parliamentary procedures) razlago je mogoče najti v slovarju, in sicer v oklepaju, npr. (in parliamentary procedures), vendar gesel s tovrstnimi dodatki ni veliko. Prisotni so tam, kjer je raba omejena na določeno obdobje ali področje. 3.6.1.3 Abbreviations Dictionary Abbreviations Dictionary (De Sola, 1986) zajema 23.000 abecedno urejenih gesel. Tako kot The New Penguin Dictionary of Abbreviations (Fergusson, 2000) vsebuje tudi Abbreviations Dictionary obsežen dodatek. Za primerjavo ima Everyman's 3 Krajšave v splošnih in specializiranih slovarjih 57 Dictionary of Abbreviations (Paxton, 1983) skromnejši dodatek. V slovarju najdemo seveda pretežno angleške krajšave, a tudi tuje, ki so vedno prevedene. V nadaljevanju sledijo značilnosti mikrostrukture. Preglednica 3: Krajšave v slovarju Primer Značilnosti aud audible; audit; audition; auditor; Preprosto geslo uvede krepko zapisana auditorium iztočnica, pomeni krajšav so med seboj ločeni s podpičjem. a.u.c. ab urbe condita (Latin – from the V slovarju ni področnih kvalifikatorjev, tuji founding of the city, usually refers to jezik je izpisan v oklepaju za tujo ležeče Rome) zapisano razvezavo, sledi mu prevod oz. angleška razlaga, opazimo tudi nekaj dodatne razlage, ki jo sicer navajajo bolj poredko. 3.6.1.4 World Guide to Abbreviations of Organizations World Guide to Abbreviations of Organizations (Buttress, 1976) je specializiran krajšavni slovar, ki vsebuje abecedno urejena gesla angleških in tujih organizacij. Sledi pregled mikrostrukturnih značilnosti. Preglednica 4: Krajšave v slovarju Primer Značilnosti CCD Conseil de Coopération Douanière Geslo je preprosto, za krepko zapisanim (Belgium) geslom stoji pomen krajšave, tujejezične CCF Crédit Commercial de France krajšave niso prevedene, kar je slabost slovarja. V geslih ni podatka o področnih kvalifikatorjih in jeziku. Navedena je oznaka države, v kateri se krajšava uporablja, vendar ne dosledno, slednje ponazarja primer. 3.6.1.5 Dictionary of Abbreviations and Acronyms Dictionary of Abbreviations and Acronyms (Dale, 1999) je abecedno urejen krajšavni slovar z zelo obsežnim številom krajšav. Slovar ima še obsežen abecedno urejen dodatek, ki šteje več kot 150 strani, v katerem najdemo krajšave s področja 58 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV glasbe, medicine, veterine, zoološke krajšave, geografske krajšave, meteorološke krajšave, krajšave za kemijske elemente itn. Krajšave iz dodatka niso zajete v slovarskem delu. Dodatek je zelo uporaben, a lahko zaradi svojega obsega uporabnika zmede, saj ta namreč ne ve natančno, kje iskati določeno krajšavo, saj mora predhodno v kazalu pregledati in prebrati vsebino dodatka. V slovarju najdemo pretežno angleške krajšave, opazimo pa tudi tuje, ki so dosledno prevedene. Sledi pregled mikrostrukturnih značilnosti. Preglednica 5: Krajšave v slovarju Primer Značilnosti mech mechanical; mechanism; mechanic; Preprosto geslo sestoji iz krepko zapisane mechanics; mechanical geselske iztočnice, sledijo pomeni krajšave, ki so med seboj ločeni s podpičjem. Zanimivo je dejstvo, da so v eno geslo združeni pomeni krajšav z enakim besednim korenom. MC Member of Congress (USA) Popolnoma ločeni so pomeni, ki so MC Master Of Ceremonies obravnavani homonimno, in sicer z enakim MC medium capacity (bomb) (MIL) zapisom krajšave, a z drugačnim pomenom MC Military Cross (MIL) oz. besednim korenom. Opazimo tudi rabo MC medium coeli ( Latin: mid-he a ven) (SCI) področnih kvalifikatorjev, ki stojijo v oklepaju, ter podatek o jeziku, ki se nahaja za tujo krajšavno razvezavo in je ležeče izpisan, sledi mu prevod. MDS, MMDS multipoint microwave Če ima krajšava dva zapisa, sta oba zapisana distribution system (FPA) v istem geslu, drugi zapis ni ločen kot samostojno geslo. MF machine-finished ( paper which has been V oklepaju za krajšavano razvezavo surfaced while on the paper-making machine) opazimo tudi rabo enciklopedičnih (COM) podatkov, ki so zapisani ležeče. 3.6.1.6 Abbreviations and Acronyms Žepni slovarček Abbreviations and Acronyms (Geddes and Grosset, 1999) ima okrog 10.000 abecedno urejenih krajšav. V slovarčku so angleške in tuje krajšave, ki 3 Krajšave v splošnih in specializiranih slovarjih 59 so dosledno prevedene. V nadaljevanju sledi pregled mikrostrukturnih značilnosti gesla. Preglednica 6: Krajšave v slovarju Primer Značilnosti cc carbon copy; cubic centimetre Geslo je preprosto, neposredno za krepko BMW Bayerische Motoren Werke, zapisano iztočnico so pomeni krajšave, ki so German 'Bavarian Motor Works'. med seboj ločeni s podpičjem. Opozorimo še na podatke o jeziku in področnih kvalifikatorjih, ponekod tudi enciklopedičnih podatkih. 3.6.1.7 Acronyms, Initialisms and Abbreviations Dictionary Krajšavni slovar z naslovom Acronyms, Initialisms and Abbreviations Dictionary (Gale Research Company, 2006) je obsežen slovar, ki je ponatisnjen in dopolnjen na letni ravni. Zajema obsežen seznam, vsak pomen stoji v samostojnem geslu, tuje krajšave so prevedene. Opozorimo še na različico od krajšavne razvezave do krajšave z naslovom Reverse Acronyms Initialisms & Abbreviations Dictionary (Gale Research Company, 2007), ki izhaja kot samostojna publikacija in ponuja obrnjeno različico krajšavnega slovarja Acronyms, Initialisms and Abbreviations Dictionary (Gale Research Company, 2006), uporabniku pa omogoča, da iz razvezane oblike najde ustrezno krajšavo. Sledi pregled gesel. Preglednica 7: Krajšave v slovarju Primer Značilnosti A – Age Geslo je preprosto, uvede ga krepko zapisana geselska iztočnica, za katero stoji pomen. A – Agglomerate [Geology] Zaznamo tudi podatke o področnih AA – Andrew Public Library, Alberta kvalifikatorjih in enciklopedične podatke. [Library symbol] [National Library of Canada] (NLC) 3.6.1.8 The Barnhart Abbreviations Dictionary Angleški krajšavni slovar The Barnhart Abbreviations Dictionary (Barnhart, 1995) vsebuje več kot 60.000 krajšav in je sestavljen iz dveh delov, in sicer slovarja krajšav in obratnega slovarja, ki bralca pelje od krajšavne razvezave do krajšave. Prav taki 60 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV slovarji so zelo koristni predvsem pri enkodiranju, ko iščemo zapis krajšave v določenem jeziku. 3.6.1.9 The Dictionary of Acronyms and Abbreviations in Applied Linguistics and Language Learning Obratni slovar, in sicer od razvezave do krajšave, nudi tudi The Dictionary of Acronyms and Abbreviations in Applied Linguistics and Language Learning (Jung, 1991), ki zajema obsežen nabor, vsak pomen pa stoji v samostojnem geslu. Sledi pregled gesla na mikrostrukturni ravni. Preglednica 8: Krajšave v slovarju Primer Značilnosti CST Československá Televize Geslo je preprosto, uvede ga krepko CT Critical Theory (Ss) zapisana geselska iztočnica, za katero stoji CTA Chicago Transit Authority pomen. Slabost slovarja je pomanjkanje CTA Comité des travailleurs Algériens (F) prevodnih ustreznic, ima pa področne kvalifikatorje, ki so navedeni nekonsistentno. 3.6.1.10 Elsevier's Dictionary of Acronyms, Initialisms, Abbreviations and Symbols Omenimo še en krajšavni slovar, in sicer Elsevier's Dictionary of Acronyms, Initialisms, Abbreviations and Symbols (Mattia, 1997), ki ima podobno strukturo kot The Dictionary of Acronyms and Abbreviations in Applied Linguistics and Language Learning (Jung, 1991); torej obsežen slovar, ki vsak pomen razlaga v samostojnem geslu. Geslo je preprosto, uvede ga krepko zapisana geselska iztočnica, za katero stoji pomen. Slovar ne nudi prevodnih ustreznic in področnih kvalifikatorjev, v dodatku pa so krajšave, zbrane po področjih. Zanimiv je tudi večjezični slovar Sveta Evropske unije (Convents, 1994), ki razveže krajšavo v devetih evropskih jezikih, na koncu pa ima tudi dodatek z latinskimi krajšavami. Po pregledu krajšavnih slovarjev v angleškem prostoru lahko povemo, da jih je veliko, nekateri izhajajo pogosto, npr. obsežni slovar založbe Gale vsako leto. Po številu gesel se slovarji zelo razlikujejo, preseneča pa, da od enajstih obravnavanih kar štirje ne nudijo prevodnih ustreznic tujih krajšav, kar verjetno pogreša 3 Krajšave v splošnih in specializiranih slovarjih 61 marsikateri uporabnik, saj na tak način slovar ne reši vprašanja, ampak odpre novo. Kot je razvidno iz preglednic z mikrostrukturo slovarskih gesel, lahko vidimo, da se krajšavni slovarji angleškega jezikovnega prostora močno razlikujejo v mikrostrukturi. Prepogosto manjkajo kvalifikatorji, preveč je nekonsistentnosti in nedoslednosti, in sicer tudi pri rabi jezikovnih oznak in enciklopedičnih podatkov. Nekateri slovarji imajo preobsežne dodatke, ki od uporabnika ob vsakem iskanju krajšave zahtevajo ponovni pogled v kazalo, kar utegne biti zamudno. Pohvalimo pa lahko zelo pozitiven pristop obrnjenega slovarja, ki postaja vse pogostejši. 3.6.2 Nemški krajšavni slovarji 3.6.2.1 Das Wörterbuch der Abkürzungen V nemškem prostoru izpostavimo krajšavni slovar Das Wörterbuch der Abkürzungen (Steinhauer, 2005) s kar 50.000 krajšavami. Tuje krajšave v slovarju niso konsistentno prevedene oz. jih je prevedenih le nekaj. Po besedah avtorice so vključene splošno zanimive krajšave, ki jih je črpala iz slovarjev, enciklopedij, leksikonov, spleta idr., sodelovala je tudi s številnimi terminologi. Avtorica dodaja, da tuje krajšave niso prevedene, saj je namen slovarja predvsem podati razvezavo, tako npr. za krajšavo FIAT pravi, da je v nemškem prostoru znana in ne potrebuje prevoda oz. ta ni pomemben, saj naj bi bilo pomembno, da se bralci zavedajo, da sploh gre za krajšavo (Steinhauer po zasebni korespondenci, 2007). Menimo sicer, da bi bila opisni prevod ali razlaga uporabniku nedvomno koristna. V slovarju opazimo še urejene dele, ki imajo zbrane krajšave določenih področij, npr. domene. Slovar vsebuje še obsežen dodatek, kjer najdemo obrnjeni slovar. Sledi pregled gesel na mikrostrukturni ravni. 62 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV Preglednica 9: Krajšave v slovarju Primer Značilnosti jur. – juridisch; juristisch Gesla so abecedno urejena, iztočnice so zapisane v modrem odtenku, kar olajša iskanje in je v sodobni leksikografiji zelo modno. Pomeni istega besednega korena so zapisani v enem geslu, med seboj so ločeni s podpičjem. Jr. – Jahr · Januar · Junior Pomeni, ki imajo popolnoma drugačen besedni koren, so ločeni s sredinsko piko. kr, Kr – Krone (Währung) Pri krajšavah, ki imajo dva zapisa, se drugi zapis ne pojavi kot samostojno geslo. f.i. – for instance (engl.: »zum Beispiel«) · Opazimo še področne kvalifikatorje in nekaj free in (engl.: »frei eingeladen«) nedoslednosti pri izražanju podatkov o jeziku; nekatere tuje krajšave te podatke FIAT – Fabbrica Italiana Automobili vsebujejo, druge pa ne. Tudi prevodi so Torino nekonsistentni, večinoma jih ni, lastnoimenske krajšave niso prevedene. Enciklopedičnih podatkov ni. 3.6.2.2 Großes Abkürzungsbuch Mnogo starejši nemški slovar krajšav je Großes Abkürzungsbuch (Koblischke, 1983), ki ima abecedno urejena gesla, iztočnice so zapisane krepko, kar nedvomno olajša iskanje. Na koncu slovarja je zelo obsežen dodatek. Sledijo mikrostrukturne značilnosti gesla. Preglednica 10: Krajšave v slovarju Primer Značilnosti AAA American Automobile Vsak pomen je v svojem geslu, iztočnica je Association = Amerikanischer zapisana krepko, kvalifikatorji in jezikovne Automobilverband (USA) oznake so uporabljeni dosledno, vsako tuje geslo je prevedeno. 3 Krajšave v splošnih in specializiranih slovarjih 63 3.6.2.3 Wörterbuch Abkürzungen Omenimo še Wörterbuch Abkürzungen (Kronseder, 2008), ki tudi zajema 50.000 krajšav, a tuje krajšave niso prevedene v nemški jezik. Na koncu slovarja je še obsežen dodatek s tematskimi krajšavami. Sledijo značilnosti na mikrostrukturni ravni. Preglednica 11: Krajšave v slovarju Primer Značilnosti UNICEF United Nations Children's Geslo je preprosto, uvede ga krepko Emergency Fund zapisana iztočnica, sledi razvezava, če je slednja tuja, ni prevedena. Ne opazimo jezikovnih in področnih kvalifikatorjev ter enciklopedičnih podatkov. Preseneča dejstvo, da je starejši nemški slovar Großes Abkürzungsbuch (Koblischke, 1983) na področju mikrostrukture bolj dosleden od obeh novejših; predvsem pri prevodih, enciklopedičnih podatkih, kvalifikatorjih, oznakah jezika, mu pa seveda primanjkujejo novejše krajšave. 3.6.3 Italijanski krajšavni slovarji 3.6.3.1 Dizionario di Sigle, Abbreviazioni e Simboli Italijanščina ima dva krajšavna slovarja, prvi, ki ga predstavljamo, je Dizionario di Sigle Abbreviazioni e Simboli (Righini, 2001), ki šteje okrog 10.000 abecedno urejenih italijanskih in tujih krajšav. V slovarju so vse tuje krajšave prevedene v italijanski jezik, dodatka pa ni. Sledijo značilnosti gesla na mikrostrukturni ravni. 64 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV Preglednica 12: Krajšave v slovarju Primer Značilnosti A. 1 ( posta) Assicurata. 2 ( teatro) Atto. 3 Geslo je preprosto, iztočnica je krepko Autore. zapisana, pomeni pa so med seboj ločeni s krepkimi, ležečimi arabskimi številkami. V geslu so uporabljeni področni kvalifikatorji. ad lib. lat. ad libitum (a volontà). V geslu najdemo podatek o jeziku, ki je zapisan okrajšano in ležeče, prevod stoji za tujejezično razvezavo v oklepaju. bps ( elab. ) ingl. bits per second (bit per Geslo je opremljen še z enciklopedičnimi secondo, unità di misura della velocità di podatki, ki so zapisani ležeče. trasmissione dati). 3.6.3.2 Dizionario delle Sigle e degli Acronimi Drugi italijanski slovar, ki ga predstavljamo, je Dizionario delle Sigle e degli Acronimi (Malossini, 1999). Ta vsebuje okrog 8.000 abecedno urejenih italijanskih in tujih krajšav, tuje krajšave niso prevedene v italijanski jezik, v slovarju prav tako ni dodatka. Sledi predstavitev značilnosti gesla na mikrostrukturni ravni. Preglednica 13: Krajšave v slovarju Primer Značilnosti DRV Device Driver · Driver Geslo je preprosto, geselska iztočnica je krepko zapisana, pomeni so med seboj ločeni s sredinskimi pikami, podatka o jeziku in enciklopedičnih podatkov v slovarju ni, je pa nekaj področnih kvalifikatorjev. 3.6.4 Francoski in španski krajšavni slovarji 3.6.4.1 Dictionnaire des Abréviations et Acronymes V francoskem prostoru smo pregledali slovar Dictionnaire des Abréviations et Acronymes (Murith in Bocabeille, 1992). Sledi predstavitev značilnosti gesla na mikrostrukturni ravni. 3 Krajšave v splošnih in specializiranih slovarjih 65 Preglednica 14: Krajšave v slovarju Primer Značilnosti AAD Geslo je preprosto, geselska iztočnica je active acoustic device zapisana krepko, pomeni so med seboj allocation aux adultes handicapés ločeni tako, da stojijo vsak v svoji alineji. Posamezni pomeni krajšav so zbrani pod enim samim geslom. Slovar vključuje angleške in francoske krajšave, kar uporabnika zmede. Krajšave niso prevedene. 3.6.4.2 Diccionario General de Abreviaturas Españolas V španskem prostoru smo preverili krajšavni slovar Diccionario General de Abreviaturas Españolas (Galende, 1997, 2001), ki zajema 20.000 španskih krajšav. Geslo je preprosto, geselska iztočnica je zapisana krepko. Posamezni pomeni krajšav so zbrani pod enim samim geslom. Kot je razvidno iz analize makro- in mikrostrukture gesel slovarjev krajšav, lahko sklepamo, da so si v nekaterih segmentih zelo podobna, npr. geselske iztočnice so navadno zapisane krepko, pomeni so največkrat ločeni s podpičjem, pojavijo pa se tudi druge oblike ločevanja, npr. arabske številke pri Dizionario di Sigle Abbreviazioni e Simboli (Righini, 2001). Opozoriti pa je treba tudi na razhajanja, npr. slovarji vključujejo domače krajšave, nekateri tudi tuje, teh pa vsi ne prevajajo, nekateri jih nekonsistentno, kar ni uporabniku prijazno. Prevode najdemo v Dizionario di Sigle Abbreviazioni e Simboli (Righini, 2001) in v nekaterih angleških slovarjih. Nemški Das Wörterbuch der Abkürzungen (Steinhauer, 2005) in italijanski Dizionario delle Sigle e degli Acronimi (Malossini, 1999) ter tudi nekateri angleški, npr. World Guide to Abbreviations of Organizations (Butress, 1976), krajšav ne prevajajo ali jih nekonsistentno. Prevodi in razlage tujih krajšav nedvomno koristijo uporabniku in rešijo zapleteni pomen oz. prevod krajšave, zato bi morali biti nujno vključeni v vsak krajšavni slovar. V slovarjih najdemo tudi dodatke, ki so lahko zelo uporabni, če le niso preobsežni oz. taki, da lahko zmedejo uporabnika, npr. Dictionary of Abbreviations and Acronyms (Dale, 1999). Nadvse zamudno je namreč iskanje krajšave v dodatku, če uporabnik ne ve, v katero področje sploh sodi krajšava. V slovarjih so načeloma navedeni področni kvalifikatorji in podatki o jeziku, nekateri slovarji vsebujejo tudi enciklopedične podatke oz. pomenske razlage, ki pomagajo uporabniku razumeti krajšavo v celoti. Na ravni mikrostrukture 66 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV opazimo veliko nekonsistentnosti, najbolj moteči so nekonsistentni prevodi, raba kvalifikatorjev in enciklopedičnih podatkov. Prav vsi navedeni slovarji so že zastareli, novi pa – če sploh nastajajo – žal nastajajo zelo počasi. Tako tudi ne moremo v takih slovarjih iskati novih krajšav, recimo pred leti zelo aktualen SARS ali priljubljenih krajšav, uporabljenih predvsem med mladimi v spletnih klepetalnicah in/ali pri pisanju elektronskih tekstovnih sporočil, npr. BRB, LOL. Krajšavni slovarji bi morali biti čim novejši (Gabrovšek, 1994), a žal krajšave nastajajo hitreje kot novi krajšavni slovarji. SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV M. Kompara 67 4 SLOVENSKI SLOVARJI KRAJŠAV Po pregledu zastopanosti krajšav v tujih specializiranih krajšavnih slovarjih sledi pregled zastopanosti v slovenskem prostoru. V začetnih poglavjih se osredinimo na zastopanost krajšav v pravopisih, kjer opozorimo predvsem na obrobno rabo, saj so bile najpogostejše krajšave navedene v seznamih na začetku oz. na koncu dela, iz dodatkov so se nato razširile v slovarska gesla, s pravopisom iz leta 2001 pa so postale samostojna gesla. V nekaterih tujih jezikih, npr. angleščini, krajšavnih slovarjev kar mrgoli, na splošno so krajšavni slovarji v tujih jezikih zelo pogosti in nekateri jeziki jih vsebujejo celo več vrst, v slovenščini pa je stanje drugačno, saj o pravem slovarju krajšav še ne moremo govoriti. Čeprav smo Slovenci sicer dobili prvi slovenski slovar krajšav z naslovom Kratice, Mala izdaja (Župančič) leta 1948, do danes še nimamo prenovljene izdaje ali novega tovrstnega dela. 4.1 Pregled značilnosti in slovarskega gesla v slovarju krajšav Kratice, Mala izdaja (Župančič, 1948) Slovar uporablja kot krovni pojem poimenovanje kratica, izšel pa je pri Državni založbi Slovenije leta 1948. Skladno z obdobjem nastanka v njem najdemo predvsem krajšave iz časa nastanka slovarja, npr. AFŽ (Antifašistična fronta žena), najdemo pa tudi starejše in tuje krajšave, ki so zapisane tako, kot so se pojavile v knjigah, revijah in časopisih. Slovarski del je abecedno urejen in obsega 36 strani, ponuja pa številne krajšave, ki jih danes ne uporabljamo več oz. niso več tako pogoste in aktualne, saj so vezane na obdobje nastanka slovarja oz. na čas pred njegovim nastankom. Tuje 68 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV krajšave imajo poleg pomena tudi razlago, slovar je opremljen z dodatkom, v katerem najdemo krajšave za učne predmete, razvrščene v posebna poglavja; indijski desetiški sestav, arabske (indijske) številke, rimske številke, računski znaki, dolžinske mere, ploskovne mere, prostorninske mere, utežne mere, časovne mere, kratice za denar in celo preračunski tečaj z nekaterimi valutami, oznake za formate papirja, znake za strani neba in nekatere kemijske elemente (Župančič, 1948). Slika 30: Primeri slovarskih gesel iz slovarja krajšav Kratice, Mala izdaja (Župančič, 1948); Vir: Župančič 1948. Na sliki 30 je zbranih nekaj gesel iz Župančičevega slovarja krajšav. Samo za oris bomo predstavili krajšave v slovarju ter strukturo slovarskega gesla. Geslo je sestavljeno iz iztočnice, sledi znak =, v nadaljevanju stoji razvezava, če je krajšava tuja, najdemo v oklepaju okrajšavo za jezik, npr. (rus.) pri krajšavi AHR, za jezikovnim kvalifikatorjem stoji prevod. Že na prvi pogled lahko opazimo, da je med krajšavnimi gesli precejšnje število tujih krajšav, in sicer na strani 6 in 7, pri črki A je kar 14 tujih krajšav od 34. Takoj lahko opazimo, da so v slovar vključene tako kratice, npr. AHR, kot okrajšave, npr. angl. 4 Slovenski slovarji krajšav 69 V slovarskem geslu je ponekod pri tujih krajšavah še dodatna pomenska razlaga v slovenskem jeziku, ki služi podrobnejšemu orisu pojma, npr. pri kratici AIS imamo izčrpno razlago pojma. V geslu ni področnih kvalifikatorjev. V slovarju je treba upoštevati pravilo doslednosti, opazimo pa, da razvezave niso dosledno prisotne pri geslih, npr. kratici ANP in ANSA nimata niti razvezave in niti jezikovne oznake. Naveden je le slovenski prevod oz. opis, torej ANP = Nizozemska poročevalska agencija, ANSA = Italijanska časopisna agencija. Kot zanimivost velja izpostaviti kratico AP = Associated Press (angl.), Ameriška poročevalska agencija, ki pa ima jezikovno oznako in razvezavo. Tudi pri kratici ANT, ki naj bi bila ruskega izvora, ne najdemo razvezave, navedeno je le, da gre za tip sovjetskega letala, v nadaljevanju se razbere, da je letalo poimenovano po inicialkah graditelja. Če imamo v slovenskem jeziku kratico, ki po pomenu ustreza tuji, to zapišemo na koncu gesla, in sicer za slovensko razvezavo in znakom =, npr. ZVU pri kratici AMG, navzkrižna kazalka pri ZVU je upoštevana. Znotraj gesla je prisotna tudi kratica, npr. v primeru slovenske kratice APN, kjer imamo pri razvezavi uporabljeno kratico RSFSR. Kratica RSFSR ima navzkrižno kazalko. Ker je slovar nastal v povojnem času, je med krajšavami veliko takih, ki so značilne za tisti čas, npr. ASIZ, ASNOM ipd. Če ima krajšava več kot en pomen, je ta v novem geslu, npr. AZ v pomenu Akademija znanosti, Ljubljana ter Akademska založba v Ljubljani. Gesla so organizirana abecedno, prav tako tudi kratice z več pomeni. Kot smo že predhodno omenili, slovarskemu delu sledi obsežen dodatek. V dodatku najdemo na eni strani 47 kratic za učne predmete, npr. Ru = ruščina, Stp = strojepisje, Ve = verouk. Veliko je takih, ki se danes ne uporabljajo več, npr. Le = lepopis. Sledi indijski desetični sestav ter oris arabskih oz. indijskih številk, kjer je navedeno, da so se v Evropi začele uporabljati okrog 12. stoletja. V Evropo so jih sicer prinesli arabski učenjaki, po izvoru pa so indijske. Sledi še opis indijskega številnega sestava. Na 48. strani najdemo nabor rimskih številk, kratek opis ter tudi rimsko številko za leto nastanka dela, in sicer 1948, ob tem pa še navodilo, kako sestavljamo, pišemo in beremo rimske številke. Na naslednjih dveh straneh najdemo računske znake, ki so opremljeni z opisi in zgledi rabe. V nadaljevanju sledi sklop o tvorbi višjih in nižjih merskih enot, in sicer z opisi in zgledi rabe. Na 51. strani najdemo dolžinske mere, pa tudi nekaj zgledov ter preglednico razmerij med posameznimi dolžinskimi merami. Na 52. strani sledijo ploskovne, kubične, telesne in votle mere, na 53. strani pa najdemo primerjalno preglednico enot. Naslednja stran nam ponudi utežne in časovne mere ter zglede rabe. Sledijo kratice za denar, in sicer 8 denarnih simbolov, npr. £, ki so razloženi. V nadaljevanju sledijo 70 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV preračunski tečaji, ki so bili v veljavi od 1. do 30. aprila 1948, npr. 1 nemška marka je bil vredna 2 takratna dinarja. Na 56. strani najdemo še seznam relativnih števil na toplomeru, sledi trdotna lestvica rudnin po Mohsu. Na 57. strani najdemo preglednico formatov papirja, in sicer od A0 do A6, preglednici sledi še obsežen opis o poenotenju formatov. Na 58. in 59. strani najdemo slovenske strani sveta, in sicer smeri neba s pripadajočimi kraticami, razlagami zanje ter grafičnim krožnim prikazom. Na 60. strani najdemo mednarodne znake za strani neba, N = North, S = South, E = East in W = West. Dodan je tudi grafični krožni prikaz slednjih, kjer so vidne in uporabljene tudi kratice za vmesne smeri. Kot zadnje vsebine k dodatku na 61. in 62. strani najdemo nabor važnejših kemičnih elementov, opremljen je z oznako oz. simbolom, poimenovanjem elementa, mednarodnim izrazom ter atomsko težo. Župančičevo delo vsekakor predstavlja krovni slovar tistega časa. Župančičev slovar je bil izdelan mnogo pred računalniško dobo z okrnjenimi sredstvi in pripomočki, domnevamo lahko, da tudi z okrnjenim naborom strokovnjakov in povezav s tujimi viri in leksikografi, a vendar lahko trdimo, da je napisan dobro in je služil svojemu namenu. Žal pa od takrat do danes v slovenskem prostoru še nismo dobili sodobnega slovarja krajšav. Dva poskusa krajšavnega slovarja sta sicer bila narejena, to sta Slovarček krajšav iz leta 2006 in Slovar krajšav iz leta 2011, oba predstavimo v nadaljevanju. 4.2 Pregled značilnosti in gesla v Slovarčku krajšav (Kompara, 2006) Slovarček krajšav je objavljen na spletni strani Inštituta za slovenski jezik Frana Ramovša ZRC SAZU in šteje 5706 krajšav. Na sliki 31 vidimo iskalnik, dodana so še navodila za iskanje, podatki o podatkovnih poljih, splošna oblika iskalnega izraza, dolžina iskalnega izraza, ki je omejena na 74 znakov, ter število prikazanih zadetkov, ki je omejeno na 250 znakov. Iz slike 32 je razviden nabor uporabljenih virov ter tehnični podatki o avtorju, pregledu dela, obsegu in posodobitvah. 4 Slovenski slovarji krajšav 71 Slika 31: Slovarček krajšav (Kompara, 2006). Slika 32: Viri, uporabljeni v Slovarčku krajšav (Kompara, 2006). 72 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV Slovarček je bil izdelan ročno, avtorica je več let zbirala slovenske in tuje krajšave ter krajšavne razvezave. Vse tuje krajšave so prevedene, pri tujih imamo še oznako za jezik. Med tujimi najdemo francoske, italijanske, nemške, angleške ter španske in ruske krajšave, ki se uporabljajo v slovenskem prostoru. Krajšave so razvezane, tuje pa imajo tudi slovenski prevod. Nekatere krajšave imajo več različnih pomenov, slednji pa so navedeni v istem slovarskem geslu in ločeni z arabskimi številkami. Vse tuje krajšave imajo pred pomenom označen izvorni jezik. Slovarček sicer ni razlagalen, a ponekod vseeno podaja dodatne razlage krajšav, in sicer tujih in slovenskih, kot dodatno pomoč pri iskanju ustreznega pomena krajšave. Krajšave iz Slovarčka krajšav so preverjene v različnih virih. Prednost spletne zbirke je tudi možnost hitrega ažuriranja in poenostavljenega iskanja. Slovarček krajšav je bil po letu 1948 prvi poskus sodobnega krajšavnega slovarja v slovenskem prostoru, ima pa nekaj pomanjkljivosti, in sicer neustrezno slovarsko strukturo, predvsem na mikrostrukturni ravni. Menimo, da bi bilo treba slovar posodobiti, pripraviti ustreznejši koncept gesla, saj so trenutno pomeni označeni kar z arabskimi številkami in npr. ne sledijo abecednemu vrstnemu redu. Glede na to, da gre za spletni slovar, bi bilo zelo priročno, če bi uporabniku ponudili obratni slovar, in sicer od razvezave do krajšave. Iz slike 33 je razviden primer slovarskega gesla za krajšavi A in a. Kot je razvidno iz slike 33, ima kratica A 13 razvezav. Posamezne razvezave v geslu so sicer označene z arabskimi številkami, a niso abecedno urejene, npr. aktivnost stoji za razvezavo karta as. Opazimo tudi nekaj dodatne razlage, in sicer pri razvezavi 5, 6 in 8. Med razvezavami najdemo tudi nekaj tujih, in sicer razvezavi 7 in 8. Tudi ti dve razvezavi nista abecedno urejeni, francoska razvezava ni pravilno zapisana, imata pa obe razvezavi tudi slovenski prevod. Pri razvezavi 8 je navedeno, da gre za alt; pevski glas; tudi a. Navzkrižno kazalko na krajšavo (a) sicer imamo, a geslo ni urejeno skladno s predhodnim, kot je razvidno iz slike, je navedena glasbena oznaka: alt; tudi A. Slovar potrebuje konsistentno ureditev gesel, ustrezno strukturo gesel in temeljit pregled. 4 Slovenski slovarji krajšav 73 Slika 33: Primeri gesla iz Slovarčka krajšav (Kompara, 2006). Drugi poskus v slovenskem prostoru je Slovar krajšav (2011), ki bo podrobneje opisan v nadaljevanju. Tudi Slovar krajšav je spletni slovar, ki je bil objavljen na slovarskem spletnem portalu Termania in šteje 2571 gesel. Zanimivost slovarja je, da je bil v celoti sestavljen samodejno. Tudi v tem slovarju najdemo slovenske in tuje krajšave ter njihove razvezave, tuje krajšave so opremljene z jezikovnim kvalifikatorjem, označen je tuj jezik, prevodov tujih krajšav pa ni. Slovar je bil za razliko od Slovarčka krajšav izdelan samodejno, in sicer s pomočjo niza algoritmov, začenši s tistim za prepoznavanje krajšav v elektronskih besedilih, sledila pa je uporaba algoritma za lematizacijo, saj so se s filtracijo razvezave pojavile večinoma v neimenovalniški obliki, ki je nujna za vključitev v slovar. Sledilo je še dodajanje oznake za jezik. Ker je Slovar krajšav prvi slovar, ki je bil izdelan samostojno, lahko trdimo, da gre za pionirsko delo v jezikovnem prostoru, posledično ga lahko za to pohvalimo. Kljub temu ima nekaj pomanjkljivosti; ne vsebuje prevodov tujih razvezav, prav tako pogrešamo obratni slovar in obširnejši nabor gesel. 4.3 Kje še najdemo krajšave Poleg pravopisov, splošnih in krajšavnih slovarjev, lahko v slovenskem prostoru krajšave zasledimo tudi v Velikem slovarju tujk iz leta 2002, saj je krajšavam namenil posebno dodatno poglavje z naslovom Simboli, kratice in okrajšave, ki zajema 12 strani. Veliki slovar tujk je opremljen še s poglavjem, v katerem so zajete krajšave, uporabljene v slovarju (Tavzes, 2002). Poleg slovarjev v knjižni obliki je treba omeniti še spletne zbirke, ki so lahko veliko bolj ažurne od knjižnih. Prednost spletne zbirke je tudi v tem, da včasih uporabniku omogočajo celo, da sam dodaja krajšave in krajšavne razvezave. Primera spletne zbirke sta že omenjena Slovarček krajšav (Kompara, 2006) in Slovar krajšav (Kompara, 2011). Slovarska spletna zbirka, ki poleg terminologije zajema tudi krajšave, je Evroterm, terminološka zbirka izrazov, 74 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV ki je začela nastajati med pripravljanjem slovenske različice pravnih aktov Evropske unije v okviru Sektorja za prevajanje, redakcijo in terminologijo Službe Vlade RS za evropske zadeve (SVEZ), njen namen pa je bil poenotiti rabo terminologije pri pripravi slovenske različice pravnih aktov Evropske unije. Na spletu je na voljo od avgusta 2000, terminologija izvira iz prevodov pravnih aktov in drugih dokumentov, ki jih prevajajo v državni upravi. Zbirka je večjezična in zajema številne jezike, vsi jeziki pa niso tako dobro zastopani kot angleščina. V Evrotermu najdemo tudi krajšave, predvsem kratice angleškega izvora, ki so dosledno prevedene v slovenski jezik in občasno tudi v druge tuje jezike, ni pa okrajšav in slovenskih krajšav. Med drugimi večjimi spletnimi zbirkami velja omeniti še zbirko Acronym Finder, ki uporabniku omogoča iskanje krajšav ali krajšavnih razvezav ter vnos nove definicije krajšave, in The Free Dictionary, ki omogoča iskanje krajšav, natančneje akronimov. Prednost spletnih zbirk je, da so nedvomno ažurnejše od knjižnih, odpirajo pa problematiko samodejnega prepoznavanja krajšav v besedilih in samodejnega oblikovanja spletnih slovarjev in zbirk krajšav, kot npr. Slovarja krajšav (Kompara, 2011). Na spletu najdemo veliko število tujih, predvsem angleških krajšavnih zbirk oz. iskalnikov krajšav. Med njimi velja omeniti zbirko IATE (Inter-Active Terminology for Europe), medinstitucionalno terminološko zbirko Evropske unije, ki jo od leta 2004 uporabljajo inštitucije in agencije Evropske unije. IATE zajema vse obstoječe zbirke prevajalskih oddelkov Evropske unije, in sicer v eni sami interaktivni in prosto dostopni zbirki. Zbirka je nepopolna in nekonsistentno grajena, saj je v njej treba ob vpisu krajšave izbrati izvorni jezik, kar je zamudno, velikokrat pa tudi ne poznamo izvornega jezika krajšave, saj se v marsikaterem jeziku namesto prevedene različice uporablja izvirna. Za običajnega uporabnika, ki ne dela v okviru Evropskih institucij, je zelo moteče tudi podajanje razvezav in prevodov vsake inštitucije posebej v svoji preglednici. Uporabnika prepusti lastni presoji, saj mora sam izbrati ustrezni niz, prav slednje ga utegne odvrniti. Težavo bi utegnili rešiti z znotraj institucionalnim poenotenjem in boljšo podporo jezikovnih tehnologov. Težava s krajšavami je predvsem v tem, da je danes veliko več krajšav kot takrat, ko je izšlo Župančičevo delo. Z mislijo na obsežno število krajšav, s katerimi se vsak dan srečujemo in ob zavedanju, da je veliko takih, ki čez čas izginejo iz jezikovne rabe, je slovaropiscem zaupana pomembna in težka naloga, in sicer katere krajšave vključiti in katerih ne. Splošne krajšave poznamo, strokovnih morda sploh ne 4 Slovenski slovarji krajšav 75 potrebujemo, saj so strokovnjaki tisti, ki jih morajo poznati in uporabljati. Slovaropisec pa se mora vsekakor zavedati, da bi ob vključevanju krajšav brez posebnih omejitev in kriterijev dobil preobsežno delo. Težava pri slovarjih – in tu ne mislimo samo na krajšavne slovarje – je ažurnost, saj je praviloma slovar star že na dan izida. Zavedati se moramo tudi, da slovar hitro zastara, saj slovaropisci ob uporabi tradicionalnih slovaropisnih pristopov težko sledijo spremembam in pojavom v jeziku, nič drugače ni s krajšavami in krajšavnimi slovarji. Vsekakor menimo, da si krajšave zaslužijo svoje publikacije, in sicer sodoben slovar, ki bo odražal kar se le da ažurno stanje v jeziku, vsekakor pa bi bile krajšave s specializiranim slovarjem deležne večje pozornosti, ki si jo nedvomno zaslužijo, saj predstavljajo pojav, ki je bil prisoten že v preteklosti in je iz leta v leto bolj aktualen. Kljub temu da krajšave niso prav nič drugačne od drugih jezikovnih pojavov, se jezikoslovci z nekaterimi pojavi bolj, z drugimi pa manj ukvarjajo, morda se v slovenskem prostoru s krajšavami premalo ukvarjajo. Z mislijo, da naj bi bilo preučevanje nečesa, kar še ni bilo toliko raziskano, nov izziv za jezikoslovce, upamo, da bomo tudi Slovenci kmalu dobili krajšavni slovar, ki bo po naboru in strukturi gesel primerljiv s tujimi. 76 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV M. Kompara 77 5 POLOŽAJ KRAJŠAV V POVEDI Ko obravnavamo položaj krajšav v povedi, mislimo predvsem na rabo veznikov in predlogov v krajšavi, saj naj bi se navadno pri tvorbi kratic veznik in predlog izpustila, torej iz razvezave Slovenska akademija znanosti in umetnosti dobimo kratico SAZU in ne SAZIU. Se pa v krajšave ponekod realizirajo tudi vezniki in predlogi. Iz raziskave, ki je bila narejena leta 2015, so bili pri filtraciji besedil iz dnevnika Delo pridobljeni krajšavno-razvezavni pari, ki vsebujejo oz. ne vsebujejo veznika in predloga v krajšavi in razvezavi (Kompara, 2015). V nadaljevanju si ogledamo izjeme pri opuščanju oz. ohranjanju veznika in predloga v krajšavi oz. razvezavi. 5.1 Izjeme pri opuščanju veznika in predloga Večina zvez z veznikom ima elemente krnjene tako, da je kratica sestavljena iz krnov posameznih besed, veznik je opuščen in ni krnjen, npr. CŠOD – Center šolskih in obšolskih dejavnosti. Običajno so kratice sestavljene tako, da se veznik opusti; tako je bil veznik opuščen pri imenih društev, npr. DMFA – Društvo matematikov, fizikov in astronomov in pri imenih sindikatov, npr. SVIZ – Sindikat vzgoje, izobraževanja in znanosti ipd. (Kompara, 2015). Torej je opuščanje veznika v kratici veliko bolj pogosto kot njegova krnitev, je pa le mogoče najti tudi nekaj primerov s krnjenim veznikom, npr. RIR – Raziskave in razvoj, IIT – Inovativnost in tehnologija, VIRS – Visokošolsko in raziskovalno središče, LiD – Levica in demokrati, BiH – Bosna in Hercegovina. Primeri so bili najdeni ob pomoči algoritma 78 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV za samodejno prepoznavanje krajšav in krajšavnih razvezav v besedilih. Kot zanimivost velja izpostaviti, da se krnjeni veznik v kratici včasih realizira z malo, npr. LiD, BiH, včasih pa z veliko tiskano črko, npr. IIT, VIRS. Skladno s pravopisnimi pravili je krnjenje veznika sprejemljivo in tudi splošno rabljeno, saj zasledimo tako primer kratice BiH, ki ima krnjen veznik in kratice SAZU z izpuščenim veznikom (SP, 2001). Pravila pa nikjer posebej ne opredelijo, kdaj se veznik izpusti oz. krni. Kot zanimivost izpostavimo izpust veznika pri kratici SČG (Srbija in Črna gora) in spomnimo na krnitev veznika pri BiH (Bosna in Hercegovina). Iz nabora krajšavno-razvezavnih parov, pridobljenih s pomočjo algoritma, opazimo različice zapisa kratice, pri čemer se pojem raziskave in razvoj zapiše s kraticama RIR in RR (Kompara, 2015). Tu gre za variantnost (Jarnovič, 2000/01) zapisa krnjene kratice, saj je za elemente iz razvezave večinoma predviden izpust predloga in veznika, zato lahko govorimo o neustrezni rabi kratice RIR. Pregledana so bila naključna besedila in ugotovljeno je bilo, da se kratica RIR v slovenskih besedilih dosledno pojavlja in uporablja, pogosto je zapisana tudi kot RiR. Zaradi boljše prepoznavnosti, nezamenljivosti in lažje izgovarjave se običajno krajše kratice, z do štirimi črkami, zapišejo z veznikom. To pa ni vedno nujno, npr. kratica VV – Vinogradništvo in vinarstvo nima krnjenega veznika. So pa kratice brez veznika veliko bolj rabljene in ustaljene, vzrok za krnitev veznika pa je mogoče iskati v večpomenskosti, saj ima kratica RR v slovenskem prostoru več pomenov (v Slovarčku krajšav najdemo rezultati raziskovanj, raziskave in razvoj, zelo redko in italijansko povratnica) kot kratica RIR, ki pomeni zgolj raziskave in razvoj. Kratica RIR se lažje realizira tudi v stavku, saj se zaradi samoglasnika (i) lažje bere, izgovarja in sklanja ter v slovenskem prostoru ni večpomenska. Potemtakem lahko vzroke za izpust oz. realizacijo veznika v razvezavi iščemo v prepoznavnosti in preprečitvi dvoumnosti kratice. Če bi za razvezavo inovativnost in tehnologije zapisali kratico IT, torej brez veznika, bi pomen zamenjevali z zelo prepoznavno razvezavo informacijska tehnologija, ki se zapiše s kratico IT. Če se osredinimo na postopke dodeljevanja kratic v pravu, kjer je večpomenskost nesprejemljiva, je krnjenje veznikov zaželeno oz. obvezno, ne pa tudi nujno v praktični rabi. Na podlagi primerov razvezav, ki smo jih pridobili z algoritmom, predlogi navadno niso krnjeni, druge besede pa so, izjema je kratica ARRS – Agencija za raziskovalno 5 Položaj krajšav v povedi 79 dejavnost Republike Slovenije, pri kateri poleg predloga ni krnjena tudi beseda dejavnost. Opazimo tudi primere kratic, ki imajo krnjen tudi predlog, in sicer najpogosteje je krnjen predlog za. 5.1.1 Raba predloga za v kratici in razvezavi Slika 34: Predlog za; Vir: Kompara, 2015. Kot je razvidno s slike 34, se predlog za v kraticah iz gradiva pretežno veže s tožilnikom. Opuščanje predloga pri tvorbi kratic je sicer veliko bolj pogosto od krnjenja, v nekaterih primerih pa do krnjenja predloga za v kratici vendarle pride, primeri so vidni na sliki 34. Običajno se predlog za v kratici realizira z veliko črko, npr. FZG – Forum za Goriško, le v enem primeru z malo tiskano črko: MzK – Ministrstvo za kulturo. Navadno se predlogi iz razvezav kratic drugih ministrstev, npr. MF – Ministrstvo za finance; MZ – Ministrstvo za zdravje, v kratici ne pojavljajo. Prav zato je kratica Ministrstva za kulturo izjema, ki kaže na nedoslednost pri tvorjenju kratic, saj jo lahko zapišemo še MK in MZK (Kompara, 2015). Pri nekaterih kraticah se predlog ohrani predvsem v izogib zamenljivosti z drugimi kraticami, slednje je vidno pri razvezavi kratice CZD – Center za dehumanizacijo, ki z ohranitvijo predloga za preprečuje zamenljivost s kratico CD, ki ima po Slovarčku krajšav kar 5 pomenov, in sicer Cankarjev dom, Corpus Diplomaticus (diplomatski zbor), zgoščenka, pomeni tudi angleško potrdilo o vlogi in blagajniški zapis. Tudi kratica CZKD (v pomenu Center za kulturo dekontaminacije) bi lahko bila brez predloga za zamenljiva s kratico CKD, ki ima po zbirki Acronym Finder 15 pomenov, in sicer: Certified Kitchen Designer, Completely Knocked Down (shipping), Choi Kwang Do (Martial Art) itn. Podobno je s kratico DZU (v pomenu Družba za upravljanje), ki ima ohranjen 80 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV predlog. Če ga ne bi imela, bi jo lahko zamenjevali s kratico DU, ki po Slovarčku krajšav pomeni državna uprava ali delavska univerza. Kratica FZG (v pomenu Forum za Goriško) utegne biti zamenljiva s kratico FG – Fakulteta za gradbeništvo (Univerze v Mariboru), kratica FZO – Filozofija za otroke pa brez predloga postane FO in pomeni Fizkulturni odbor. DZRJL, FZPO, IZRK in IZTR po Slovarčku krajšav nimajo drugih pomenov, če so zapisane brez predloga. Slednje pa ne velja za zbirko Acronym Finder, ki ima za kratico FPO 68 pomenov, za IRK 11, za ITR 135. Kratico ZZD (v pomenu Zveza za Dolenjsko) se brez predloga zamenja s kratico ZD v pomenih Zakon o dedovanju, zbrano delo in zdravstveni dom, ZZGS (v pomenu Zavod za gozdove Slovenije) pa se brez predloga realizira v kratico ZGS in pomeni Zakon o geodetski službi in Zavod za gozdove Slovenije. ZZL (v pomenu Zbor za Ljubljano) in ZZMM (v pomenu Združenje za Moj Maribor), obe brez predloga (torej v obliki ZL in ZMM), v Slovarčku krajšav nimata drugih pomenov, kratica ZZP (v pomenu Zveza za Primorsko) pa brez predloga (kot ZP) pomeni zimski in poletni semester in Zakon o prekrških. ZZR (v pomenu Zbor za republiko) brez predloga pomeni Zakon o računovodstvu. Zadosten razlog za krnjenje predlogov v kratici utegne biti zamenljivost pomenov, saj je krnjenje zaradi zamenljivosti sprejemljivo, ker se tako izognemo homonimnosti (Kompara, 2015). 5.1.2 Raba predlogov v, o in na v kratici in razvezavi Iz primerov iz algoritma sta samo dva taka s predlogom v, slednja se vežeta z mestnikom. Razvezavi Slovenija v svetu in Slovenci v svetu se krnita v kratico SVS. Če se predlog ne bi uporabljal, bi bil pomen zamenljiv s Slovensko slovnico in nemško zloglasno SS – Schutzstaffel. Predlog o najdemo samo pri enem primeru, veže se z mestnikom. Kratica ZOF (v pomenu Zakon o financiranju) se brez predloga zapiše ZF (v pomenu znanstvena fantastika). Izpostavimo še primer, pri katerem sta uporabljena oba predloga, in sicer z ter na, ZGNZ – Z glavo na zabavo. Tu gre za novonastalo kratico in priložnostni način krnjenja, saj se predloga iz razvezave običajno ne krnita, npr. DARS – Družba za avtoceste v Republiki Sloveniji (Kompara, 2015). Zagotovo bi ustrezni normativni priročnik pripomogel k temu, da bi bilo okrog kratic manj vprašanj in preglavic, saj bi uporabnika ozaveščal o doslednosti pri krnitvi besed v razvezavi ter zapisu kratic. V SP 2001 krnitev veznikov in predlogov razvezav ni podrobneje predstavljena. Pravopis pri kratici BiH dopušča možnost 5 Položaj krajšav v povedi 81 krnitve veznika tudi z malo tiskano črko, o predlogih pa ne govori. Glede na predstavljene primere iz korpusa, pridobljene z algoritmom za samodejno prepoznavanje krajšav in razvezav, lahko trdimo, da predlogi in vezniki iz razvezave večinoma niso krnjeni in niso prisotni v kratici, se pa občasno le pojavijo primeri krnjenja, npr. IIT – Inovativnost in tehnologija, DZU – Družba za upravljanje. Vzroki za krnitev veznika in predloga so lahko različni, najbolj primeren in sprejemljiv je zagotovo variantnost oz. izogib večpomenskosti, sledijo tudi lažja izgovarjava, sklanjanje in raba (Kompara, 2015). 5.2 Krajšave na ravni kodnega preklopa Ko mislimo na položaj krajšav v povedi, mislimo tudi na položaj krajšav na ravni kodnega preklopa (angl. Codeswitching), saj se pri slednjem v eni povedi prepletata dva jezika ali več, v praksi bi to lahko pomenilo tuja krajšava v slovenski povedi. Kodni preklop je pretežno prisoten pri govornem izražanju, in sicer v današnji večkulturni družbi, prisoten pa je tudi v družbenih medijih, in sicer v pisnem izražanju, saj je prav slednje zelo blizu spontanemu govoru (Schulz in Keller, 2016), v pisnem diskurzu ga opazimo tudi na ravni krajšav. Fenomen kodnega preklopa ni današnja modna muha, saj po pričevanju nekaterih avtorjev (Schulz in Keller, 2016) njegovi začetki segajo v srednji vek, pojavil naj bi se v srednjeveških zapisih, spet drugi (Auer, 1998) trdijo, da segajo začetki v petdeseta leta prejšnjega stoletja, v študijah o dvojezičnosti pa ga prvi omeni Hans Vogt leta 1954 (Auer, 1998). Kodni preklop opazimo npr. pri izmenjavi slovenskega in italijanskega jezika med prebivalci Primorske ali predvsem med mladimi pri izmenjavi slovenskega in angleškega jezika ali pri izmenjavi slovenskega in madžarskega jezika na območju, kjer je uradni jezik madžarščina. Govorimo torej o rabi dveh ali več jezikov v enem stavku. Carol Myers- Scotton (1993) kodni preklop označuje kot lingvistični termin, ki opozarja na uporabo dveh ali več jezikov v pogovoru in se kot tak lahko odvija znotrajstavčno (angl. intersentential codeswitching) ali medstavčno (angl. intrasentential codeswitching). Myers-Scotton (1993) opozarja, da moramo biti pri fenomenu kodnega preklopa pazljivi, saj se ga utegne enačiti z nekaterimi drugimi fenomeni kontaktne lingvistike, in sicer kalki, izposojenkami, pidžinom, kreolščino itd. Kodni preklop uporabljajo dvojezični govorci pretežno zato, ker jim slednji omogoča fleksibilno izražanje, gre za fleksibilno jezikovno produkcijo, psiholingvisti pa izpostavljajo vprašanje usklajevalnega problema, in sicer kako vzpostaviti dovolj tekoč govor. Kodni preklop ob uporabi dveh ali več jezikov prekorači ovire v načrtovanju stavka, obenem pa povzroča tudi napetost, predvsem zaradi 82 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV koordinacije, ki je potrebna. Razlogi, zakaj prihaja do uporabe kodnega preklopa med govorci, so različni, in sicer kodni preklop iz jezika A v jezik B je lahko bolj preprost oz. poenostavljen ter mentalno manj obremenilen kot iskanje izraza v jeziku B in ne nazadnje pripomore k ohranjanju kulturne identitete narodne manjšine. Npr. družina, ki se je preselila v tujo državo, lahko uporablja kodni preklop pri učenju tujega jezika, slednje je mogoče opaziti pri npr. francoskih priseljencih iz Severne Afrike, npr. Maroka, Tunizije in Alžirije. Predvsem v državah z visokim odstotkom prebivalstva z drugih jezikovnih okolij skupnosti pogosto uporabijo kodni preklop jezika okolja in domačega jezika. S kodnim preklopom se srečamo v Kanadi, kjer živijo frankofoni in anglofoni, v Indiji, na Kitajskem in še v številnih drugih državah (Myers-Scotton, 1993). 5.2.1 Elementi kodnega preklopa Pri kodnem preklopu je v vlogi glavnega oz. temeljnega in pričakovanega jezika t. i. matrični jezik (angl. matrix language). Gre za prvotni oz. izvirni jezik, okrog katerega se razvija komunikacija. Drugi pomožni jeziki, t. i. vloženi jezik (angl. embedded language), pa so tisti, ki imajo v procesu preklopa obrobno vlogo v primerjavi z matričnim jezikom. Poznamo še t. i. otoke (angl. islands), to so popolnoma ločene enote, oblikovane po slovničnih pravilih vloženega jezika (Myers-Scotton, 1993). Govorec naj bi najbolj obvladal svoj prvi jezik in prav slednji je skoraj vedno jezik, ki ga lahko identificiramo kot matrični jezik. Toda spomniti je treba, da govorčev prvi jezik ni vedno tudi matrični jezik, saj lahko opravlja vlogo matričnega jezika tudi govorčev drugi jezik. Spomnimo še na skupnosti, pri katerih s težavo določimo, kateri jezik je resnično prvi in kateri drugi, npr. francoski in alzaški jezik v Strasbourgu, obstajajo pa tudi skupnosti, pri katerih je znanje drugega jezika boljše od znanja prvega, vsaj pri nekaterih temah pogovora. Kodni preklop je v uporabi pri stabilnih dvojezičnih skupnostih, izrazit pa je tudi pri skupnostih v procesu jezikovne zamenjave, zato v takih primerih s težavo določimo govorčev močnejši jezik, tj. matrični jezik, ki je prevladujoči ali dominantni jezik skupnosti oz. najbolj uporabljeni jezik. Običajno dvojezični govorci sami intuitivno prepoznajo matrični jezik in prav slednji dovoljuje mešanje jezikovnih elementov drugih jezikov, tj. vloženih jezikov (Myers-Scotton, 1993). Zanimivost pri kodnem preklopu je tudi dejstvo, da tam, kjer nastopata dva jezika ali več, ni potrebno, da je en jezik trajno v vlogi matričnega jezika, saj je določevanje matričnega jezika dinamično, zato se lahko matrični jezik spremeni na sinhroni ali diahroni ravni. Ko govorimo o sinhroni 5 Položaj krajšav v povedi 83 spremembi, mislimo na spremembo v pogovoru; skrajna sprememba bi bila na ravni stavka. Diahrona sprememba pa utegne nastopiti zaradi socialno-političnih faktorjev, ki v skupnosti spodbujajo premik k rabi drugega jezika. Ko pride do menjave matričnega jezika, postane vloženi jezik matrični jezik, predhodni matrični jezik pa postane vloženi jezik (Myers-Scotton, 1993). 5.3 Kodni preklop pri krajšavah Kodni preklop najdemo tudi pri uporabi krajšav v npr. slovenskih ali tujih besedilih. Če kot primer vzamemo slovenska besedila, ima slovenščina vlogo matričnega jezika, krajšava, ki je uporabljena v besedilu, je lahko v slovenskem ali tujem jeziku in ima vlogo vloženega jezika. Krajšave so v besedilih vse pogostejše, uporabljamo jih zaradi različnih vzrokov, npr. gospodarnosti, prednosti krajšega zapisa ipd. Prav zato je smiselno opozoriti na pojav kodnega preklopa v stavkih, ki vsebujejo krajšave. V nadaljevanju se osredinimo na ujemanje in razhajanje skladenjskih oblik, in sicer pri naključnih primerih povedi, ki jih najdemo na spletu z iskalnikom Google, opazujemo tuje krajšave, ustaljene v slovenskem prostoru, ki so zanimive s stališča matričnega modela. 5.3.1 Primeri rabe matričnega modela pri krajšavah Primer 1 – prepletanje matričnega in vloženega jezika EU je v resnici edinstvena. Vir: http://europa.eu/abc/european_countries/languages/slovenian/index_en.htm?_sl, 30. oktober 2010. V primeru 1 smo priča prepletanju matričnega in vloženega jezika, saj je zapis kratice EU v angleškem pomenu European Union in v slovenskem prevodu Evropska unija v obeh jezikih enak; torej EU. Če primer obravnavamo kot tujo krajšavo, ustaljeno v slovenskem jeziku, je matrični jezik slovenščina, vloženi jezik pa angleščina. EU ima vlogo otoka vloženega jezika, saj je ustrezno oblikovana po slovničnih pravilih vloženega jezika. Če pa primer obravnavamo kot slovensko krajšavo, velja opozoriti predvsem na menjavo spola, ki je bolje razvidna ob primerjavi primerov 1 in 2. V primeru 1 gre za rabo ženskega spola, v primeru 2 pa moškega. 84 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV Primer 2 – menjava spola Članice EU-ja so se na veleposlaniški ravni dogovorile o podrobnostih glede napotitve misije na Kosovo. Vir: http://www.rtvslo.si/svet/kosovo-misija-eu-ja-cez-prvo-oviro/82763, 30. oktober 2010. Izpostavimo primer 2, saj je slednji zanimiv predvsem zaradi morfosintaktičnih oznak, in sicer rabe ustreznega spola. EU (angl. European Union, v prevodu Evropska unija) je po SP 2001 samostalnik moškega spola, kar je razvidno iz primera 1, v stavku deluje kot samostalnik moškega spola, kar določa tudi sklanjatveno paradigmo, npr. EU-ja, slednje je razvidno iz primera 2. Evropska unija pa je po SP 2001 samostalnik ženskega spola, torej opazimo spremembo spola na ravni krajšave in razvezave. V primeru 2 je slovenščina matrični jezik, angleščina pa ima vlogo vloženega jezika. Kratica EU-ja sledi slovenskim slovničnim pravilom, kar je razvidno iz rabe obrazila. Primer 3 – dva vložena jezika JEF Europe je dobil novo vodstvo, dva člana JEF Slovenije pa sta bila izvoljena v FC (Federal committee – federalni komite). Vir: http://www.jef.si/index.php?id=6569, 30. oktober 2010. Primer 3 je še posebej zanimiv, saj imamo v vlogi matričnega jezika slovenski jezik, v vlogi vloženega jezika pa kar dva jezika, in sicer angleški in francoski jezik. V primeru JEF Europe sta prisotna kar dva morfema vloženega jezika, ki sta tudi dva otoka vloženega jezika. Gre za ime nevladne organizacije, ki je sestavljeno iz francoske kratice JEF in angleškega samostalnika Europe. FC pa ima tudi vlogo otoka vloženega jezika in je v skladu s slovničnimi prvinami vloženega jezika. Pri kratici JEF Slovenija opazimo strukturo matričnega jezika in vloženega jezika, jedro JEF je v vloženem jeziku, prilastek Slovenija pa je v matričnem jeziku. Francoska kratica JEF, v pomenu Jeunes Européens Fédéralistes, ima slovensko ustreznico MEF (v pomenu Mladi evropski federalisti), a se je v slovenskem prostoru predvsem zaradi mednarodne prepoznavnosti ustalila tuja krajšava JEF. 5 Položaj krajšav v povedi 85 Primer 4 – vloženi jezik sledi pravilom matričnega jezika Kdo znotraj BBC-ja dejansko odloča: javnost, politika, kapital. Vir: http://blog.siol.net/objave/all/0/submitted/DESC/slo/0/10/, 30. oktober 2010. V primeru 4 je matrični jezik slovenščina, vloženi jezik pa je angleščina. Kratica BBC- ja, v pomenu British Broadcasting Corporation, sledi slovničnim pravilom matričnega jezika, kar je vidno iz obrazila. Čeprav imamo prevod kratice BBC, britanska RTV družba, se, predvsem zaradi prepoznavnosti, ohranja tuja krajšava. V navedenih primerih so bile obravnavane lastnoimenske kratice in ugotovljeno je bilo, da se v slovenskem prostoru predvsem zaradi večje in boljše prepoznavnosti uporabljajo tuje različice kratic, npr. JEF, BBC. V zgornjih primerih v vlogi matričnega jezika nastopi slovenščina, v vlogi vloženega jezika pa angleščina, italijanščina in francoščina. Obravnavani primeri kratic so samostalniki, ki imajo vlogo otokov vloženega jezika in sledijo slovničnim pravilom vloženega jezika. Najdemo tudi kratice, ki sledijo slovničnim pravilom matričnega jezika, npr. BBC. Zanimiva je tudi zamenjava spola, ki jo opazimo pri nekaterih kraticah, npr. pri EU v primerih 1 in 2. Med opazovanimi krajšavami v besedilih ne zasledimo prisotnosti okrajšav, saj slednje v slovenskem prostoru nastopajo v slovenskem jeziku, torej matričnem jeziku, zato niso zanimive s stališča kodnega preklopa. Razumevanje krajšav na ravni povedi v smislu realizacije veznikov in predlogov iz razvezave v krajšavo ter opazovanje krajšav na ravni povedi v smislu kodnega preklopa so procesi, ki so skupaj s klasifikacijo krajšav nujni za razumevanje tipoloških lastnosti krajšav ter pripravo orodij za načrtno sestavljanje krajšav ter algoritmov za samodejno prepoznavanje krajšav, ki so podrobneje predstavljeni v poglavjih 6 in 7 ter vodijo k samodejnemu sestavljanju slovarja krajšav, ki ga predstavimo v poglavju 8. 86 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV M. Kompara 87 6 NAČRTNO SESTAVLJANJE KRAJŠAV IN SESTAVA POSEBNEGA SEZNAMA Pri obravnavanju krajšav ne moremo mimo ugotovitve, da imajo številne stroke, npr. medicina ali pravo, krajšavne sezname terminologije, ob tem pa se pojavi vprašanje o načrtnem oblikovanju terminoloških krajšav ter vključevanju slednjih v posebno zbirko. S tem vprašanjem sta se ukvarjala Gorazd Perenič in Tomaž Ilešič v Pravni praksi (1994/10: I–III), kjer predstavita računalniški program za sistematično tvorjenje krajšav in kratic zakonov. Prav večpomenskost krajšav, ki je prisotna na pravnem področju in je s stališča jasnosti in nedvoumnosti pravnega jezika nesprejemljiva, je pripeljala do potrebe po izoblikovanju enotnega seznama krajšav na pravnem področju. V ta namen je leta 1994 Državni zbor Republike Slovenije v sodelovanju z Vlado Republike Slovenije, Ustavnim in Vrhovnim sodiščem Republike Slovenije ter Republiškim senatom za prekrške po nemškem vzoru izpeljal projekt KRAP, tj. enopomenske kratice predpisov Republike Slovenije. Perenič in Ilešič na osnovi računalniškega algoritma izoblikujeta mehanizem za sestavljanje krajšav in kratic, ki preprečuje dvoumnost krajšav in kratic zakonov. Mehanizem je preprost, na začetku je oznaka predpisa (U = ustava, Z = zakon, Od = odlok, Po = poslovnik …) in nato začetnice besed v naslovu zakona. Na koncu je zaporedna rimska številka predpisa (Jarnovič, 2000/2001). Raba krajšav namesto polnih imen predpisov v pravnih sistemih je že dolgo uveljavljena, ne samo v slovenščini, ampak tudi v drugih. Težave nastopijo, ker krajšav ni standardiziral in predpisal zakonodajalec, ampak se oblikujejo šele z 88 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV uporabo predpisa. Krajšave splošno uporabljanih predpisov niso problematične, saj so običajno splošno znane in uporabljene, drugače je s predpisi, ki urejajo ožje področje, saj se oblikujejo krajšave, ki so vezane na določeno okolje in niso splošno uveljavljene, zato se pogosto zgodi, da se ista krajšava uporablja za popolnoma različne predpise in jo posledično razume le malo uporabnikov. Po besedah Ilešiča in Pereniča (1994) je treba določiti seznam krajšav, ki mora biti splošno znan, priznan, treba pa je določiti tudi matematično natančen postopek določanja krajšav, ki bo zagotovil, da se različnim predpisom ne bo določilo enake krajšave oz. enemu predpisu več krajšav. Cilj je sestaviti računalniški program, ki bo s pomočjo uporabnika določil krajšavo. V ta namen je bil razvit algoritem, ki ob upoštevanju standardnih nastavitev predlaga enopomensko krajšavo. Na začetku krajšave zakona je oznaka predpisa, sledijo začetnice besed iz naslova predpisa in zaporedne rimske številke predpisa. Na začetku vsake krajšave stoji oznaka, sestavljena iz ene črke ali več črk, ki označujejo vrsto predpisa, npr.: U – Ustava, Ur – Uredba ali Ak – akt. Oznaka predpisa stoji dosledno na začetku krajšave, izjema so uveljavljene krajšave, npr.: KZ (Kazenski zakonik) ali CZ (Carinski zakon). Pri zakonskih predpisih so najbolj zaželene kratke krajšave, z vsaj tremi črkami, oznake predpisov pa štejemo kot eno črko. Izjemo predstavljajo zakoni, ki vsebujejo v naslovu manj kot tri polnopomenske besede in imajo posledično krajšo krajšavo, npr.: Zakon o dedovanju. Izjema so tudi zakoni, ki imajo štiri ali pet besed, npr. ZTVCP – Zakon o temeljih varnosti v cestnem prometu, saj imajo običajno daljšo krajšavo. Pri zakonih z več kot petimi besedami pa upoštevamo le prve besede v naslovu. V krajšavi nastopata dve vrsti številčnih oznak; oznake letnic, ki so prisotne v naslovu predpisa, ter zaporedna številka sprememb in dopolnitev. Letnica v naslovu predpisa se pripiše na koncu krajšave. Krajšava predpisa, ki dopolnjuje ali spreminja predpis, je enaka krajšavi spremenjenega ali dopolnjenega predpisa, le da ji dodamo še zaporedno rimsko številko. Pojavlja se vprašanje, kako ločiti stare zvezne oz. republiške predpise od novih slovenskih, ki nosijo enako ali zelo podobno ime. Predpise je treba dodatno označiti, tistim z enakimi imeni pa dodati pomišljaj in letnico izdaje, slednje velja tudi za stare predpise (Ilešič in Perenič, 1994). Leta 1994 je Državni zbor sprejel 181. člen Spremembe in dopolnitve poslovnika Državnega zbora, ki pravi, da »ob predložitvi predloga akta, ki ga bo državni zbor obravnaval, določi sekretariat za zakonodajo in pravne zadeve kratico akta v skladu s posebnim predpisom, ki določi način računalniškega označevanja akta. Kratica akta se lahko v postopku sprejemanja akta spremeni le, če se spremeni naslov predloga 6 Načrtno sestavljanje krajšav in sestava posebnega seznama 89 akta ali pa to zahtevajo pravila določanja kratice. Kratica akta se skupaj s sprejetim aktom objavi v Uradnem listu Republike Slovenije« (Uradni list Republike Slovenije. št. 40/93 in 80/94). Naknadno je bil sprejet še Odlok o določanju kratic aktov (kratica je OdDKA), ki natančno ureja postopek določanja krajšav in akte, ki se jim določi krajšava. Iz analize je razvidno, da je nemogoče določiti kratke in smiselne krajšave vsem podzakonskim aktom, ki jih izdajata zakonodajalec in izvršilna oblast, zato so v Odloku našteti vsi splošni akti Državnega zbora, ki se objavljajo v Uradnem listu. Vsak splošni akt ima določeno kratico, odlok pa jo definira kot skupek črk in številk. »Vsakemu aktu se določi samo ena kratica, ki se mora razlikovati od kratic ostalih aktov« (Uradni list Republike Slovenije. št. 40/93 in 80/94). Ilešičev in Pereničev pristop predstavlja prvo tako delo na področju algoritmov za generiranje kratic pri nas, ob tem je treba dodati, da se s snovanjem in z gradnjo algoritmov ukvarjajo številni drugi, predvsem tuji znanstveniki, nekaj pristopov h gradnji algoritmov za samodejno prepoznavanje krajšav in krajšavnih razvezav v elektronskih besedilih je opisanih v nadaljevanju. Normiranje krajšav ni smiselno samo v pravnem konteksu, kjer sta večpomenskost in dvoumnost nesprejemljivi, ampak bi moralo biti v uporabi tudi na drugih strokovnih področjih in v splošnem jeziku. 6.1 Pregled algoritmov za samodejno prepoznavanje krajšav in krajšavnih razvezav v elektronskih besedilih Splet ponuja vse več spletnih krajšavnih slovarjev in zbirk. Prednost spletnega slovarja je nedvomno v prostoru, saj ima lahko obsežen nabor, slovarske dodatke ter tudi obratni slovar, prednost je tudi v preprostem in hitrem ažuriranju in vključevanju novih krajšav. Spletni slovarji nove krajšave vključujejo samodejno, to jim omogočajo algoritmi za prepoznavanje krajšav in krajšavnih razvezav. Slovar krajšav (Kompara, 2011) je lahko zasnovan na podlagi koncepta samodejnosti, saj je sestavljen na podlagi algoritma, ki omogoča samodejno prepoznanje krajšav, lematizacijo in dodajanje jezikovnih kvalifikatorjev. Pri algoritmu gre za niz postopkov in operacij oz. pravil, ki so potrebni za razrešitev problemov prepoznavnosti krajšav in samodejne sestave slovarja. Algoritem je torej pravilo in tudi naravnim jezikom v veliki meri vladajo pravila. Okrog leta 800 n. št. matematik Muḥammad ibn Mūsā al-Khwārizmī pripomore k obogatitvi matematičnega jezikovnega izrazoslovja, in sicer svoje ime latinizira in v jezik vpelje izraz algoritem (Knuth, 1979). Lingvistična pravila imajo popolnoma drugačen status kot pravila, ki 90 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV so nujna za opisovanje kombinacij simbolov formalnega jezika (Chiari, 2007). Algoritmi so torej skupki predhodno določenih pravil in postopkov, ki temeljijo na deterministični metodi, saj morajo predvideti vse potrebne korake za razrešitev problema in pregledati vse razpoložljive podatke. Lahko bi rekli, da je algoritem program, ki predstavlja potrebne poteze, ki so ključnega pomena pri razrešitvi problema. Gre za program, ki zahteva formalni jezik ali kodo, ki v abstraktnem smislu opredeli razrede in odnose med razredi abstraktnih elementov (Chiari, 2007). Samodejno prepoznavanje krajšav je disciplina, ki se je prvič pojavila leta 1999, ko sta Taghva in Gilbreth sestavila prvi algoritem za samodejno prepoznavanje krajšav in krajšavnih razvezav v elektronskih besedilih. Njunemu delu je v naslednjih letih sledilo vse več avtorjev. V nadaljevanju predstavimo preglednico 15 s kronološkim pregledom algoritmov za prepoznavanje krajšav in krajšavnih razvezav od samega začetka do danes. 6 Načrtno sestavljanje krajšav in sestava posebnega seznama 91 Preglednica 15: Sinhrono-diahroni pregled algoritmov za prepoznavanje krajšav in krajšavnih razvezav Avtor (leto) Značilnosti krajšav Značilnosti razvezav Taghva in → akronimi, zapisani z velikimi → iz sobesedila, Gilbreth (1999) tiskanimi črkami z najmanj 3 do → začetne črke razvezave so največ 10 znaki. ključnega pomena. Yeates (1999) → akronimi, zapisani z velikimi → iz sobesedila, tiskanimi črkami. → začetne tri črke razvezave so ključnega pomena. Larkey (2000) → akronimi, zapisani z velikimi → vzorec akronim (razvezava) ali tiskanimi črkami, razvezava (akronim), → tudi nekaj izjem (nekaj → ustaljene fraze, npr. also known as. preostalih krajšavnih tipov), → do največ 9 znakov. Byrd in Park → akronimi, zapisani z velikimi → vzorec akronim (razvezava) ali (2001) tiskanimi črkami, razvezava (akronim), →vsaj 1 velika črka, → ustaljene fraze, npr. also known as, → tudi števke, short for. → od 2 do 10 znakov. Schwartz in → akronimi, zapisani v oklepaju ali → vzorec akronim (razvezava) ali Hearst (2003) izven njega, razvezava (akronim). → od 2 do 10 znakov. Zahariev (2004) → akronimi, zapisani v oklepaju ali → vzorec akronim (razvezava) ali izven njega. razvezava (akronim). Jun Xu in → akronimi, zapisani z velikimi → vzorec akronim (razvezava) ali Yalou Huang tiskanimi črkami, razvezava (akronim). (2005) → od 2 do 10 znakov. Adam (2006) → akronimi, zapisani z velikimi → vzorec akronim (razvezava) ali tiskanimi črkami, razvezava (akronim). → tudi izjeme (nekaj preostalih krajšavnih tipov), → zapisani v oklepajih ali izven njih. Šateva in → akronimi, zapisani z velikimi → iz sobesedila, Nikolov (2008) tiskanimi črkami z največ 5 znaki. → vzorec akronim (razvezava) ali razvezava (akronim). Cheng-Ju Kuo → SF (krajšava) stoji pred → LF (razvezava) stoji pred krajšavo idr. (2009) razvezavo (LF), pri čemer je (SF), krajšava (SF) je v oklepaju ali razvezava v oklepaju ali oglatem oglatem oklepaju. oklepaju, → Krajšava in razvezava sta lahko v oklepaju ali oglatem oklepaju ter ločena z vejico. Vir: Kompara, 2011. 92 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV 6.1.1 Pristop Taghve in Gilbretha Prva v disciplini za prepoznavanje krajšav in krajšavnih razvezav sta Taghva in Gilbreth, ki sta tak sistem zgradila leta 1999. Prepoznavanje krajšav sta omejila na akronime zapisane z velikimi tiskanimi črkami. Izdelala sta računalniški program AFP (Acronym Finding Program), ki najprej išče akronimne kandidate, slednji so zapisani z velikimi črkami in sestavljeni iz najmanj 3 do največ 10 črk. Sledi iskanje razvezave akronimov, kjer program pregleda 2n besed, pri čemer je n število črk v akronimu. Računalniški program temelji na algoritmu, ki deluje po načelu sovpadanja črk iz akronima in prvih črk iz razvezave. Avtorja pravita, da je bolj kot prepoznavanje krajšav problematično prepoznavanje razvezav, saj prav v razvezavah nastopajo besede, ki morajo biti deležne posebne obravnave. Izpostavita besede, kot so členi, npr. the, a, an, ki so prisotni v angleškem jeziku, ali posebni znaki npr. &; vezaji, npr. pri besedni zvezi well-defined, slednji povzročijo zmedo v prepoznavanju, saj bo algoritem pri prepoznavanju vzel prvi črki obeh besed, torej w in d; ter prisotnost akronimov v razvezavi. Program AFP je bil preizkušen na zbirki 1.328 dokumentov ameriškega oddelka za energetiko. Zbirka je bila primerna za preverjanje, saj je vsebovala veliko število akronimov, rezultati pa so pokazali, da bi bilo smiselno vključiti tudi posebne znake, kot je &, ker bi slednji lahko povečali kakovost prepoznavanja. V prihodnje nameravata avtorja povečati tudi razpon dolžine krajšav, in sicer od 1 do 15, trenutno pa je prepoznavanje omejeno na angleška besedila (Taghva in Gilbreth, 1999). 6.1.2 Pristop Yeatesa Istega leta (1999) tudi Yeates opozori na možnost samodejnega prepoznavanja krajšavno-razvezavnih parov. Yeates se osredini le na akronime, ki so zapisani z velikimi črkami in jih prepoznava za potrebe digitalne knjižnice New Zealand Digital Library. Za potrebe prepoznavanja je sestavil program TLA (Three Letter Acronyms), pri čemer že samo ime programa spominja na akronime s tremi črkami. V prvi fazi je to držalo, saj je šlo predvsem za prepoznavanje pogostih tričrkovnih akronimov iz računalništva, danes pa lahko program najde tako daljše kot tudi krajše akronime in ni več omejen na črkovne trojčke. Program išče razvezave v sobesedilu, tako da besedilo razdeli na dele, ločene z vejico, narekovaji in oklepaji, tako razdeljeno besedilo pa nato filtrira. Tako kot predhodnika Taghva in Gilbreth tudi Yeates uporablja tehniko sovpadanja in preverja, ali se črke iz akronima ujemajo s 6 Načrtno sestavljanje krajšav in sestava posebnega seznama 93 prvimi črkami v razvezavi, pri tem so akronimi zapisani z velikimi začetnicami, razvezave pa ne. Algoritem temelji na številnih pravilih, med njimi je tudi dolžina, saj morajo biti razvezave daljše od dolžine akronima. Po besedah avtorja imajo krajši akronimi daljše razvezave, daljši akronimi pa več členov in predlogov in prav slednji lahko otežujejo prepoznavanje in jih je treba zbrati v seznam, ki ga je treba upoštevati pred filtriranjem. Tako Yeates kot njegova predhodnika Taghva in Gilbreth pri prepoznavanju uporablja seznam posebnih besed in znakov, obenem pa želi izboljšati delovanje programa in za vsak enopomenski akronim poiskati le eno razvezavo, saj se je po filtriranju pojavilo tudi več enakih oz. podobnih razvezav, ki so se med seboj le malo razlikovale. Yeates se tako kot njegova predhodnika osredinja na prepoznavanje v angleškem jeziku (Yeates, 1999). 6.1.3 Pristop Larkeyja Leto pozneje (2000) je Larkey razvil podoben program, in sicer Acrophile – program za samodejno prepoznavanje krajšav in krajšavnih razvezav, ki deluje na podlagi sobesedila in prepoznava zgolj akronime, ki morajo biti zapisani z velikimi tiskanimi črkami. V primerjavi s programi Taghve in Gilbretha ter Yeatesa dovoljuje tudi male tiskane črke, slednje pa morajo stati med velikimi črkami, npr. BiH, ali na koncu akronima. Larkey v programu dovoljuje tudi posebne znake, kot so vezaji, in med akronimne kandidate vključuje besede z največ 9 alfanumeričnimi znaki, razvezave pa išče v naboru dvajsetih besed, ki stojijo levo ali desno od akronima. Larkey uporablja tudi seznam posebnih znakov in besed ter za boljše prepoznavanje še ustaljene fraze, npr. also known as, slednjega predhodniki niso uporabili. Tako kot predhodniki tudi Larkey prepoznava krajšave samo v angleških besedilih (Larkey, 2000). 6.1.4 Pristop Byrda in Parka Tako kot Larkey tudi Byrd in Park (2001) kombinirata prepoznavanje na podlagi pravil in uporabe ustaljenih fraz, npr. or, short, acronym itd., za razliko od Larkeyja pa uporabita več vzorcev fraz in dopuščata celo rabo števk tudi na začetku razvezave, npr. 5GL (Fifth Generation Language). Avtorja prepoznavata zgolj akronime, zapisane z velikimi črkami, ki imajo praviloma od 2 do 10 znakov, pravila za prepoznavanje pa so sestavljena samodejno ali ročno ter glede na tip besedila. Za prepoznavanje uporabita tri postopke; pravila za prepoznavanje akronimov in razvezav ter sovpadanje slednjih na podlagi vzorca; posebne znake, npr. oklepaje, 94 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV narekovaje, znak = itd.; ustaljene fraze, npr. or, short, acronym itd. Tako kot predhodniki tudi Byrd in Park prepoznavanje omejita zgolj na angleška besedila (Byrd in Park, 2001). 6.1.5 Pristop Schwartza in Hearsta Schwartz in Hearst (2003) prepoznavata akronime in njihove razvezave v medicinskih besedilih. Prepoznavanje akronimov in akronimnih razvezav v medicinskih besedilih je sestavljeno iz dveh ključnih delov, prvi je luščenje parov akronimov in razvezav iz besedila, drugi pa prepoznavanje ustreznih razvezav iz nabora kandidatov v povedi, ki obkroža akronim. Avtorja ugotavljata, da stojijo akronimi pogosto v oklepajih in predstavljata dva možna primera lege; razvezava (krajšava) (1), krajšava (razvezava) (2). Avtorja trdita, da večina parov akronimov in razvezav ustreza prvemu nizu (1), v primeru, ko sta v oklepaju več kot dve besedi, pa se upošteva drugi niz (2), torej se akronim išče pred oklepajem. Akronimi so veljavni kandidati samo, če so sestavljeni iz največ dveh besed, njihova dolžina pa je med 2 in 10 znaki, pri tem pa je vsaj en znak črka, prvi pa je lahko ali črka ali znak (alfanumerični). Sledi korak za prepoznavanje razvezav, ki se morajo pojavljati v isti povedi kot akronimi in morajo biti najmanj za 5 znakov daljše od števila znakov v akronimu. Vsak znak v akronimu mora sovpadati z znakom v razvezavi, sovpadli znaki v razvezavi pa morajo biti v enakem zaporedju kot znaki v akronimu. Sovpadanje znaka na začetku akronima mora biti skladno z znakom na začetku prve (skrajno) leve besede v razvezavi. Tudi Schwartz in Hearst prepoznavanje omejita na angleška besedila (Schwartz in Hearst, 2003). 6.1.6 Pristop Zaharieva Zahariev (2004) v svoji doktorski disertaciji povzame izsledke predhodnih poskusov prepoznavanja in tako kot njegovi predhodniki prepoznava akronime, zapisane z velikimi črkami, pri zapisu pravil za prepoznavanje akronimov in razvezav pa se opira predvsem na Larkeyja (2000) in razvezave prepoznava na podlagi vzorca in sobesedila. Za razliko od njegovih predhodnikov je prvi, ki se ne omeji le na prepoznavanje v angleških besedilih, ampak gre dlje in prepoznavanje preizkusi tudi v drugih jezikih. Najprej se osredini na nekatere evropske jezike, sledijo evropski jeziki z nelatiničnimi pisavami in na koncu zaključi s prepoznavanjem krajšav v bolj eksotičnih jezikih, kot sta japonščina in kitajščina. Zahariev je vsekakor prvi, ki se je 6 Načrtno sestavljanje krajšav in sestava posebnega seznama 95 ukvarjal s prepoznavanjem krajšav v tujih jezikih, in je prvi, ki se je odmaknil od rutinskega prepoznavanja v zgolj angleških besedilih, kar je bilo značilno za njegove predhodnike. Šel je dlje, in sicer onstran enojezikovnega prepoznavanja, in lahko rečemo, da je prvi, ki se je ukvarjal s prepoznavanjem krajšav v večjezičnih besedilih. Zahariev pri prepoznavanju akronimov v večjezičnih besedilih zagovarja univerzalnost algoritma oz. pravil, ki ustrezajo posamezni tipologiji jezika, se pa omeji zgolj na prepoznavanje akronimov, ostale krajšave izvzame (Zahariev, 2004). 6.1.7 Pristop Juna Xuja in Yalouja Huanga Tudi Jun Xu in Yalou Huang (2005) se ukvarjata s problematiko samodejnega prepoznavanja akronimov in razvezav akronimov v besedilih in kot ustrezno rešitev navajata pristop, kjer so akronimi prepoznani v besedilu, razvezave pa iz sobesedila. Njun pristop je sestavljen iz treh korakov: Prvi korak se začne s prepoznavanjem ustreznih kandidatov za akronime, pri čemer sistem prepozna vse možne akronime iz originalnega besedila, ki ustrezajo spodnjim kriterijem:  dolžina med 2 in 10 znaki ter z največ enim presledkom:  prvi znak je abecedni ali numerični, vsaj ena črka je zapisana z velikimi tiskanimi črkami, pri čemer niso upoštevane prve črke začetnih besed povedi;  beseda ni iz predhodno sestavljenega splošnega slovarja besed, prav tako ni lastno ime, zemljepisno ime ali beseda iz predhodno oblikovanega seznama neustreznih besed. Drugi korak zajema kandidate za razvezave; sistem poišče vse kandidate razvezav, ki so vedno v sobesedilu akronimov in v isti povedi. Ta postopek je mogoč z razdrobitvijo povedi, saj so kandidati razvezav opazovani levo ali desno od akronima. Za omejevanje števila dobljenih kandidatov sta bila definirana dva parametra, in sicer prvi določa največjo razdaljo med akronimom in njegovo razvezavo, tj. 10 pojavnic, drugi pa največjo dolžino razvezave, pri čemer za dolge akronime dolžina razvezave (po pojavnicah) ne bi smela biti krajša od dolžine 96 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV akronima (v znakih) plus 5 in tudi za krajše akronime ne bi smela biti krajša od dvakratne dolžine akronima. Tretji korak zajema izbiranje ustreznih razvezav; pri čemer se izbira ustrezne razvezave za akronime iz seznama kandidatov. V tem koraku so akronimi, razvezave kandidatke in sobesedilo, v katerem se pojavljajo, predstavljeni z nizom značilnosti, ustreznost pa je potrjena z vključitvijo v statistični model SVM (Jun Xu in Yalou Huang, 2005), ki med drugim upošteva: Lastnosti akronimov in razvezav Pri čemer so dolžina akronima, numerični in posebni znaki ter presledki pomembni kazatelj ustreznosti akronima, saj so prav dolžina razvezave, besede z velikimi začetnicami znotraj razvezave, prve/zadnje besede in predlogi/vezniki v razvezavi dobri kazalci ustreznosti razvezave. Simboli kot npr. »(", ")«,=", »!« itd. pa kažejo na neustreznost razvezave. Ključnega pomena so odnosi med akronimi in razvezavami, npr. če črke akronima sovpadajo s prvimi črkami besede v razvezavi, gre po vsej verjetnosti za ustrezno razvezavo. Lastnosti sobesedila Večino akronimov obkrožajo oklepaji, ki se pojavljajo takoj za razvezavo. V primeru, da se akronimi pojavljajo v levem sobesedilu, je verjetnost za ustreznost kandidata zelo nizka. 6.1.8 Zbirka ADAM Omenimo še specializirano zbirko ADAM (2006) s področja biomedicine. Zbirka zajema splošno uporabljene krajšave in krajšavne razvezave, osredinja pa se na akronime in vse preostale krajšave v angleških besedilih. Natančnost sistema ADAM je 97,4-odstotna (Zhou, Vetle in Smalheiser, 2006). ADAM vključuje večino pogosto uporabljenih krajšav iz zbirk Unified Medical Language System (UMLS) in Stanford Abbreviation Database, tretjina krajšav iz ADAM-a je novih in še niso bile vključene v nobeno od omenjenih krajšavnih zbirk. Zbirka zajema sedem različnih tipov krajšavno-razvezavnih parov in je prosto dostopna. Akronimi, ki jih najdemo v zbirki ADAM, so besede, sestavljene iz začetnih črk ali drugih črk krajšavne 6 Načrtno sestavljanje krajšav in sestava posebnega seznama 97 razvezave, npr. NASA in njeno razvezavo National Aeronautics and Space Administration. Najdemo pa tudi krajšave tipa CKB v pomenu brain creatine kinase, ki predstavljajo akronim, čeprav ne sledijo običajnemu zaporedju. Opazimo tudi krajšave, ki ne sledijo leksikalnemu zaporedju, npr. krajšava 11p v pomenu the short arm of chromosome 11, pri slednji ni uporabljena črka p. Metoda za prepoznavanje temelji na petih zaporednih korakih. V prvem koraku nastopijo luščene posamezne besede znotraj oklepajev, in sicer iz zbirke MEDLINE. Za pridobitev vsebine krajšav je izluščenih 3N (N pomeni dolžino krajšave kandidatke v znakih) besed levo od odprtega oklepaja v povedi, npr. »/.../ To assess the proportion of hospitalized patients who tested positive for human immunodeficiency virus (HIV) by a routine inpatient testing service /.../«. HIV je izbran kot krajšava kandidatka (krajšavne oblike) in devet (3x3) predhodnih besed pred odprtim oklepajem, tj. hospitalized patients who tested positive for human immunodeficiency virus, je izbranih kot sobesedilo. V primeru dvojnega oklepaja se izlušči zunanji oklepaj oz. njegova vsebina. Izpostavljamo še en primer, in sicer »/.../ decrease inserumfreetriiodothyronine (FT(3)) levels /.../«, pri katerem bo FT(3) izbran kot kandidat. V zbirki ADAM so se odločili, da raziskujejo le krajšave znotraj oklepajev, saj je večina krajšav v besedilu definiranih kot razvezava (krajšava), obstajajo pa tudi izjeme. Krajšave kandidatke so omejene na enobesedne krajšave z največ dvema alfanumeričnima znakoma, pri čemer so izločene rimske številke, ki so v besedilu pogoste predvsem za številčenje. Izbran je bil vzorec razvezava (krajšava) namesto (razvezava) krajšava ali (krajšava) razvezava ali krajšava (razvezava). Iz preučevanega naključnega vzorca krajšav iz zbirke Stanford Abbreviation Database je bilo ugotovljeno, da jih v besedilih MEDLINE kar 99,2 % sledi prav prvemu vzorcu, tj. razvezava (krajšava). Drugi korak temelji na prepoznavanju krajšavnih razvezav ob uporabi statističnih podatkov iz sobesedila, pri čemer se težišče dela prestavi na težave pri prepoznavanju krajšavnih razvezav kandidatov znotraj 3N besed, ki stojijo levo od krajšave znotraj oklepajev. Celoten proces je razdeljen v zaporedje korakov, in sicer prelom, štetje pojavnic v kontekstu, določitev kandidata razvezave in odstranitev neustreznih kandidatov. Tretji korak obravnava dolžino razvezave, ki je navadno daljša od krajšave. Razmerje (dolžina razvezave/dolžina-krajšave, pri čemer je dolžina določena kot število znakov) je bilo uporabljeno pri filtriranju krajšavno-razvezavnih parov, pri čemer je imelo 95 % parov v zbirki Stanford Abbreviation Database razmerje ≥ 2.5, zato je bila v raziskavi izbrana ta vrednost. V četrtem koraku se preveri ločenost krajšav od 98 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV razvezav v besedilu, v petem pa se združi morfološko podobne razvezave, ki ustrezajo krajšavam (Zhou, Torvik, Samlheiser, 2006). Z navedeno metodo so našli 512.314 krajšavno-razvezavnih parov, po združevanju morfoloških različic pa je imel ADAM 59.405 krajšavno-razvezavnih parov in obenem je bilo ugotovljeno, da je pri dveh naključnih izborih po tisoč krajšavno-razvezavnih parov 23 in 29 napak, stopnja napake je bila 2,6 %. 6.1.9 Pristop Šateve in Nikolova Šateva in Nikolov se v raziskavi osredinjata na luščenje krajšav v srbskem jeziku, in sicer ob uporabi svetovnega spleta kot korpusa. Avtorja sta dokazala, da se z uporabo spleta kot korpusa lahko najde veliko predvsem novih krajšav. Ob tem poudarjata prednosti spleta ter menita, da je lahko slednji veliko boljša izbira tudi od razmeroma širokega korpusa (Šatev in Nikolov, 2008). Prikažeta še, kako je mogoče s pomočjo spleta najti nove krajšave v srbskem jeziku in potencialno njihove definicije oz. razvezave, ki jih ni mogoče pridobiti s standardnimi korpusi. Slednje ponazorita z nekdanjo rabo besede Kosovo, in sicer za označevanje besedne zveze Kosovo i Metohija. Pojasnita, da je zaradi novih trendov namesto polnega imena v rabi krajšava KiM, besede pa ni moč najti v standardnem korpusu srbskega jezika, zato menita, da rešitev predstavlja prav splet, saj do informacij na spletu lahko pridemo zgolj s pomočjo iskalnikov. Prav tu pa nastopi težava, saj iskalniki niso izdelani za potrebe jezikoslovcev. Navajata, da v iskalnikih ni mogoče iskati dokumentov, ki bi imeli angleško besedo back v vlogi samostalnika, in dodajata, da so zato potrebne nove tehnike raziskav, ki temeljijo na spletnih podatkih. Pravita, da je na voljo več možnosti za uporabo podatkov s spleta, saj lahko raziskovalci neposredno iščejo s pomočjo iskalnika, npr. Googla. Čeprav iskalniki niso prirejeni za iskanje odgovorov na jezikoslovna vprašanja, jih jezikoslovci kljub temu uporabljajo v ta namen. Uporabljajo jih celo za iskanje pojavnic, kar je seveda uporabno, a je obenem tudi problematično, predvsem zato, ker iskalniki ne ločujejo med velikimi in malimi črkami. Avtorja opozorita na primer pridevnika jasna in lastnega imena Jasna, število zadetkov je skupno, podobno pa velja tudi za različice zapisa white-space, saj je mogoče najti različne možnosti zapisa, in sicer white space, white-space in whitespace. Če vzamemo najbolj uporabljeni iskalnik, tj. Google, lahko povemo, da ima slednji svoja pravila pri iskanju, nekatera je sicer mogoče izklopiti, druga ne. Težavo predstavlja tudi dvojna pojavitev besedila, ki ga najde iskalnik, saj je lahko isto besedilo na več različnih spletnih straneh, slednje pa umetno zviša število pojavnic (Šatev in 6 Načrtno sestavljanje krajšav in sestava posebnega seznama 99 Nikolov, 2008). O vlogi spleta kot korpusa razmišlja Michelizza (2015: 61), saj je to »vroča tema v krogih, ki se ukvarjajo z jezikovnimi tehnologijami« ter povzame nekaj razmišljanj odmevnih jezikoslovcev. Atkins in Rundell (2008 v Michelizza, 2015) splet pojmujeta kot korpus, čeprav je treba v tem kontekstu razmišljati o avtentičnosti besedil, reprezentativnosti, velikosti in vsebini. Sinclair (2004 v Michelizza 2015) spleta ne pojmuje kot korpus, in sicer zaradi neznanih dimenzij, prav tako ni bil izdelan z jezikoslovnega zornega kota in se nenehno spreminja. Tudi Kilgarrif (2006 v Michelizza, 2015) opozarja na probleme pri rabi spletnega iskalnika za jezikoslovne raziskave. Šatev in Nikolov (2008) pravita, da je uporaba spleta v vlogi korpusa najboljša alternativa za analizo lastnih imen, saj nova imena nastajajo dnevno in pri tem standardni korpusi zaradi neažurnosti odpovedo. Podobno mnenje imata glede krajšav. V raziskavo kot tip krajšave vključujeta akronime, njun namen pa je najti nove akronime. Zaradi neustrezne ažurnosti korpusa srbskega jezika, saj je najnovejša vključena publikacija iz leta 2000, kot vir uporabita splet. Izvedla sta raziskavo tudi na podlagi srbskega spletnega korpusa in rezultati so bili primerljivi. Ker so v srbščini krajšave pogosto pisane z velikimi črkami, npr. SCG – Srbija i Crna Gora (Srbija in Črna Gora) ali SANU – Srpska akademija nauka i umetnosti (Srbska akademija znanosti in umetnosti), so bile za iskanje krajšav pri raziskavi uporabljene besede, ki niso daljše od petih črk. Upoštevano je bilo, da je več kot polovica črk velikih tiskanih, saj so v srbskem jeziku pogoste tudi krajšave tipa BiH in KiM, izločene pa so bile besede, ki ustrezajo zgornjim zahtevam, a se pojavljajo v sobesedilu, zapisanem z velikimi tiskanimi črkami. Izločene so bile oznake HTML (tudi v skriptih) in nesrbska besedila. Dobljeni spletni korpus je vseboval okrog 500.000 besed, besedilo je bilo tokenizirano, besede in sobesedilo pa zbrani v zbirki. Besede so najprej shranili v zbirko, sledila je raziskava, v sklopu katere so bile izluščene besede, ki niso bile daljše od petih črk, pri čemer je moralo biti več kot polovica črk velikih tiskanih v sobesedilu, ki ni bilo zapisano z velikimi črkami. Rezultat je 600 akronimov, 9 % se jih je pojavilo v obeh korpusih, in sicer v srbskem in spletnem, 33 % le na spletu, 57 % pa samo v standardnem korpusu. Po besedah avtorjev je omejitev na pet črk onemogočila vključevanje daljše krajšave, kot npr. UNESCO. Omeniti je treba še, da je bil spletni korpus 50-krat manjši od srbskega korpusa, a je vseeno vseboval nove akronime, ki jih v srbskem korpusu ne zasledimo. 57 % akronimov, ki so jih našli zgolj v standardnem korpusu, pojasnjujeta z dejstvom, da gre za imena političnih strank in organizacij ter držav, ki ne obstajajo več, npr. SSSR. Spletni korpus zajema dnevno časopisje, in sicer sodobne članke, a 100 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV ne vsebuje zgodovinskih besedil. Po besedah avtorjev se lahko odstotek akronimov, ki se je pojavil le na spletu, v standardnem korpusu pa ne, le še povečuje (Šatev in Nikolov, 2008). 6.1.10 Pristop Cheng-Ju Kuoja idr. Pristop prepoznavanja krajšav Cheng-Ju Kuoja idr. (2009) temelji na strojnem učenju, ki beleži natančnost v 95,86 %. Sistem, ki so ga razvili, so najprej testirali na AB3P korpusu, sledila je uporaba označenega korpusa, ki vsebuje 1.200 izvlečkov (PubMed), natančnost je bila 93,52 %. Prepoznavanje je temeljilo na prepoznavanju krajšav (SF – short forms) in prepoznavanju razvezav (LF – long forms), pri čemer so upoštevana sledeča pravila: Razvezava (LF) stoji pred krajšavo (SF), krajšava (SF) stoji v oklepajih ali oglatih oklepajih. Krajšava (SF) stoji pred razvezavo (LF), pri čemer razvezava (LF) stoji v oklepajih ali oglatih oklepajih. Tako krajšava (SF) kot razvezava (LF) stojita v oklepajih ali oglatih oklepajih in sta ločena z vejico ali podpičjem. V poglavju predstavimo normiranje pri sestavljanju krajšav v pravnih besedilih (Ilešič in Perenič, 1994) in deset pristopov k samodejnemu prepoznavanju krajšav v besedilih, s katerimi se avtorji ukvarjajo od leta 1999 (Taghva in Gilbreth). Predstavimo glavne značilnosti posameznega algoritma, ki so pripomogle k sestavi algoritma za prepoznavanje krajšav in krajšavnih razvezav v slovenskih besedilih in omogočile samodejno pripravo slovarja krajšav, ki ga predstavimo v nadaljevanju. Kot je razvidno iz obsežne razprave o samodejnem prepoznavanju krajšav in krajšavnih razvezav, se je s to tematiko ukvarjalo in se še ukvarja veliko avtorjev. Opazimo, da so se vsi večinoma omejili le na prepoznavanje akronimov, izjemi sta Larkey (2000) in program ADAM (2006), saj slednja prepoznavata tudi druge krajšavne vrste. Izpostavimo še, da se avtorji ukvarjajo pretežno s prepoznavanjem krajšav v angleškem jeziku, saj so tak pristop ubrali skoraj vsi navedeni raziskovalci, se pa na ravni jezikovnega prepoznavanja kaže težnja po univerzalnosti algoritma ter zmožnosti prepoznavanja krajšav in krajšavnih razvezav tudi v drugih jezikih. 6 Načrtno sestavljanje krajšav in sestava posebnega seznama 101 Prav s slednjim se je ukvarjal Zahariev, ki je prvi izpostavil možnost prepoznavanja krajšav in krajšavnih razvezav v različnih jezikih.Njegov pristop v prepoznavanju zagotovo predstavlja prihodnost, saj omogoča uporabo široke palete jezikov in predvsem širše prepoznavanje, a bi bilo pred tem smiselno prepoznavanje razširiti tudi na druge krajšavne tipe, saj bi s širitvijo na jezikovni in tipološki ravni algoritem res lahko dajal ustreznejše rezultate in bili v pomoč pri sestavljanju slovarskih zbirk. 102 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV M. Kompara 103 7 ALGORITEM ZA SAMODEJNO PREPOZNAVANJE KRAJŠAV IN KRAJŠAVNIH RAZVEZAV V ELEKTRONSKIH BESEDILIH V predhodnih poglavjih smo predstavili zastopanost krajšav, in sicer začenši s pravopisi, specializiranimi slovarji in spletom ter opozorili na problematiko pisanja slovarjev, predvsem specializiranih, kot je tudi slovar krajšav, ki ga pogosto srečamo v tujih jezikovnih prostorih, v slovenskem prostoru pa žal še nimamo slovarja krajšav, ki bi bil primerljiv s tujimi. V delu opozorimo tudi na dva slovenska slovarja krajšav (Župančič, 1948 in Kompara, 2006) in se v jedrnem delu dotaknemo možnosti, ki nam jih ponujata splet in računalnik pri prepoznavanju krajšav in krajšavnih razvezav. Opozorimo na možnost samodejnega prepoznavanja krajšav in njihovih razvezav v elektronskih besedilih ter na podlagi izčrpnega pregleda tujih tovrstnih modelov in algoritmov v nadaljevanju predstavimo slovenski algoritem za samodejno prepoznavanje krajšav in krajšavnih razvezav v elektronskih besedilih. Cilj našega algoritma je prepoznavanje krajšav in razvezav v slovenskih elektronskih besedilih, tu mislimo predvsem na kratice in akronime, v delu pa je prikazana tudi univerzalnost algoritma pri prepoznavanju tujih krajšav v slovenskih in/ali tujih besedilih. Z algoritmom za samodejno prepoznavanje krajšav in krajšavnih razvezav želimo čim bolj natančno prepoznati krajšave in krajšavne razvezave v elektronskih besedilih ter pokazati, kako je mogoče izdelati abecedni seznam krajšav in razvezav ter pripraviti gradivo za samodejno izdelavo slovarja krajšav. 104 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV 7.1 Časovni pregled gradnje algoritma Slovenski algoritem za samodejno prepoznavanje krajšav in krajšavnih razvezav je zagotovo pionirsko delo v slovenskem prostoru, ki skuša prikazati možnosti luščenja krajšav iz elektronskih besedil. Gradnja algoritma je bila dolgotrajna, osredinjala se je na predhodne raziskave, ki so temeljile predvsem na prepoznavanju v angleškem jeziku, pred končnim izgledom in zmožnostjo filtriranja 60 milijonov besed dolgega vzorca pa je bil algoritem deležen številnih izboljšav in sprememb. Slednje so vidne tako na ravni prepoznavanja krajšav kot tudi prepoznavanja razvezav. Algoritem ja zasnovan na leksikalnem oz. besednem prepoznavanju krajšav, in sicer na opazovanju lastnosti krajšav in krajšavnih razvezav ter sovpadanju. 7.1.1 Začetki Prvi koraki gradnje algoritma za samodejno prepoznavanje krajšav in krajšavnih razvezav temeljijo na dveh stopnjah. Na prvi stopnji so zapisana pravila za samodejno prepoznavanje krajšav, krajšavnih razvezav in sovpadanje krajšav z razvezavami, na drugi pa sledi priprava programske opreme. Pri pripravi pravil za prepoznavanje krajšav smo se omejili na samodejno prepoznavanje kratic in akronimov, izvzeli pa smo vse okrajšave, saj pri slednjih v sobesedilu ne najdemo razvezav. Tudi vsi predhodno omenjeni avtorji po večini prepoznavajo akronime, izjemi sta le Larkey (2000) in zbirka ADAM (2006), ki vključujeta tudi nekaj drugih tipov krajšav. Pravila za samodejno prepoznavanje krajšav in krajšavnih razvezav razdelimo na tri dele, v prvem prepoznavamo krajšave, v drugem prepoznavamo razvezave, v tretjem pa ugotavljamo sovpadanja razvezav s krajšavami. Vsi trije deli so opisani v nadaljevanju. 7.1.1.1 Prepoznavanje krajšav (akronimov in kratic) Prepoznavanje krajšav, in sicer akronimov in kratic, v besedilih temelji na postopkih, ki omogočajo ločevanje krajšav od drugih besed in besednih zvez, ki jih najdemo v besedilih: Upoštevane so besede z največ šestimi velikimi tiskanimi črkami, ki so zapisane v oklepaju, npr. (NATO). 7 Algoritem za samodejno prepoznavanje krajšav in krajšavnih razvezav v elektronskih besedilih 105 Izvzete so krajšave, ki so zaradi pogoste rabe prešle v navadno pisano besedje in se zapisujejo kot navadne besede, npr. Unicef, Nama, saj bo algoritem te splošno znane krajšave (akronime in kratice) prepoznal na podlagi vključenega Slovarčka krajšav. Upoštevane so besede z največ šestimi črkami, ki imajo vsaj prvo črko zapisano z velikimi tiskanimi črkami ter niso zapisane v oklepaju, npr. NATO ali Mig. Po pridobljenem naboru kandidatov je treba odstraniti vse, kar ni akronim ali kratica, in sicer lastna imena, naselbinska imena, nenaselbinska imena in okrajšave. Odstranitev je bila izvedena s pomočjo Slovarja slovenskega knjižnega jezika, Slovenskega pravopisa ter Slovarčka krajšav. Odstraniti je treba tudi vse okrajšave, npr. itd., ipd., itn., npr., št., stol., ob upoštevanju, da so zapisane z malimi črkami, za njimi pa stoji pika. Ker okrajšave nimajo razvezave v besedilu, bodo samodejno izločene iz nabora možnih kandidatov. Vse okrajšave, zapisane z malimi črkami in brez ločil, npr. cca, kg, dcl, bo algoritem prepoznal ob pomoči Slovarčka krajšav. Take krajšave v besedilu običajno niso razvezane, zato bodo samodejno izločene iz nabora možnih krajšav. Upoštevamo še, da se kandidati za krajšave (akronime in kratice) ne pojavljajo v sobesedilu, sestavljenem iz samih velikih črk in v oklepaju ali pa izven njega, npr. NAMA JE VŠEČ KINO, (JUTRI JE PETEK). Upoštevani so tudi drugi tipi krajšav in razvezav, ki jih je mogoče razdeliti v naslednje kategorije. 7.1.1.2 Prekrivne krajšave Prekrivne krajšave imajo število črk v krajšavi enako številu besed v razvezavi, črke v krajšavi pa so enake prvim črkam v razvezavi, npr. FF = Filozofska fakulteta. Razvezava lahko stoji v oklepaju, prva beseda v razvezavi pa se začne z veliko začetnico, npr. FF (Filozofska fakulteta). Krajšave brez veznikov in predlogov Tu gre za krajšave, ki imajo v razvezavi veznik ali predlog, v krajšavi pa slednjega nimajo, npr. FDV (Fakulteta za družbene vede). Take primere je mogoče ugotoviti 106 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV na podlagi Slovarčka krajšav. Delovanje algoritma je tako kot pri prekrivnih krajšavah, vendar so upoštevani tudi predlogi in vezniki iz razvezave. Krajšave iz prvih črk V navedeni skupini gre za krajšave tipa NAMA ali BETI, ki jih lahko zapišemo tudi Nama ali Beti, pridobiti pa se jih da s pomočjo Slovarčka krajšav. Take krajšave so sestavljene iz prvih črk razvezave, npr. NAMA = Narodni magazin. Krajšave z vezniki in s predlogi V tem primeru gre za krajšave tipa DZU (Družba za upravljanje), ki imajo predlog tako v krajšavi kot v razvezavi. Tudi pri slednjih se uporabi postopek, ki je opisan pri prekrivnih krajšavah. V primeru, da krajšava ne bo prekrivna z razvezavo, je algoritem ne bo upošteval. 7.1.1.3 Prepoznavanje krajšavnih razvezav iz sobesedila in sovpadanje Pri prepoznavanju krajšavnih razvezav iz sobesedila je treba upoštevati sobesedilo, in sicer levo ali desno od krajšave. Krajšava lahko stoji v oklepaju ali pa v oklepaju stoji razvezava, krajšava pa v takem primeru stoji izven oklepaja, npr. MIP (Mesna industrija Primorske). 7.1.1.4 Programska oprema Zapisu pravil za prepoznavanje krajšav in krajšavnih razvezav sledi izdelava programske opreme. Program je bil zapisan v programskem jeziku C#, za okolje MS.NET Framework, V2.0, in sicer pripravljen kot samostojna komponenta (dll), ki se lahko uporabi v spletnih tehnologijah, kot so npr. obrazci offline windows forms. 7.1.1.5 Opis in delovanje Algoritem je bil implementiran v spletni različici, a samo za interno rabo. Kot je razvidno s spodnje slike, ima program MKstrings dve okni, v prvo vnesemo poljubno besedilo s krajšavami, po kliku na »Click here to process data« (klikni za 7 Algoritem za samodejno prepoznavanje krajšav in krajšavnih razvezav v elektronskih besedilih 107 obdelavo podatkov) se v drugem oknu prikažejo najdene krajšave in krajšavne razvezave. Slika 35: Prikaz delovanja programa MKstrings; Vir: Kompara, 2011. Testno je bilo v program vneseno spodnje besedilo: Ljubljana - SDS (Slovenska demokratska stranka) je na svoji spletni strani objavila premoženjsko stanje svojih poslank in poslancev v DZ (Državni zbor). Podpredsednik Državnega zbora (DZ) France Cukjati je po objavljenih podatkih lastnik polovice enostanovanjske hiše. Poslanec SDS Branko Grims ima devet let star audi A6, 50 delnic Krke in 46 delnic NFD Holdinga, na računu pa 35.000 evrov. Zvezi društev upokojencev Slovenije (ZDUS) je namreč uspelo zbrati več kot 13.500 podpisov zavarovancev za sklic izredne skupščine. Od atipične pljučnice (sars) prek ptičje do nove (prašičje) gripe. Panvita se je za najem in oživitev Mipove proizvodnje v Kromberku odločila skupaj z družbo Mig (Mesna industrija Goriške), ki jo je ustanovila skupina 20 nekdaj zaposlenih v Mipu. NATO (North Atlantic Treaty Organization) je mednarodna vojaško-politična organizacija držav za sodelovanje na področju obrambe, ki je bila ustanovljena leta 1949. Organizacija severnoatlantskega sporazuma ali tudi Severnoatlantska pogodbena zveza (angleško North Atlantic Treaty Organisation; kratica Nato ali NATO) je mednarodna vojaško-politična organizacija držav za sodelovanje na področju obrambe, ki je bila ustanovljena leta 1949. Nato sva odšla. 108 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV Kot je razvidno s slike, algoritem prepozna sledeče krajšave in krajšavne razvezave: SDS Slovenska demokratska stranka DZ Državni zbor DZ Državnega zbora ZDUS Zvezi društev upokojencev Slovenije Mig Mesna industrija Goriške NATO North Atlantic Treaty Organization Nato North Atlantic Treaty Organization Na podlagi dobljenih rezultatov algoritem ne upošteva krajšav brez razvezav tipa sars, Mipu, NFD, A6, kar je bilo pričakovano in je v skladu s pravili prepoznavanja. Glede na izsledke filtracije lahko povemo, da algoritem krajšave in krajšavne razvezave ustrezno prepoznava. 7.1.2 Nadaljnji razvoj Izsledki, ki jih je dal začetni razvoj algoritma, so zagotovo spodbudni, za ustreznejše delovanje pa je bila potrebna nadgradnja algoritma, in sicer predvsem v smislu pravil. V nadaljnjem razvoju je bil za krajšave kandidatke uporabljen niz desetih črk, in sicer v štirih vzorcih možne pojavitve: (krajšava) razvezava (razvezava) krajšava krajšava (razvezava) razvezava (krajšava) Sledilo je testiranje z nekaterimi naključnimi besedili s spletnega portala 24ur.com, da bi ugotovili obnašanje algoritma ter točke, kjer so potrebne izboljšave. Sledijo rezultati testiranja. 7 Algoritem za samodejno prepoznavanje krajšav in krajšavnih razvezav v elektronskih besedilih 109 Vneseno je bilo besedilo: Dela na predoru Markovec pri Kopru sledijo terminskemu planu oziroma so celo pred rokom, trdijo v Družbi za avtoceste v RS (Dars). Po napovedih Darsa bodo v predor Markovec z izolske strani zakopali sredi aprila, s koprske strani pa mesec dni pozneje. Slika 36: Niz Družbi za avtoceste v RS (Dars); Vir: Kompara, 2011. Na sliki 36 lahko vidimo, da algoritem ni prepoznal niza Družbi za avtoceste v RS (Dars). Razlog lahko iščemo v predlogih za in v ter v prisotnosti krajšave v razvezavi. Opravili smo test, pri katerem smo nizu odstranili predlog v in dodali razvezavo za RS (Republika Slovenija), tak niz je sistem prepoznal. Iz slednjega sklepamo, da je treba v pravilih za opredelitev razvezav upoštevati tudi prisotnost več kot enega predloga in pojava krajšave v razvezavi. Omenimo še, da so tovrstna testiranja zelo pomembna, saj so prav taki primeri zanimiv izziv pri iskanju boljših rešitev in na podlagi slednjih je treba dopolnjevati pravila, ki bodo zagotovila brezhibno delovanje algoritma. Testiranje je opozorilo še na nekaj nerazrešenih vprašanj, in sicer tuje krajšave s slovenskimi razvezavami, ali razvezave, zapisane na poseben način, slednje je razvidno iz spodnjega besedila. Obseg proizvodnje motornih vozil v EU se je lani glede na leto 2008 zmanjšal za 17,3 odstotka, glede na predkrizno leto 2007 pa je upadel kar za 23 odstotkov, ugotavlja Združenje evropskih avtomobilskih proizvajalcev (ACEA). 110 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV Prvo vprašanje se osredinja na krajšave s slovenskimi razvezavami tipa Združenje evropskih avtomobilskih proizvajalcev (ACEA), ki so zelo pogoste v slovenskem prostoru in tudi v drugih jezikih. V takih primerih se v jeziku uporablja po večini tuja krajšava in domača razvezava, npr. NATO. Za algoritem to nedvomno predstavlja težavo, saj gre za prepoznavanje krajšav kot takih in prevodov razvezav, v sobesedilu pa ni tujih razvezav, ampak so le domače. V takih primerih se algoritem ne more opirati na leksikalno raven prepoznavanja, v smislu sovpadanja črk. Glede na to, da algoritem temelji na leksikalnem prepoznavanju, so taki primeri izvzeti iz obravnave, saj je treba pri slednjih ubrati popolnoma drugačno metodo. 7.1.3 Tuji jeziki V nadaljevanju se ukvarjamo tudi s prepoznavanjem krajšav in krajšavnih razvezav v tujih jezikih, saj se tuji krajšavno-razvezavni pari pojavljajo tudi v slovenskih besedilih, in sicer predvsem, ko gre za nove, neustaljene krajšave, pa tudi pri mednarodno prepoznavnih krajšavah, pri katerih je v slovenščini v rabi tuja razvezava. Na tej točki je smiselno govoriti o univerzalnosti pravil za prepoznavanje krajšav in krajšavnih razvezav, ki jih omenja Zahariev (2004). Ta opozarja, da so lahko pri določenih tipih besedil pravila univerzalna, npr. pri latinični pisavi, ob upoštevanju črkovnih raznolikosti posameznih jezikov, npr. nemškega, francoskega idr. Prav jezikovne raznolikosti so ključne pri optimalnem prepoznavanju krajšav, slednje pa morajo biti vključene v algoritem za prepoznavanje. Zahariev je opravil pomembno delo, saj se ni omejil le na nekatere evropske jezike, ampak je šel korak dlje in krajšave prepoznaval tudi v arabščini, ruščini, kitajščini, japonščini in drugih bolj eksotičnih jezikih. Po njegovih besedah naj bi bila raznolikost skupna vsem jezikom, zato jo je treba upoštevati pri gradnji algoritma. Sledi prikaz preizkusa univerzalnosti algoritma pri angleških in italijanskih besedilih. 7 Algoritem za samodejno prepoznavanje krajšav in krajšavnih razvezav v elektronskih besedilih 111 Sledi vneseno angleško besedilo (slika 37). USB (Universal Serial Bus) is a specification to establish communication between devices and a host controller (usually personal computers), developed and invented by Ajay Bhatt working in Intel. USB is intended to replace many varieties of serial and parallel ports. USB can connect computer peripherals such as mice, keyboards, digital cameras, printers, personal media players, flash drives, and external hard drives. For many of those devices, USB has become the standard connection method. USB was designed for personal computers [citation needed], but it has become commonplace on other devices such as smartphones, PDAs and video game consoles, and as a power cord between a device and an AC adapter plugged into a wall plug for charging. As of 2008, there are about 2 billion USB devices sold per year, and approximately 6 billion total sold to date. The design of USB is standardized by the USB Implementers Forum (USB-IF), an industry standards body incorporating leading companies from the computer and electronics industries. Notable members have included Agere (now merged with LSI Corporation), Apple Inc., Hewlett- Packard, Intel, Microsoft, Sony and NEC. Human-interface devices (HIDs) Main article: USB human interface device class. Slika 37: Preizkus programa na primeru angleškega besedila;Vir: Kompara, 2011. Kot je razvidno s slike 37, algoritem prepozna niz USB (Universal Serial Bus), ne prepozna pa nizov USB Implementers Forum (USB-IF) in Human-interface devices (HIDs), in sicer zaradi mešanega zapisa krajšav (velike in male črke), npr. HIDs in posebnih znakov (vezaj), npr. USB-IF pri krajšavah in razvezavah ter rabe krajšav v razvezavi, 112 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV npr. USB Implementers Forum. Algoritem prepozna niz (IF) Implementers Forum, saj je ta skladen s pravili o prepoznavanju, ne prepozna pa krajšav PDAs, AC, LSI, NEC, saj slednje nimajo razvezav. Sledi vneseno italijansko besedilo (slika 38). L'ANAS, il cui nome era l'acronimo di Azienda Nazionale Autonoma delle Strade, è una società per azioni italiana, di proprietà statale, avente per unico socio il Ministero dell'Economia e delle Finanze. L'ANAS, sotto la vigilanza tecnica e operativa del Ministero delle Infrastrutture e dei Trasporti, gestisce la rete stradale ed autostradale italiana di interesse nazionale. a Confederazione Generale del Lavoro (CGdL ) è l'organizzazione sindacale fondata a Milano, tra il 29 settembre e il 1º ottobre del 1906, per iniziativa … Cerca un acronimo per CGL . . CGL - abbreviazione aeronautica di Circling guidance light(s) - Luce/Luci di guida alla … Il Popolo della Libertà (PdL) è un partito politico italiano di centro-destra, membro del Partito Popolare Europeo. Il partito nasce dall'unione dei due . . Slika 38: Preizkus na primeru italijanskega besedila; Vir: Kompara, 2011. S slike 38 je razvidno, da algoritem ne prepozna niza (ANAS) Azienda Nazionale Autonoma delle Strade, zelo verjetno zaradi rabe določnega člena (L') in določnega 7 Algoritem za samodejno prepoznavanje krajšav in krajšavnih razvezav v elektronskih besedilih 113 člena, ki se veže s predlogom (delle), opazimo pa, da prepozna niza Confederazione Generale del Lavoro (CGdL) in Popolo della Libertà (PdL). Po pregledu filtracije angleškega in italijanskega besedila lahko sklepamo, da algoritem za prepoznavanje krajšav ni univerzalen, saj ima vsak jezik specifične značilnosti, ki morajo biti v obliki pravil implementiranih v algoritem, če želimo, da slednji ustrezno prepozna krajšave in krajšavne razvezave tudi v tem jeziku. 7.1.4 Gradivo Po opravljenem testiranju, ki je potekalo na predhodno pripravljenih in namenskih vzorčnih besedilih in posodobitvi pravil, je bil algoritem uporabljen na obširni in raznoliki, s krajšavami bogati, zbirki besedil. Krajšave, tako nove kot že ustaljene, se predvsem zaradi jezikovne gospodarnosti, pa tudi prepoznavnosti, modnosti, zgoščenosti, pogosto pojavijo prav v medijih, zato je bilo filtriranje narejeno na besedilih petih letnikov dnevnika Delo, in sicer od leta 2005 do vključno 2009. Zbirka obsega 60 milijonov besed in 4 milijone povedi. 334.000 povedi ima oba oklepaja, 439.000 povedi pa vsaj po eno zaporedje velikih črk. Besedila so bila razdeljena v dve zbirki, kar olajša filtriranje in nadaljnjo obdelavo. Prva je zajemala povedi z oklepajema, druga pa povedi z le zaporedjem velikih črk. Posodobljen algoritem je zbirki filtriral približno 30 minut in izluščil 5820 kandidatov krajšavno- razvezavnih parov, pri čemer pri luščenju upošteva večpomenskost krajšav in število pomenov označi z arabskimi številkami. Opozoriti je treba, da vsi krajšavno- razvezavni pari niso ustrezni oz. niso pravi, saj se v veliki množici razvezav in krajšav najde kopica lažnih primerov ter ponavljajoči se pari. Krajšavo težko označimo za lažno, saj je lahko že vsako sosledje črk krajšava oz. kratica, lažje je z razvezavami, saj prav slednje pričajo o dejanskem obstoju niza krajšave in razvezave. Preverjanje ustreznih krajšavno-razvezavnih nizov je potekalo ročno, vsak par je bil preverjen s pomočjo iskalnika Google. 7.1.5 Izsledki raziskave 7.1.5.1 Oris lažnih krajšavno-razvezavnih parov Lažne krajšavno-razvezavne pare je mogoče prepoznati le z ročnim pregledovanjem, kar je lahko zelo zamudno. Z ročnim pregledovanjem je bilo najdenih 189 takih parov, kar je 3,24 %, iz tega sledi, da natančnost algoritma znaša 96,75 %, pri čemer 114 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV je sistem pregledal 5820 primerov kandidatov. Med lažnimi pari najdemo krajšave, ki ne sovpadajo niti z eno ustrezno razvezavo, kar pomeni, da taki krajšavno- razvezavni pari ne obstajajo. Lažne razvezave hitro prepoznamo, saj nekatere ne vsebujejo vseh razvezavnih delov ali pa predstavljajo zgolj dele navadnega besedila ter so pomensko neustrezne in se ne ujemajo s krajšavo. Iz seznama lažnih parov so bila izločena tudi vsa lastna imena, npr. JB, Janez Bratovž. V preglednici 16 vidimo nekaj lažnih parov, pogostost v številu pojavitev je vidna v drugem stolpcu. Preglednica 16: Najbolj in najmanj pogosti lažni krajšavno-razvezavni pari Krajšava Število pojavitev Prva razvezava PO 746 predstavljenih podatkih TV 48 TV Tednik NE 28 nasprotnikov EU DP 27 domačem pokalu DPA 10 dovoljenj Po pisanju agencije ČE 10 članice EU ON 2 občinstvo navdušil NNNSP 2 nič nas ne sme presenetiti GO 1 Gorenje obe KAJ 1 Kratko atraktivno jedrnato SS 1 spremenjena signalizacija PISK 1 prevod in spremna beseda Klemen VEM 1 Vse na enem mestu Vir: Kompara, 2011. Kot je razvidno iz preglednice 16, so v skrajno levem oknu krajšave, v sredinskem oknu sledi število razvezav oz. pojavitev, v skrajno desnem oknu pa najdemo prvo pojavno razvezavo. Posamezna krajšava ima lahko več razvezav, največ razvezav je imela v našem primeru krajšava PO, in sicer kar 746. Sledijo pari z občutno nižjo prednostjo pojavitve, npr. krajšava TV ni imela ustrezne razvezave v 48 primerih, NE v 28, DP v 27. Pod desetimi neustreznimi razvezavami najdemo krajšave DPA, ČE, ON, NNNSP, GO, CLC, KAJ, SS, PISK, VEM. 7 Algoritem za samodejno prepoznavanje krajšav in krajšavnih razvezav v elektronskih besedilih 115 7.1.5.2 Oris ustreznih krajšavno-razvezavnih parov Samo pridobivanje krajšavno-razvezavnih parov iz besedil je hitro in preprosto, veliko bolj zamudno je pregledovanje ustreznosti luščenih parov. Iz pridobljenega seznama parov so bile izločene lažne krajšave oz. vse krajšave, ki niso ustrezale vsaj eni razvezavi, četudi krajšave obstajajo. Tako sta bili v besedilu najdeni npr. HIV, AJPES, ki sta dejansko krajšavi, ki ju poznamo, a ker nista bili prisotni razvezavi, ju je algoritem samodejno odstranil. Omenimo, da je nekaj lažnih razvezav tudi ustrezalo pravilom o prepoznavanju, prav slednje pa lahko za lažne prepozna le človeško oko. Primeri lažnih razvezav so vidni v preglednici 17, pri čemer algoritem krajšavi PZS pripiše kar 4 razvezave, med katerimi je ena lažna, pa tudi zaradi stroškov, ki pa vseeno ustreza pravilom za prepoznavanje. Preglednica 17: Primer krajšave PZS PZS 1 Planinski zvezi Slovenije 2 pa tudi zaradi stroškov 3 Plesne zveze Slovenije 4 Plavalni zvezi Slovenije Vir: Kompara, 2011. Podobno je pri krajšavi KS v preglednici 18, saj so pri slednji ustrezni trije pomeni, in sicer primeri 2, 3 in 4. Preglednica 18: Primer krajšave KS KS 1 koncu seje 2 krajevnih skupnosti 3 Krajevne skupnosti 4 Konfederacije sindikatov Vir: Kompara, 2011. Algoritem je krajšave in razvezave prepoznaval tako, kot so si sledile v besedilu, pri tem pa je zajel razvezave v različnih sklonih ter ponavljajoče se razvezave. Po filtraciji je bilo treba iz nabora dobljenih parov ročno izluščiti najbolj nevtralno razvezavo in odstraniti primere, ki so se ponavljali. Slednje je prikazano v preglednici 19, pri čemer 116 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV vidimo, da so od šestih dobljenih razvezav krajšave MNZ po ročnem luščenju ohranjene le tri ustrezne. Preglednica 19: Primer krajšave MNZ MNZ 1 ministrstva za notranje zadeve 2 medobčinskih nogometnih zvez 3 ministrstvom za notranje zadeve 4 Medobčinske nogometne zveze 5 Muzeja novejše zgodovine 6 Muzej novejše zgodovine MNZ 1 ministrstvo za notranje zadeve 2 medobčinska nogometna zveza 3 Muzej novejše zgodovine Vir: Kompara, 2011. Zbirka ustreznih krajšavno-razvezavnih parov je po ročnem pregledu, ki je bil izveden s pomočjo iskalnika Google, štela 2.665 krajšavno-razvezavnih parov, od tega je 646 tujih, in sicer največ angleških, sledijo italijanski, francoski, španski, nemški idr. Pri tujih krajšavah opazimo nekaj pomanjkljivosti, in sicer pri nekaterih tujih manjka prvi del razvezave, preostale pa ustrezajo pravilom za prepoznavanje, ki so bila v celoti zasnovana za prepoznavanje krajšav in krajšavnih razvezav v slovenskih besedilih. Omeniti velja, da slednje kaže na univerzalnost pravil za večino jezikov. Nekaj primerov prepoznavnosti je navedenih v spodnjih preglednicah, in sicer algoritem prepozna niza ESA, BNL, delno tudi niz DOC in DOCG, pri slednjih sicer manjka začetni del razvezave, denominazione (glej preglednico 20). Kot je že omenil Zahariev (2004), mora biti algoritem prirejen za potrebe posameznega jezika, saj ima vsak jezik svoje značilnosti. Algoritem na navedeni stopnji razvoja ni zrel za prepoznavanje bolj zapletenih nizov, npr. Dipartimento di Scienze del Linguaggio, dell’Interpretazione e della Traduzione (DSLIT) in Centro Interdipartimentale per la Ricerca Didattica (CIRD), predvsem v bolj zapletenem kontekstu, če so krajšave obravnavane v vlogi lastnih imen, npr. L'ANAS, L'Anas. Podobno velja tudi za druge jezike, saj na rezultate utegne vplivati več dejavnikov, npr. zapis v nelatinični pisavi kot tudi tipološke značilnosti. 7 Algoritem za samodejno prepoznavanje krajšav in krajšavnih razvezav v elektronskih besedilih 117 Preglednica 20: Krajšavno-razvezavni pari ESA 1 European Space Agency 2 European Sponsorship Association DOC 1 di origine controlata DOCG 1 di origine controlata e garantita BNL 1 Bance Nazionale del Lavoro Vir: Kompara, 2011. 7.1.6 Nekaj novejših algoritmov, nastalih po letu 2011 Po letu 2011 je bilo sestavljenih še nekaj algoritmov za prepoznavanje krajšav, in sicer pretežno v biomedicinski stroki, izpostaviti velja pristop Toti, Atzeni in Polticelli (2012), ki se ukvarjajo z metodologijo za prepoznavanje krajšav proteinov v znanstvenih prispevkih, saj želijo zgraditi javno dostopno zbirko krajšav. Pristop PRAISED temelji na treh ključnih korakih; prepoznavanju krajšav, ki temelji na neodvisni metriki, katere namen je prepoznati vse krajšave v znanstvenem besedilu; sledi sovpadanje krajšave in razvezave ter slovarsko podprto prepoznavanje imen proteinov, da se izloči tiste krajšavno-razvezavne pare, ki niso proteini. Pristop PRAISED je bil testiran na nekaterih označenih korpusih, in sicer Medstract Gold Standard Corpus, AB3P Corpus, BioText Corpus a Ao and Takagi Corpus. Tudi Rezarta Islamaj Doğan idr. (2014) se ukvarjajo s prepoznavanje krajšav, in sicer v pristopu BioC, tj. zgrajen XML format za izmenjavo besedilnih podatkov in označevanje, gre za orodje za obdelavo naravnega jezika v biomedicinskih besedilih, uporablja se tudi pri prepoznavanju krajšav. Prepoznavanje temelji na pravilih, in sicer za prepoznavanje krajšav in razvezav. Poslužuje se pristopa, pri katerem krajšava ali razvezava stojita v oklepaju, in sicer v dveh parih (krajšava) razvezava in (razvezava) krajšava. S prepoznavanjem krajšav se ukvarjajo tudi Jing Peng idr. (2015), najnovejša študija pa je iz leta 2017 (Glass idr.), kjer se avtorji ukvarjajo z izdelavo večjezičnega vira krajšavno-razvezavnih parov, ki je sestavljen samodejno. Krajšavno-razvezavni pari izhajajo iz nestrukturiranih besedil, za potrebe sestave zbirke pa se bo uporabljala Wikipedija. V okviru raziskave se osredinjajo predvsem na krajšave z več razvezavami. Trenutno pristop podpira sedem jezikov. 118 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV Algoritmi, ki smo jih predstavili, so primerni za filtracijo pretežno angleških besedil, saj je specifika slovenščine prav njena visoka pregibnost, ki pa zaradi kompleksnosti ni predstavljena v monografiji. Cilj sestave algoritma za samodejno prepoznavanje krajšav in krajšavnih razvezav v elektronskih besedilih je bil pridobiti krajšavno- razvezavne pare za sestavo slovarja krajšav. V raziskavi smo želeli narediti korak dlje in gradivo za sestavo slovarja krajšav obdelati računalniško. Rezultat je samodejno sestavljen slovar krajšav, ki predstavlja prvo na tovrstni način sestavljeno delo v slovenskem prostoru. Izsledke predstavimo v poglavju 8. SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV M. Kompara 119 8 IZDELAVA SLOVARJA KRAJŠAV NA PODLAGI SAMODEJNEGA PREPOZNAVANJA Veliko slovarjev so slovaropisci začeli sestavljati ali so jih celo dokončali, preden so sploh ugotovili, da dejansko pišejo slovar (Bergenholtz in Tarp, 1995), saj lahko nastanek slovarja poteka na različne načine (Atkins in Rundell, 2008). Zlasti včasih je postopek potekal prek zbiranja kartotečnih listkov ali zapisov strokovnih izrazov, slednjim so bili nato dodani razlage, primeri ali prevodne ustreznice, sledil je bolj sistematiziran koncept dela. Pri takem izdelovanju slovarja sestavljavec upošteva potrebe uporabnika, gradivo za delo pa izhaja iz relevantnih besedil. Glede na povedano je pri izdelavi ključnega pomena prav pripravljalno delo (Bergenholtz in Tarp, 1995). Na podlagi kartotečnih listkov, izpisanih besedil in zbirk citatov je nastala večina slovarjev iz predračunalniške dobe, danes so take slovarje nadomestili slovarski korpusi, ki vsebujejo citate, izbrane po veliko bolj objektivnih in uravnoteženih merilih, saj korpusi prikazujejo jezik v vseh zvrsteh, od pogovornega do znanstvenega. Slabost predračunalniških slovarjev je v tem, da so citate črpali samo iz virov, ki so veljali za jezikovno ustrezne, niso pa zajeli jezika v celoti, temveč le določen segment, navadno literarnega. Prednost sodobnega slovaropisja je v tem, da sodobni korpusi odražajo dejansko stanje jezika, in sicer vključujejo količinsko, zvrstno in besedilnovrstno bolj uravnotežena besedila, čeprav imajo avtorji pomisleke o enačenju spleta s korpusom (Michelizza, 2015). Še eno prednost pa predstavljajo programska orodja, konkordančniki, prilagojeni za delo s korpusom, 120 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV saj omogočajo analizo jezikovnih podatkov (Atkins in Rundell, 2008). Poleg tega korpusi omogočajo še hitrejše in učinkovitejše iskanje, pri tem pa slovaropisec ni omejen le na iskanje ciljne besede kot pri kartotečnih listkih, temveč lahko išče želene enote po različnih kriterijih (Bergenholtz in Tarp, 1995). Prav zato je pomembno, da pri pripravljalnih delih za slovar določimo korake in tako že pred samim začetkom sestavljanja slovarja predvidevamo potrebe potencialnih uporabnikov, kategorije podatkov, ki jih moramo vključiti ter kako slednje predstavimo. Tu mislimo predvsem na izbor gesel, kolokacij, primerov, enciklopedičnih in jezikovnih podatkov itn. Potrebe uporabnikov lahko ugotovimo s pomočjo vprašalnika (Bergenholtz in Tarp, 1995: 77–83), ki je ključnega pomena pri pripravljalnem in nadaljnjem delu, pa tudi z opredelitvijo področja, ki ga bo slovar pokrival. Obenem ne smemo pozabiti še na zunanjo in notranjo ter terminološko klasifikacijo (Atkins in Rundell, 2008). Pri zunanji mislimo na sistematsko ureditev stroke, in sicer z namenom, da se izbere gradivo, ki bo tvorilo osnovo slovarja, notranja klasifikacija pa izvede pregled stroke in pripravi osnovo za sistematsko strukturiranje slovarja, terminološka klasifikacija pa se osredinja na sistematično naštevanje strokovne specializirane terminologije, ki zagotavlja termine strokovnega področja. V gradivo za slovar uvrščamo tako obstoječo literaturo kot slovarje in enciklopedije ter ostalo referenčno gradivo, korpuse, podatkovne zbirke, priročnike, znanstvene članke, monografije ipd. V nadaljevanju sledi sestava leksikografskih navodil za poenotenje strukture različnih delov slovarja. Sledi določanje uporabnikov, klasifikacija stroke, empirična osnova ter osnutek za vzorčni članek ter na podlagi vzorčnih gesel izdelava leksikografskih navodil. Za slovar je ključna kakovost leksikografskega dela, izbira gesel glede na cilj dela, podatek o številu gesel, predpogoj za izbor gesel so tudi omejitve obsega področja, ki ga bo slovar pokrival (Bergenholtz in Tarp, 1995). Slovarje krajšav uvrščamo med terminološke slovarje, slednji so lahko delo slovenskih avtorjev ali pa so prevedeni. Tovrstni slovarji so načeloma izdelani hitreje kot izvirni slovenski, opozoriti pa moramo na težave, ki se pri tem pojavljajo. Če so taki slovarji prevedeni, ne zajemajo vsega slovenskega strokovnega izrazja, ker niso izdelani na podlagi izpisov iz slovenskih del, prav tako ne sopomenskih in starejših poimenovanj, poleg tega so zelo pogosto zastareli (Humar, 1998). Kakovosten in izvirni terminološki slovar lahko izdela zgolj skupina domačih strokovnjakov, tak strokovni slovar pa obravnava tako izrazje kot besedje določene stroke, pri pisanju 8 Izdelava slovarja krajšav na podlagi samodejnega prepoznavanja 121 pa morajo sodelovati strokovnjaki določene stroke in slovaropisci. Izdelava kakovostnega izvirnega terminološkega slovarja poteka v več stopnjah. Začnemo z določitvijo ciljne skupine uporabnikov, določimo namen, obseg in tip, sledi zbiranje gradiva, oblikovanje kartoteke podatkov, izdelava nabora, izbira terminov, ki bodo iztočnice ali podiztočnice v slovarju, slovaropisna obdelava iztočnic in izdelava slovarskih gesel. 8.1 Elektronsko slovaropisje Živimo v dobi, ko sta se združila slovar in računalnik, elektronski slovar pa je postal nekaj povsem vsakdanjega, medtem ko listanje papirnatih slovarjev predstavlja precej zamudno opravilo. Splet nudi pester nabor slovarskih vsebin; od preprostih seznamov besed do velikih prevodnih slovarjev. Splet je med drugim postal korpus in kot tak pomeni prihodnost pri gradnji korpusov in elektronskih slovarjev, enciklopedij, glosarjev idr., čeprav je vloga spleta kot korpusa predmet diskusije, to ugotavlja Michelizza (2015). Obenem je treba opozoriti, da morajo biti elektronski slovarji vse bolj prilagodljivi in služiti uporabniku v najrazličnejših okoliščinah (Heid, 2009). Hitro lahko opazimo, kako so računalniki prevzeli številna opravila, ki so jih prej delali slovaropisci in prav zato izpostavimo besede Rundella (uvodni govor na konferenci E-lexicography 2009 v Belgiji), ki se sprašuje, ali bodo računalniki kmalu izpodrinili slovaropisce in ali jih bomo leta 3000 sploh še imeli? Računalniki se razvijajo hitro, nove različice, ki prihajajo na trg, so vse bolj dovršene, razvoj računalništva in vključevanje slednjega v slovarsko delo pa nas opominjata, da bo človeški prispevek k slovarskemu delu vedno manjši, bo pa vedno potreben in nedvomno nujen tudi v prihodnosti, saj bo same izboljšave na področju elektronskega slovaropisja lahko predlagal in uresničil le slovaropisec. De Schryver (2009) opozarja, da bo prihodnost leksikografije digitalna, splet bo imel osrednjo vlogo, slovar pa bo prilagodljiv ter se bo odzval na trenutno dogajanje v jeziku. Slovarje najdemo že skoraj v vseh oblikah, od papirnatih so se razširili na zgoščenke, elektronske, spletne, ne nazadnje obstajajo tudi že različice, dostopne prek mobilnih telefonov. Izdelava slovarja postaja danes vse bolj avtomatizirana, slovarsko delo pa vse bolj prefinjeno, saj ima slovaropisec za sestavo slovarja in pisanje gesel na voljo številna orodja, slednja pa njegovo delo poenostavijo in izboljšajo. V nadaljevanju predstavimo Termanio, gre za prosto dostopni spletni portal, namenjen iskanju po slovarskih zbirkah ter tudi izdelavi in urejanju slovarskih gesel. Portal je mesto zbiranja predvsem terminoloških in tudi drugih podatkov slovarske narave, iskanje pa je njegova osnovna funkcija, saj omogoča uporabo informacij, vsebovanih v 122 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV dostopnih slovarskih zbirkah. Osnovno iskanje omogoča enostavno in hitro poizvedovanje po slovarjih, dostopnih na portalu, brez dodatnih iskalnih pogojev, zato je osnovna iskalna stran preprosta in primerljiva s klasičnimi spletnimi iskalniki. Tako osnovna stran kot tudi večina drugih podstrani vsebujejo še povezave na druge glavne dele portala, kot so strani za delo s slovarji in korpusi, uporaba foruma, registracija in prijava, izbira jezika vmesnika, oglaševanje in informacije o portalu. S pomočjo naprednega iskanja ima uporabnik možnost omejiti iskanje na določeno lastnost, kot je element slovarja (iztočnica, prevod, drugo), jezik, področje ali slovar, ter določiti število izpisanih zadetkov na strani. Rezultati iskanja se prikažejo glede na iskalni pogoj, izpišejo se skrajšana gesla oz. le tisti podatki, ki uporabnika običajno najbolj zanimajo, gre za iztočnico, prevode in definicijo. Na portalu Termania so slovarji, do katerih lahko dostopa uporabnik, razporejeni v tri skupine, in sicer »Moji« so tisti, pri katerih je uporabnik del uredniške ekipe, »Vsi« pa tisti, ki jih uporabnik lahko ureja ali išče po njih, »Priljubljeni« pa so tisti, ki jih uporabnik iz prvih dveh skupin izbere za svoje priljubljene. Uporabnik prek seznama dostopa do informacij o slovarjih, do njihovih nastavitev in do urejanja gesel. Iskanje po slovarjih, ki so označeni kot javno dostopni, bo dostopno vsakemu, tudi neregistriranemu uporabniku. 8.2 Korpusno zasnovani slovarji Slovarji, zasnovani na podlagi korpusov, predstavljajo pravo revolucijo na področju slovaropisja, saj lahko ob pomoči slednjih sestavimo vir, ki temelji na avtentičnih podatkih v količinah, ki so bile še nedavno popolnoma nepredstavljive. Tako sestavimo slovar, ki je veliko bolj zvest jeziku v rabi kot pa zbirke, ki niso zasnovane na podlagi korpusa. Prav s pomočjo korpusov so nastali slovarji rabe, ki pri predstavitvi definicij temeljijo na sodobnem jeziku. Taki slovarji so pogosti predvsem v angleškem prostoru, primer takega slovarja je angleški slovar A Dictionary of the English Language (Johnson, 1963), ki omogoča preučevanje jezika v rabi s predstavitvijo primerov iz resničnih besedil. Izbira takih besedil je bila včasih dolgotrajna in zamudna, danes je popolnoma drugače, saj reprezentativne primere rabe besed s pomočjo korpusov pridobimo veliko hitreje in na tak način slovarji odražajo dejansko rabo jezika, čeprav je treba imeti v mislih tip besedila iz korpusa in ne smemo slepo slediti korpusnim podatkom. Še en korpusni slovar, ki ga izpostavljamo, je Oxford Advanced Learner's Dictionary of Current English (2007), 8 Izdelava slovarja krajšav na podlagi samodejnega prepoznavanja 123 slednji temelji na britanskem nacionalnem korpusu The British National Corpus (Chiari, 2007). Tudi v slovenskem prostoru s korpusnimi slovarji ne zaostajamo. Omeniti velja Veliki angleško-slovenski slovar Oxford–DZS, ki je plod desetletnega sodelovanja med založbama Oxford University Press in DZS. S pomočjo besedilnih korpusov so slovaropisci izdelali sodoben, široko uporaben, zanesljiv in uporabniku prijazen angleško-slovenski slovar, ki na eni strani prikazuje stanje sodobne angleščine in slovenščine, na drugi pa odseva aktualna sporazumevalna razmerja med jezikoma. Dodati je treba, da slovar ni predelava ali nadgradnja katerega od že obstoječih starejših angleško-slovenskih slovarjev, ampak je popolnoma novo delo s 120.000 iztočnicami, ki ga lahko uvrščamo med velike dvojezične slovarje, saj celovito pokriva obsežno angleško splošno besedišče in strokovno izrazje, vsebuje britanske in ameriške različice, krajšave ter lastna imena. Opremljen je še s primeri rabe, pridobljenimi iz avtentičnih angleških besedil. Slovarska baza osnovnega nabora je prevzeta po angleško-francoskem slovarju The Oxford-Hachette French Dictionary (Corréard, 2007), ampak je temeljito prirejena in dopolnjena za potrebe angleško- slovenske protistave. H kakovosti in zanesljivosti sta na angleški strani prispevala britanska besedilna korpusa The Bank of English ter The British National Corpus, na slovenski pa referenčni Korpus slovenskega jezika FIDA, FIDAPlus in Gigafida (2018). Iz korpusnega slovarja lahko uporabnik pridobi avtentične primere rabe in prost dostop do podatkov referenčnih korpusov. V slovaropisju se korpusi uporabljajo tudi za urejanje in iskanje novih načinov uporabe, ki so različni od tradicionalnih, pomen korpusov je temeljni predvsem pri preučevanju in analizi pomenov jezika. Med letoma 2008 in 2009 je založba DZS izdala še nekaj korpusnih slovarjev, in sicer Mali angleško-slovenski in slovensko-angleški slovar (Drinovec- Sever, 2008) ter Mali hrvaško-slovenski in slovensko-hrvaški slovar (Rigač, 2009). Omeniti je treba še Mali italijansko-slovenski in slovensko-italijanski slovar (Brecelj, 2010) in Priročni angleško-slovenski in slovensko-angleški slovar (Drinovec Sever, 2010 idr.). 8.3 Samodejno izdelan Slovar krajšav (Kompara, 2011) Sestava algoritma za samodejno prepoznavanje krajšav in krajšavnih razvezav v elektronskih besedilih omogoča hitrejše in učinkovitejše pridobivanje gradiva za gradnjo slovarja krajšav, in sicer tudi samodejno. Kot primer izpostavimo, da se je gradivo za izgradnjo Slovarčka krajšav zbiralo približno tri leta, slednje je vključevalo 124 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV tudi preverjanje slovenskih in tujih gesel ter prevodov in popravke. Samodejno prepoznavanje in pridobivanje slovarskega gradiva je nedvomno znatno krajše, saj algoritem zbirko, primerljivo tisti iz Slovarčka krajšav, izlušči iz korpusa v slabe pol ure. Ob predhodno zastavljeni strukturi gesla in prečiščenem naboru ima slovaropisec bistveno manj dela. Po filtraciji in ekstrakciji krajšavno-razverzavnih parov bi bilo treba gesla preveriti, izločiti lažna in tista, ki se ponavljajo, pregibane razvezave pa lematizirati. V nadaljevanju so podane smernice za sestavo slovarja krajšav. Izsledki algoritma oz. prečiščena zbirka krajšavno-razvezavnih parov je bila ob pomoči gospoda Mira Romiha iz podjetja Amebis samodejno vnesena v slovarsko masko Termanie in je prosto dostopna na portalu. Omogoča iskanje po krajšavi ali po razvezavi. Geslo v slovarju je preprosto, to pomeni, da tuje razvezave niso prevedene, ni enciklopedičnih podatkov in kvalifikatorjev. Vzorčno geslo je vidno na spodnji sliki. Slika 39: Vzorčno geslo iz Slovarja krajšav; Vir: Kompara, 2011. Gesla so bila vnesena samodejno po čiščenju, tako kot so se pojavljala v korpusu, razvezave niso vedno podane v osnovni obliki, npr. arhitekturnem ateljeju pri krajšavi AA ali civilne iniciative pri krajšavi CI. Za potrebe sestavljanja samodejnega slovarja krajšav je bilo treba preučiti nekaj ključnih korakov. Pri prvem koraku smo s pomočjo algoritma za samodejno prepoznavanje krajšavno-razvezavnih parov pridobili podatke za sestavo samodejnega krajšavnega slovarja. S filtracijo 60 milijonskega korpusa smo pridobili 8 Izdelava slovarja krajšav na podlagi samodejnega prepoznavanja 125 5820 krajšavno-razvezavnih parov, po ročnem pregledu ustreznosti parov in odstranitvi lažnih smo tiste ustrezne vključili v spletno masko Termanie. V naslednjih korakih se osredinimo na samodejno sestavljanje slovarskih gesel, pri čemer so bile razvezave samodejno pretvorjene v imenovalniško obliko, prav tako samodejno pa so bili dodani izvorni jeziki. V zaključnem delu gradnje slovarja predstavimo preprosta in zapletena slovarska gesla. 8.3.1 Potek, zapleti in rezultati Prvo težavo predstavljajo krajšavne razvezave, ki se pojavijo v neimenovalniški obliki, saj je prav slednja primerna za vključitev v slovar. Težava nastopi tudi pri številu, saj je slednje lahko edninsko, množinsko ali dvojinsko, ne nazadnje pa velja omeniti tudi pojav razvezav v drugih jezikih. Presis, strojni prevajalnik, ki ga je razvilo podjetje Amebis, je bil uporabljen skozi celoten postopek lematizacije. Presis podpira slovensko-angleške, angleško-slovenske in nemško-slovenske prevode ter je del projekta iTranslate4.eu. Program temelji na analizatorjih in generatorjih, pri čemer analizatorji prevedejo besedilo iz slovenščine, angleščine ali nemščine v Presis Interlinguo, generatorji pa prevedejo Presis Interlinguo v slovenščino ali angleščino. Presisov slovenski analizator je bil uporabljen za prevajanje razvezav v Presis Interlinguo. Uporabljena je bila posebna različica analizatorja, ki prepozna osebke in predmete v različnih sklonih. Če je rezultat osebek, je ta že v imenovalniški obliki in ni potrebno dodatno delo. Če je rezultat predmet, je prevodna Interlingua zamenjana in predmet postane osebek. Rezultat je enak pojavnici v imenovalniški obliki. Posebej pomembno je, da se odstrani podatek o pomenu iz prevodne Interlingue, preden se slednje pošlje v generator, sicer lahko nekatere besede v imenovalniški strukturi zamenjajo sinonimi. Težave, ki se pojavijo, so tudi množinske oblike namesto edninskih, določniške oblike pridevnikov, velika začetnica ter pojavitev dvojne razvezave. Po vseh opravljenih spremembah za konverzijo v imenovalniško strukturo pridobimo 2.661 ustreznih razvezav in 433 napak. Konverzija je rešila 70 % primerov, večina preostalih napak nastane zaradi velike začetnice in števila ter nekaj neznanih besed (Kompara in Holozan, 2011). 8.3.2 Prepoznavanje jezika in rezultati V samodejno sestavljenem slovarju so bili vsem razvezavam samodejno dodani jezikovni kvalifikatorji, za pridobitev slednjega so pogosto uporabljene statistične metode (Dunning, 1994). Take metode sicer pogosto ne delujejo dobro pri kratkih 126 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV besedilih, kot so razvezave. V prvi fazi je razvezava poslana v slovenski analizator, če je postopek uspešen, se doda jezikovno kodo »sl«, če postopek ni uspešen, pa se doda »sl-x«. Sledi uporaba angleškega analizatorja, ki pri uspešnem prepoznavanju doda kodo »en«, pri neuspešnem pa »en-x«. Postopek se nadaljuje za vsak posamezni jezik. V primeru, da analizator ne uspe najti jezika, se doda koda »xx«. Od 3.094 jezikovnih označb jih je 126 napačno označenih, 95,9 % primerov je bilo pravilno določenih (Kompara in Holozan, 2011). 8.3.3 Geslo v Termanii Po zgoraj navedenih spremembah je samodejno izdelan slovar krajšav na voljo na spletni strani portala Termania. Gesla so preprosta in zapletena, preprosta so vsa slovenska gesla, npr. SAZU, v pomenu Slovenska akademija znanosti in umetnosti, ki so sestavljeni iz krajšave in razvezave, kot je razvidno s slike 40. Slika 40: Preprosto geslo; Vir: Slovar krajšav, 2011. Trenutno lahko v Slovarju krajšav samodejno pripravimo zgolj preprosta gesla, kot so npr. BDP, FF, DZU, gre za slovenske krajšave, ki so v slovarskem geslu opremljene z razvezavo v imenovalniški strukturi in jezikovnim kvalifikatorjem za slovenski jezik. Tako zasnovana gesla so nedvomno dobrodošla v slovenskem slovarju krajšav, edini dodatek bi lahko bila dodatna razlaga termina, a to velja samo pri nekaterih geslih, ki bi jih bilo treba predhodno ročno izbrati, vsekakor pa mora biti dodatna razlaga kratka in jasna. Možno bi bilo celo uporabiti povezavo na enciklopedijo. V gesla bi utegnili vnesti še podatke o izgovarjavi, naglaševanju, spolu in primere rabe, čeprav bi take podatke prej pričakovali v slovenskem pravopisu, saj se tudi v tujih krajšavnih slovarjih ne pojavljajo. 8 Izdelava slovarja krajšav na podlagi samodejnega prepoznavanja 127 K zapletenim geslom sodijo tuje krajšave. Zapletena gesla so sestavljena iz tuje razvezave in podatka o tujem jeziku, kar je razvidno s spodnje slike. Takim geslom manjka slovenski prevod, utegnili bi jim dodati še dodatno razlago in slovenske krajšave, če te obstajajo. Slika 41: Zapleteno geslo; Vir: Slovar krajšav, 2011. Trenutno se lahko v samodejno sestavljen slovar krajšav prevode, opise in enciklopedične podatke oz. dodatno razlago vključi zgolj ročno. Pri geslih, predvsem pri zapletenih, zato ne moremo govoriti o samodejni pripravi. Poudariti pa moramo, da je v smislu opisa, enciklopedičnih podatkov in prevodov pristop k avtomatiziranemu oblikovanju gesla zagotovo izziv za prihodnost. 128 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV M. Kompara 129 9 SESTAVA NOVEGA SLOVARJA KRAJŠAV Po dveh slovarskih poskusih, ki sta bila omenjena v predhodnih poglavjih, Slovarček krajšav iz leta 2006 ter Slovar krajšav iz leta 2011, je v pripravi obširnejši slovar krajšav. Novi slovar krajšav je abecedno urejen in šteje okrog 10.000 gesel, pri tem je treba opozoriti, da ima posamezna krajšava lahko tudi 10 razvezav in več, povprečno po 3, zato lahko trdimo, da v slovarju najdemo okrog 30.000 krajšavnih razvezav. Slovar je nastajal več let in v smislu uporabljenega gradiva temelji na Slovarčku krajšav iz leta 2006 ter Slovarju krajšav iz leta 2011. Tudi novi slovar krajšav je nastal ob pomoči algoritma za samodejno prepoznavanje krajšav in krajšavnih razvezav v elektronskih besedilih. V času nastajanja dela so bila uporabljena različna računalniška orodja. Na začetku smo se posluževali ročnega zbiranja gradiva in pisanja, slovarska gesla so bila zato v preprostih Excelovih tabelah. V nadaljevanju je bil uporabljen program Eva, ki ga je za pisanje slovarja priredil dr. Primož Jakopin, avtor programa. Sledila je uporaba slovarske maske Termania, ki je prosto dostopna vsem posameznikom, ki želijo sestaviti slovarsko zbirko. V zaključni fazi je bila zbirka krajšav za vsako posamezno črko prenesena v Wordove dokumente. Ob tem smo se zavedali, da Wordovi dokumenti slovaropiscu ne nudijo posebne podpore pri pisanju slovarjev, a vseeno ostajajo najbolj preprosto orodje, predvsem za zaključno urejanje in pregled slovarske zbirke. V zbirki so vse črke slovenske abecede, dodane pa so še črke Q, X, Y in W. Da bi bila krajšavno- razvezavna gesla v slovarju kar se le da ažurna, so bili v zaključni fazi priprave dela vključeni še vsi slovenski krajšavno-razvezavni pari, pridobljeni iz Gigafide. 130 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV Krajšavno-razvezavne pare smo pridobili tako, da smo ob pomoči informatika dr. Petra Holozana z algoritmom za samodejno prepoznavanje krajšav in krajšavnih razvezav filtrirali celotni korpus Gigafida. S filtracijo je bilo pridobljenih 26.000 krajšavno-razvezavnih parov, ki jih je bilo treba ročno pregledati, njihovo verodostojnost preveriti in vnesti v slovarsko zbirko. Med pridobljenimi krajšavno- razvezavnimi pari je bilo veliko lažnih, npr. lastna imena ali kratice brez celotne razvezave ipd. Prav tako so bili med krajšavno-razvezavnimi pari ponavljajoči se pari, ena razvezava se je lahko pojavila tudi več kot desetkrat. Razvezave so bile opremljene tudi s številko, ki stoji pred njimi in zaznamuje število pojavitev. Prav slednje utegne biti koristen podatek pri določitvi najnižje stopnje pojavitve, ki jo mora razvezava imeti, da se jo vključi v slovarsko zbirko. Pred končnim urejanjem dela je bilo treba ponovno premisliti koncept gesla, ki ga predstavimo v nadaljevanju. 9.1 Sestava gesla V nadaljevanju predstavimo sestavo gesla na primerih črke A. Ta je obsežna črka z več kot 1.500 razvezavami. V novi slovar krajšav so vključeni tako slovenski kot tuji krajšavno-razvezavni pari, pri čemer so vse tuje razvezave prevedene z uradnim prevodom, če slednji obstaja, v primeru, da uradnega prevoda ni, pa s pomensko jasnim prevodom. Vsi prevodi so preverjeni. Vzorčno geslo za primer krajšave A je vidno spodaj. Kot je razvidno iz primera krajšave A, je geslo urejeno abecedno, pri čemer damo prednost slovenskim razvezavam, saj slednje stojijo na začetku gesla in so abecedno urejene. Slovenskim razvezavam sledijo abecedno urejene tuje razvezave. Kot lahko vidimo iz vzorčnega gesla za krajšavo A, za vsako razvezavo stoji področni kvalifikator, tujim pred razvezavo dodamo še jezikovni kvalifikator. Skupno je bilo v delu uporabljenih okrog 70 kvalifikatorjev, ti zaznamujejo področje rabe razvezave in tuji jezik. Kvalifikatorji pojem umestijo v širši koncept rabe razvezave, npr. (šol., šp.), stojijo v oklepajih, in sicer tako pri slovenskih kot pri tujih razvezavah ter nastopijo za razvezavo. Pri nekaterih splošnih krajšavah, npr. leto, kvalifikatorjev ne navajamo, če spada razvezava v več področij, je uporabljenih več kvalifikatorjev, npr. masno število (fiz., kem.). Če ima razvezava dva možna zapisa krajšave, je to urejeno tako, da za razvezavo stoji podpičje ter beseda tudi, in sicer ne glede na to, ali je dvojnica prednostna, neprednostna, enakovredna in druga oblika zapisa, slednje je razvidno iz primera alt; tudi a (glas.) ◊ pevski glas. Tako so urejene tudi tuje krajšave, ki imajo dva primera zapisa krajšave, v takih primerih področni kvalifikator stoji za drugim zapisom krajšave, kot je razvidno iz primera angl.: academy; 9 Sestava novega slovarja krajšav 131 tudi Acad. (šol.). V slovarju so dosledno uporabljene tudi navzkrižne kazalke, saj vsak dodaten grafični zapis krajšave zahteva novo geslo, kot je pri pomenu alt razvidno pri geslih A in a. Iz vzorčnega slovarskega gesla za krajšavo A je razvidno, da so v geslu uporabljeni posebni znaki, in sicer znak ◊ stoji za razvezavo in kvalifikatorjem in zaznamuje dodatno razlago krajšave oz. razvezave, npr. pevski glas, igralna karta. Novi slovar krajšav ni razlagalni, a so kljub temu pri nekaterih razvezavah dodane razlage, npr. pri zgodovinskih pojmih, kot je Cona A. Ta znak se uporablja tudi pri tujih krajšavah, ko gre za neuradni prevod oz. slovenski opisni prevod tuje razvezave, npr. AA lat.: alopecia areata (med.) ◊ bolezensko izpadanje las. V geslu najdemo še dve oznaki; pri vseh tujih razvezavah znak ► zaznamuje vse tuje uradne prevode. Vsi prevodi so bili najdeni ob pomoči spletnih slovarjev in zbirk ter so bili ustrezno preverjeni. Znak ○ zaznamuje slovenske ustreznice krajšav pri tujih razvezavah. V primeru, da imamo za tujo razvezavo slovensko krajšavo, ki je različna od tuje krajšave, je slednje označeno z znakom ○, npr. leto ○ L., l., let. Kot nam to dokazuje primer, za označbo stojijo vse različice zapisa krajšave. A adenin (kem.) alpinist (šp.) A-durov akord (glas.) A-durova lestvica (glas.) alt; tudi a (glas.) ◊ pevski glas amper (elekt.) as (igr.) ◊ igralna karta Cona A (zgod.) ◊ del Slovenskega primorja in Istre s Trstom in okoliškimi kraji, ki je bilo po podpisu Pariške mirovne pogodbe eno od obeh območij (cona A in B) Svobodnega tržaškega ozemlja (STO) masno število (fiz., kem.) angl.: academy; tudi Acad. (šol.) ► akademija ○ akad. angl.: armament (voj.) ► oborožitev, vojna sila lat.: anno; tudi a., an. ► leto ○ L., l., let. Slika 42: Primer gesla za krajšavo A; Vir: avtorica. Če povzamemo ključne lastnosti gesla slovarja krajšav, lahko povemo, da je to sestavljeno iz preprostih in kompleksnih razvezav. Preproste razvezave so vse slovenske razvezave, ki so v imenovalniški strukturi in imajo področni kvalifikator, dodana jim je lahko tudi razlaga, ki stoji za razvezavo in kvalifikatorjem, razmejena je s posebnim znakom ◊, npr. alt; tudi a (glas.) ◊ pevski glas. Pri dodajanju razlag je uporabljen zgoščeni slog podajanja informacij in osnovni pomen krajšave, npr. as (igr.) ◊ igralna karta. Kompleksnejšo razlago najdemo pri razvezavah tipa Cona A, ki so vsekakor manj pogoste, gre namreč za primere z opisno razlago krajšave, npr. del Slovenskega primorja in Istre s Trstom in okoliškimi kraji, ki je bilo po podpisu Pariške mirovne 132 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV pogodbe eno od obeh območij (cona A in B) Svobodnega tržaškega ozemlja (STO), pri čemer opazimo tudi omembo cone B in uporabo krajšave STO ter razvezave Svobodno tržaško ozemlje. Taki primeri niso pogosti, dodatna razlaga pa vsekakor pripomore k razumevanju razvezave in krajšave. Vse tuje razvezave lahko kategoriziramo kot kompleksne, saj so sestavljene iz jezikovnega kvalifikatorja, ki je zapisan s krajšavo, npr. angl., za dvopičjem sledi tuja razvezava in v oklepaju kvalifikator ali tuja razvezava in za podpičjem ter besedo tudi še dodatni zapisi krajšave in v oklepaju kvalifikator. Za vsako tujo razvezavo stoji uradni prevod, ki je označen z znakom ►, če je prevod opisni, je označen z znakom ◊. V primeru, da ima tuja krajšava v slovenščini drugačno krajšavo od tuje, je to označeno z znakom ○, temu pa sledi še niz slovenskih krajšav, npr. angl.: academy; tudi Acad. (šol.) ► akademija ○ akad. a akceptirana, sprejeta (ekon.) ◊ na menicah alt; tudi A (glas.) ◊ pevski glas a-molov akord (glas.) a-molova lestvica (glas.) ar (mat.) ◊ enota za površino angl.: answer ► odgovor ○ odg. Slika 43: Primer gesla za krajšavo a; Vir: avtorica. Kot zanimivost omenimo, da v primerih, ko je slovenska razvezava zapisana s tujko, npr. pri krajšavi a v pomenu akceptirana, dodamo še slovensko ustreznico, in sicer sprejeta. Slovar krajšav, ki je že več let v pripravi, bo predstavljal prelomno delo, saj bomo po sedemdesetih letih v slovenskem prostoru deležni izdaje sodobnega slovarja krajšav, ki bo odražal čim bolj aktualno stanje krajšav v jeziku. Prednost slovarja je slovarski sestavek, ki poleg razvezave uporabniku ponudi še prevode vseh tujih krajšav ter področne in jezikovne kvalifikatorje. Gre za slovar, ki je nastajal več let, in sicer najprej ročno v preprostih preglednicah, sledila je uporaba programa Eva ter pridobivanje gradiva ob pomoči algoritma za samodejno prepoznavanje krajšav in krajšavnih razvezav, samodejna sestava slovarja krajšav in dokončna priprava novega sodobnega slovarja krajšav, ki je nastal ob dolgoletnem razumevanju in preučevanju krajšav v slovenskem prostoru. SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV M. Kompara 133 SKLEP Sinhrono-diahroni pregled krajšav v slovenskem prostoru in sestava slovarja krajšav je prvo delo, ki v slovenskem prostoru krajšavam, tem skupkom le nekaj črk, daje vso pozornost, ki je niso bile poprej deležne. Delo strne misli o nastanku krajšav in klasifikaciji ter diahrono in sinhrono oriše krajšave v slovenskem prostoru, in sicer v slovenskih pravopisih med letoma 1899 in 2001 ter izbranih jezikovnih priročnikih. Dotakne se položaja krajšav v splošnih in specializiranih slovarjih, in sicer SSKJ, SSKJ2 in eSSKJ, ter preveri položaj krajšav v angleških, italijanskih, nemških, španskih in francoskih splošnih ter krajšavnih slovarjih in predstavi mikro- ter makrostrukturo krajšavnih slovarjev. V delu so predstavljeni trije slovenski krajšavni slovarji (Župančič, 1948; Kompara, 2006 in Kompara, 2011) in četrti, ki je v pripravi. Ob razumevanju tipoloških značilnosti krajšav in položaja krajšav v stavku, in sicer z vidika kodnega preklopa ter rabe veznika in predloga pri tvorbi krajšav, opozorimo na potrebo po normiranju krajšav in omenimo projekt Krap, ki temelji na računalniškem algoritmu za sestavljanje krajšav in kratic v pravnem jeziku. Ker tak algoritem preprečuje dvoumnost krajšav in kratic v pravnem jeziku, bi ga bilo smiselno uporabiti tudi na drugih področjih, saj skozi delo bralca spomnimo na nekonsistentnost pri tvorbi krajšav. Teoretični del sklenemo s predstavitvijo algoritmov za samodejno prepoznavanje krajšav in krajšavnih razvezav v elektronskih besedilih in opozorimo na potrebo po sestavi primerljivega algoritma za slovenski jezik. 134 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV V empiričnem delu predstavimo raziskavo o gradnji algoritma za samodejno prepoznavanje krajšav v elektronskih besedilih. Raziskavo in gradnjo algoritma časovno razmejimo, in sicer na začetno in nadaljnjo stopnjo. Začetna stopnja temelji na osnovnih korakih, ki so potrebni za prepoznavanje krajšav, in sicer znakovne omejitve, raba veznika in predloga ter tipološke značilnosti krajšav. Sledi prepoznavanje krajšavnih razvezav iz sobesedila in sovpadanje. Po predstavitvi programa, v katerem je bil algoritem zapisan, sledi nadaljnja stopnja gradnje algoritma. Tu se ukvarjamo s pregledom delovanja algoritma, saj želimo preveriti, kako algoritem prepoznava krajšave v naključno zbranih besedilih. Opozorimo tudi na pomanjkljivosti ter potrebo po nadgradnji, ki jo predstavimo v drugi stopnji razvoja algoritma, kjer nadgradimo pravila, in sicer povečamo niz črk pri krajšavah kandidatkah in uporabimo štiri možne vzorce pojavitve krajšave in razvezave v besedilu. Po nadgradnji sledi filtriranje besedil petih letnikov dnevnika Delo (2005– 2009), in sicer gre za korpus, ki zajema 60 milijonov besed. Algoritem v 30 minutah izlušči 5.820 krajšavno-razvezavnih parov, značilnosti slednjih prikažemo v raziskavi in opozorimo na lažne krajšavno-razvezavne pare ter se dotaknemo univerzalnosti algoritma na primeru tujih jezikov. Po pridobljenih krajšavno-razvezavnih parih oz. gradivu za sestavo slovarja krajšav gremo korak dlje in predstavimo samodejno sestavljen Slovar krajšav (2011), ki je bil izdelan ob pomoči slovarske maske Termania in je prosto dostopen na portalu Termania. Izpostavimo nekaj ključnih korakov, ki so bili potrebni pri samodejni izdelavi slovarja, in sicer lematizacijo ter prepoznavanje jezika. Predstavimo slovarski sestavek za slovenska in tuja gesla ter opozorimo na izboljšave, ki so potrebne, da bo slovar v celoti samodejno sestavljen. Skozi delo opozarjamo na potrebo po sestavi slovenskega slovarja krajšav, ki bo primerljiv tujim in bo odražal stanje krajšav v slovenskem prostoru. Empirično raziskavo sklenemo s predstavitvijo slovarskega sestavka novega slovarja krajšav, ki je v nastajanju. Slovar temelji na dolgoletnih izkušnjah s krajšavami ter predhodno sestavljenima Slovarčkom krajšav (2006) in Slovarjem krajšav (2011). Gradivo za sestavo slovarja se je zbiralo več let, v zaključni fazi tudi s pomočjo algoritma za samodejno prepoznavanje krajšav in krajšavnih razvezav v elektronskih besedilih. S predstavitvijo slovarskih gesel sklenemo misli o problematiki sinhrono-diahronega položaja krajšav in sestave sodobnega informativno-normativnega dela – slovarja krajšav. SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV M. Kompara 135 LITERATURA Abbreviations and Acronyms (1999). New Lanark: Geddes and Grosset. Acronym Finder, [URL: http://www.acronymfinder.com/]. Acronyms, Initialisms and Abbreviations Dictionary, 2018, [URL: http://www.gale.cengage.com/pdf/samples/sp628573.pdf]. ADAM, [URL: http://128.248.65.210/arrowsmith_uic/adam.html]. Ahlin, M., idr., (2005). Slovar slovenskega knjižnega jezika z Odzadnjim slovarjem slovenskega knjižnega jezika in Besediščem slovenskega jezika z oblikoslovnimi podatki. [Elektronski vir]. Ljubljana: DZS. Arh, M., (2018). Položaj krajšav v izbranih slovenskih normativnih priročnikih od 1899 do danes. Magistrsko delo, Koper, Fakulteta za humanistične študije, Univerza na Primorskem. Atkins, S. B. T. and M. Rundell. (2008). The Oxford Guide to Practical Lexicography, Oxfrod, New York, Oxford University Press. Auer, P., Code-Switching in Conversation: Language, Interaction and Identity, 1998 [URL: https://books.google.si/books?hl=sl&lr=&id=DHk4- 1SX3tYC&oi=fnd&pg=PA1&dq=code+switching+papers&ots=VCV1MPyik7&si g=XITYPjxVw3eey4Bwon3QWsM4QPQ&redir_esc=y#v=onepage&q=code%20 switching%20papers&f=false]. Bajec, A. idr. (1962). Slovenski pravopis. Ljubljana: DZS. Barnhart, K. R., (1995). The Barnhart Abbreviations Dictionary. The Barnhart, [URL: http://eu.wiley.com/WileyCDA/WileyTitle/productCd-0471571466.html]. Bauer, L., (1983). English Word-Formation. Cambridge: Cambridge University Press. Bergenholtz, H., in S. Tarp, (1995). Manual of Specialised Lexicography: The Preparation of Specialised Dictionaries. Benjamins Translation Library, Vol. 12. Amsterdam in Philadelphia: John Benjamins Publishing. Brecelj, K. K. (2010). Mali italijansko-slovenski in slovensko-italijanski slovar. Ljubljana: DZS Breznik, A., (1920). Slovenski pravopis. Ljubljana: Jugoslovanska knjigarna. 136 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV Breznik, A. in F. Ramovš (1935) Slovenski pravopis, Ljubljana: Jugoslovanska knjigarna. Breznik, A., (1937). Slovenski pravopis. Ljubljana: Jugoslovanska knjigarna. Buttress, F. A., (1976). World Guide to Abbreviations of Organizations. London: L. Hill, Detroit: Gale Research Co. Byrd, R. J. in Park, Y. 2001. Hybrid TextMin-ing for Finding Abbreviations and Their Definitions. IMB Thomas J. Watson Research Center. 167-170. Chiari, I., (2007). Introduzione alla linguistica computazionale. Roma-Bari: Laterza. Convents, J., (1994). Council of the European Union, Abbreviations. Bruxelles, Luxembourg, Office des publications officialles des Communautés européennes. Corréard, M. H., (2007). The Oxford-Hachette French dictionary: French-English, English- French. Oxford : Oxford University Press. Crystal, D., (2002). The Cambridge Encyclopaedia of the English Language. 2. izdaja. Cambridge: Cambridge University Press. Dale, R. et al., (1999). Dictionary of Abbreviations and Acronyms. Hertfordshire: Wordsworth. Debenjak, B., (2001). Veliki nemško-slovenski slovar. Ljubljana: DZS. Debenjak, B., (2003). Veliki slovensko-nemški slovar. Ljubljana: DZS. De Sola, R., (1986). Abbreviations Dictionary. 7. izdaja. New York, Amsterdam, Oxford: Elsevier. De Schryver, G. M., (2009). Artificial Intelligence Meets e-Lexicography. E-LEX 2009, E- lexicography in the 21st century: New challenges, new opportunities. Louvain-la- Neuve, 22.–24. oktober 2009. DLE, Diccionario de la lengua Española 2017, [URL:http://dle.rae.es/?w=diccionario]. Doğan, R. I., Comeau, D. C., Yeganova, L. in Lana Wilbur, Finding abbreviations in biomedical literature: three BioC-compatible modules and four BioC-formatted corpora, 2014, [URL:https://academic.oup.com/database/article/doi/10.1093/database/bau044/ 2634328]. Drinovec, S. N., idr., (2008). Mali angleško-slovenski slovar in slovensko-angleški slovar. Ljubljana: DZS. Drinovec, S. N., idr., (2010). Priročni angleško-slovenski slovar in slovensko-angleški slovar. Ljubljana: DZS. Drosdowski, G., (1989). Deutsches Universal Wörterbuch. Mannheim: Duden Verlag. Dunning, T. (1994). Statistical Identification of Language. Technical Report MCCS 94-273. New Mexico State University, USA. ePRAVOPIS, 2017, [URL: http://www.fran.si/135/epravopis-slovenski-pravopis]. Evroterm, [URL: http://evroterm.gov.si/]. Fergusson, R., (2000). The New Penguin Dictionary of Abbreviations; from A to ZZ. London: Penguin. Gabrovšek, D., (1994). Kodifikacija angleškega jezika v specializiranih enojezičnih slovarjih: Too much of everything?. Vestnik 28: 1/2. 150–180. Gabrovšek, D., idr., (2005–2006). Veliki angleško-slovenski slovar Oxford, Ljubljana, DZS. Galende, J. C. (1997, 2001). Diccionario General de Abreviaturas Espanolas. Madrid: Editorial Verbum. Glass, M. R., Mahbub Chowdhury, M. F., in A. M. Gliozzo, Language Independent Acquisition of Abbreviations, 2017, [URL:https://arxiv.org/abs/1709.08074]. García Márquez, G. (2002). Clave: Diccionario de Uso del Español. Madrid: Ediciones Sm. Literatura 137 Gliha, Komac, N., 2015, Koncept Novega razlagalnega slovarja slovenskega knjižnega jezika [URL: http://www.fran.si/179/novi-slovar-slovenskega-knjiznega- jezika/datoteke/Koncept_NoviSSKJ.pdf]. Gigafida, [URL:http://www.gigafida.net/]. Google.si, [URL: http://www.google.si/]. Gložančev, A., (1998). Enobesedna imena slovenskih podjetij. Magistrsko delo. Ljubljana: Univerza v Ljubljani. Grad, A. in Leeming, H., (1997). Slovensko-angleški slovar. Ljubljana: DZS. Grad, A., (1998). Veliki angleško-slovenski slovar. Ljubljana: DZS. Grad, A., (2000). Slovensko-španski slovar. Ljubljana: DZS. Grad, A., (2001). Špansko-slovenski slovar. Ljubljana: DZS. Grad, A., (2004). Francosko-slovenski slovar. Ljubljana: DZS. Heid, U., (2009). Aspect of Lexical Description for electronic dictionaries. E-LEX 2009, E- lexicography in the 21st century: New challenges, new opportunities. Louvain-la- Neuve, 22.–24. oktober 2009. Humar, M., (1998). Pomenski opis v novejših slovenskih terminoloških slovarjih V: Keber, J., (ur.) Jezikoslovni zapiski, št. 4. 123–137. IATE, [URL:http://iate.europa.eu/]. Ilešič, T. in Perenič, G., (1994). Enopomenske kratice predpisov Republike Slovenije. Pravna praksa 10 – priloga. I – III (VIII). Jarnovič, U., (2000/2001). Krajšave v SP 2001. Slava 14: 1/2.34–44. Jesenik, V., (2005). Slovensko-francoski slovar. Ljubljana: DZS. Johnson, S., (1963). A Dictionary of the English Language New York: Pantheon Books. Jung, H. in Udo, O. H., (1991). The Dictionary of Acronyms and Abbreviations in Applied Linguistics and Language Learning, New York: Peter Lang Publishing Group. Jun Xu, Y. H., A Machine Learning Approach to Recognising Acronyms and Their Expansions, [URL: http://research.microsoft.com/en- us/people/junxu/acronymextraction-icmlc2005.pdf]. Klinar, S., in Davis, M., (2001). English word-formation with exercises. 5. izdaja. Ljubljana: Filozofska fakulteta, Oddelek za anglistiko in amerikanistiko. Knuth, D., (1979). Algorithms in Modern Mathematics and Computer Science . Springer- Verlag . Koblischke, H., (1983). Großes Abkürzungsbuch. Leipzig: VEB Bibliographisches Institu Leipzig. Koledar Mohorjeve družbe za prestopno leto 1948: Kratice (1947). Ljubljana: Mohorjeva družba. Kompara, M., (2011), Algoritem za samodejno prepoznavanje krajšav in krajšavnih razvezav v elektronskih besedilih: doktorska disertacija. Ljubljana: Filozofska fakulteta. Kompara, M., in P. Holozan, (2011), What is needed for automatic production of simple and complex dictionary entries in the first Slovene online dictionary of abbreviations using Termania website. Electronic lexicography in the 21st century [Elektronski vir] : new applications for new users : proceedings of eLex 2011, 10-12 November 2011, Bled, Slovenia.- Str. 140-146 Kompara, M., (2015). Raba veznikov in predlogov pri tvorbi kratic. Jezikoslovni zapiski : zbornik Inštituta za slovenski jezik Frana Ramovša ISSN: 0354-0448.- 21, št. 1 (2015), str. 51-62. Korošec, T., (1972). Pet minut za boljši jezik. Ljubljana: DZS. 138 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV Korošec, T., (1993). O krajšavah. XXIX.SSJLK. Ljubljana: Center za slovenščino kot tuji ali drugi jezik pri Oddelku za slovanske jezike in književnosti Filozofske fakultete. 15– 27. Kronseder, D., 2008, Wörterbuch Abkürzungen. Renningen: Garant Verlag GmbH. Kuo, C., Ling, M. H., Lin, K. in H., Chun-Nan, BIOADI: a machine learning approach to identifying abbreviations and definitions in biological literature 2009, [URL: https://bmcbioinformatics.biomedcentral.com/articles/10.1186/1471-2105- 10-S15-S7]. Lazar, B., (1994). O nastajanju slovarja slovenskega knjižnega jezika. Primorska srečanja. 18 št. 160. 539–541. Larkey, L. S. idr. 2000. Acrophile: An Automated Acronym Extractor and Server. Proceedings of the fifth ACM conference on Digital libraries. 205-214. Levec, F., (1899). Slovenski pravopis. Dunaj: Cesarska kraljeva zaloga šolskih knjig. Logar, N., (2003). Kratice in tvorjenke iz njih - aktualna poimenovalna možnost. V: Gajda, S. in Vidovič-Muha, A. (ur.) Współczesna polska i słoweńska sytuacja językowa. Ljubljana: Univerza v Ljubljani, Filozofska fakulteta. 131–149. Logar, B. N., (2005). Nove tehnologije in nekateri nesistemski besedotvorni postopki. Ljubljana: Center za slovenščino kot drugi/tuji jezik pri Oddelku za slovenistiko Filozofske fakultete. Malossini, A., (1999). Dizionario delle sigle e degli acronimi. Milano: Avallardi. Mattia, F. B., (1997). Elsevier's Dictionary of Acronyms, Initialisms, Abbreviations and Symbols. Amsterdam: Elsevier science B.V. MEDLINE, [URL: http://medline.cos.com/]. Michelizza, M., (2015): Spletna besedila in jezik na spletu: primer blogov in Wikipedije v slovenščini. Ljubljana: Založba ZRC, ZRC SAZU. Murith, J. in Bocabeille, J. M., (1992) Dictionnaire des Abreviations et Acronymes. Paris: TEC&DOC – Lavoisier. Myers-Scotton, C., (1993). Duelling Languages. Grammatical Structure in Codeswitching. New York: Oxford University Press. Newmark, P., (2000) [1998], Učbenik prevajanja. Prev. Gajgar Mateja. Ljubljana: Krtina. Paxton, J., (1983). Everyman's Dictionary of Abbreviations, London, J. M. Dent & Sons. Peng, J., Jing, C. L., Wang, P., in H. M. Sun, Identifying Abbreviations in Biological Literature Based on Reverse Text Alignment, 2015, [URL: https://link.springer.com/chapter/10.2991/978-94-6239-145-1_28]. Pravopisne kategorije – Problemski sklopi ePravopisa, 2018, [URL: http://www.fran.si/spt- kategorije?tab=Okrajsave]. Ramovš, F. idr. Slovenski pravopis (1950). Ljubljana: Založba ZRC. Reverse Acronyms Initialisms & Abbreviations Dictionary, [URL: http://www.gale.cengage.com/pdf/samples/sp628662.pdf]. Rigač, S., (2009). Mali hrvaško-slovenski in slovensko hrvaški slovar. Ljubljana: DZS. Righini, Enrico (2001). Dizionario di Sigle Abbreviazionie e Simboli. Bologna: Zanichelli. Robert, P., (1996). Le Nouveau Petit Robert. Paris, Dictionnaires le Robert. Rode, M., (1974). Poskus klasifikacije krajšav. Slavistična revija 22: 2. 213–219. Rundell, M., (2009). The Road to Automated Lexicography: First Banish the Drudgery...then the Drudges? E-LEX 2009, E-lexicography in the 21st century: New challenges, new opportunities. Louvain-la-Neuve, 22.–24. oktober 2009. Literatura 139 Schulz, S. in M. Keller, Code-Switching Ubique Est - Language Identification and Part-of- Speech Tagging for Historical Mixed Text, 2016, [URL: http://www.aclweb.org/anthology/W/W16/W16-21.pdf#page=55]. Schwartz, A. S. in Hearst, M. A. 2003. A simple algorithm for identifying abbreviation definitions in biomedical texts. Procedings of the Pacific Symposium on Biocomputing. 451-462. Sinclair, J., (1999) Collins COBUILD English dictionary. London: HarperCollins. Slovar krajšav, [URL: http://www.termania.net/slovarji/66/slovar-krajsav]. Slovarček krajšav, [URL: http://bos.zrc-sazu.si/kratice.html]. Slovar novejšega besedja slovenskega jezika, 2012, [URL: http://www.fran.si/131/snb- slovar-novejsega-besedja]. Slovar novejšega besedja, Zgradba slovarja, 2018, [URL: http://www.fran.si/131/snb-slovar-novejsega-besedja/datoteke/SNB_Zgradba.pdf]. Slovar slovenskega knjižnega jezika 2 (SSKJ2) (2014), [URL:http://www.fran.si/133/sskj2- slovar-slovenskega-knjiznega-jezika-2]. Slovar slovenskega knjižnega jezika (eSSKJ) (2016), [URL: http://www.fran.si/201/esskj- slovar-slovenskega-knjiznega-jezika]. Slovenski pravopis (2001). Ljubljana: Založba ZRC. Stanford Abbreviation Database, [URL: http://abbreviation.stanford.edu]. Steinhauer, A., (2005). Das Wörterbuch der Abkürzungen. Mannheim: Duden verlag. Šatev, V. in Nikolov, N., (2008). Using the Web as a Corpus for Extracting Abbreviations in the Serbian Language. V: Erjaveč, T. in Žganec, G. J. (ur.) Jezikovne tehnologije, Zbornik 11. mednarodne multikonference Informacijksa družba – IS 2008 Zvezek C. Ljubljana: Institut Jožef Stefan. 75–79. Šlenc, S., (1997). Veliki italijansko-slovenski slovar. Ljubljana: DZS. Šlenc, S., (2006). Veliki slovensko-italijanski slovar. Ljubljana: DZS. Taghva, K. in Gilbreth, J. 1998. Recognizing acronyms and their definitions. IJDAR I(IV). 191-198. Tavzes, M. idr. (2002). Veliki slovar tujk. Ljubljana: Cankarjeva založba. Termania, [URL: http://www.termania.net/]. The Free Dictionary, [URL: http://acronyms.thefreedictionary.com/]. Toporišič, J. (1992). Enciklopedija slovenskega jezika. Ljubljana: Cankarjeva založba. Toporišič, J. (1990). Slovenski pravopis I, pravila, Ljubljana: Založba DZS. Toti, D., Atzeni, P. in F., Polticelli, Automatic Protein Abbreviations Discovery and Resolution from Full-Text Scientific Papers: The PRAISED Framework, 2011, [URL: https://www.degruyter.com/view/j/bams.2012.8.issue-1/bams-2012-0002/bams-2012- 0002.xml]. Unified Medical Language System, [URL: http://umlsks.nlm.nih.gov]. Uradni list Republike Slovenije. št. 40/93 in 80/94 Vance, B., Dictionary of Abbreviations, 2011, [URL: http://www.oxfordreference.com/view/10.1093/acref/9780199698295.001.0001/ acref-9780199698295]. Zahariev, M. (2004). A (Acronyms), Doktorska disertacija, School of Computing Science, Simon Fraser University 140 SINHRONO-DIAHRONI PREGLED KRAJŠAV V SLOVENSKEM PROSTORU IN SESTAVA SLOVARJA KRAJŠAV Zhou, W. T. I. in Vetle, Smalheiser, R. N., (2006). ADAM: another database of abbreviations in MEDILINE, [URL: http://128.248.65.210/arrowsmith_uic/tutorial/zhou_bioinformatics_2006.pdf]. Zingarelli, N., (2000). Vocabolario della lingua italiana. Bologna: Zanichelli. Župančič, J., (1948). Kratice, Mala izdaja. Ljubljana: DZS. Yeates, S. 1999. Automatic extraction of acronyms from text. Procedings of the Third New Zealand Computer Science Research Students’ Conference. 117-124.