Organizacija znanja, 30 (1–2), 2025, 2530008, https://doi.org/10.3359/oz2530008 Znanstveni članek / Scientific article Predmetna obrada i izrada paremiološkog tezaurusa suvremenih hrvatskih poslovica Subject indexing and creation of the paremiological thesaurus of contemporary Croatian proverbs Borna Petrović 1 SAŽETAK: Cilj je ovoga rada bio predmetno obraditi korpus suvremenih hrvatskih poslovica terminima u denotativnom (doslovnom) i konotativnom (prenesenom) značenju te na temelju korištenih termina izraditi dvostruki tezaurus suvremenih hrvatskih poslovica koji će biti korišten za pretraživanje na Portalu hrvatskih poslovica. Uzorak istraživanja činio je korpus od 108 suvremenih hrvatskih poslovica preuzet iz upitnika nastalog u sklopu projekta određivanja hrvatskog paremiološkog minimuma i optimuma. Metodologija obrade poslovica podrazumijevala je dva dijela: predmetnu obradu poslovica i izradu dvostrukog tezaurusa. Predmetna se obrada temeljila na Lancasterovoj metodologiji, a odvijala se u sedam faza: denotativna analiza poslovica, traženje sinonima, kvazisinonima i srodnih termina denotativnim terminima uz njihovo popisivanje, konotativna analiza poslovica određivanjem očemnosti korpusnom analizom, dodavanje termina za predmetno označivanje u konotativnom značenju, traženje sinonima, kvazisinonima i srodnih termina u rječniku i jezičnim portalima te završna provjera konotativnog značenja korištenjem umjetne inteligencije uz ručnu provjeru dobivenih izvora. Izrada oba tezaurusa provedena je prema Shearerovoj metodologiji. Rezultati su pokazali da je poslovicama dodijeljeno ukupno 1074 termina, od kojih su 586 denotativni i 488 konotativni. Denotativni tezaurus sadrži 29 glavnih faseta i 380 podfaseta, a konotativni 23 fasete i 244 podfaseta. Originalnost ovog istraživanja leži u činjenici da je ovo prvi hrvatski paremiološki tezaurus i ujedno prvi tezaurus koji zasebno obrađuje građu prema denotativnom i konotativnom značenju. Praktična primjena ovih rezultata ogledat će se u implementaciji tezaurusa na Portal hrvatskih poslovica, čime će se, uz omogućavanje jednostavnijeg, preciznijeg i sveobuhvatnijeg pretraživanja, doprinijeti digitalizaciji i popularizaciji hrvatske paremiološke baštine u pedagoškom i znanstvenom smislu. KLJUČNE RIJEČI: Portal hrvatskih poslovica, poslovice, predmetna obrada, predmetno označivanje, tezaurus ABSTRACT: The aim of this paper was to subject-index a corpus of contemporary Croatian proverbs using denotative (literal) and connotative (figurative) terms, and to develop a dual thesaurus for searching on the Croatian Proverbs Portal. The research sample consisted of 108 proverbs collected as part of a project defining the Croatian paremiological minimum and optimum. The methodology included two main steps: subject processing of proverbs and creation of a dual thesaurus. Subject processing followed Lancaster’s methodology and consisted of seven phases: denotative analysis, identification of synonyms and related terms, connotative analysis by determining aboutness through corpus analysis, addition of connotative indexing terms, further synonym searches in a dictionary and language portals, and final verification of connotative meanings using artificial intelligence and manual review. Both thesauri were constructed according to Shearer’s methodology. The results showed that Ovaj rad nastao je na temelju metodologije i rezultata diplomskog rada autora. Diplomski rad obranjen je 11. srpnja 2025. godine pod mentorstvom izv. prof. dr. sc. Kristine Feldvari i sumentorstvom izv. prof. dr. sc. Melite Alekse Varge, a pohranjen je na institucijskom Repozitoriju Filozofskog fakulteta Sveučilišta Josipa Jurja Strossmayera u Osijeku (DABAR) na sljedećoj poveznici: https://urn.nsk.hr/urn:nbn:hr:142:488805. 1 Borna Petrović, mag. informatol. et mag. educ. philol. angl., Sveučilište Josipa Jurja Strossmayera u Osijeku, Filozofski fakultet, Odsjek za informacijske znanosti, bpetrovic@ffos.hr. Petrović, B.: Predmetna obrada i izrada paremiološkog tezaurusa suvremenih hrvatskih poslovica Organizacija znanja, 2025, 30 (1–2), 2530008 2 / 24 1,074 terms were assigned to the proverbs – 586 denotative and 488 connotative. The denotative thesaurus contains 29 main facets and 380 subfacets, while the connotative thesaurus includes 23 facets and 244 subfacets. The originality of this research lies in its presenting of the first Croatian paremiological thesaurus, also the first thesaurus to separately process denotative and connotative meanings. The practical outcome of this research will be the implementation of the thesaurus on the Croatian Proverbs Portal, enabling more precise and comprehensive searches, and contributing to the digitalization and popularization of Croatian paremiological heritage in educational and scientific contexts. KEYWORDS: Croatian Proverbs Portal, proverbs, subject processing, subject indexing, thesaurus 1 Uvod Ideja o izradi hrvatskog paremiološkog tezaurusa proizlazi iz činjenice kako hrvatski jezik, za razliku od drugih jezika kao što su engleski, bugarski, njemački i mađarski (usp. Wander, 1867- 1880; Mieder, Kingsbury i Harder, 1996; Litovkina, 2005; Stojkova, 2007; Doyle, Mieder i Shapiro, 2012), nema sveobuhvatnu zbirku poslovica koja bi odgovarala suvremenoj paremiologiji i paremiografiji i kako je većina hrvatskih poslovica dokumentirana u zbirkama iz 19. i 20. stoljeća (Grzybek et al., 1993; Aleksa Varga, 2023). Napori za stvaranjem takve suvremene zbirke, inovativnog digitalnog alata koji bi podupro zaštitu, pristup i pedagošku diseminaciju hrvatskih poslovica, ostvareni su kroz izradu Portala hrvatskih poslovica (Portal hrvatskih poslovica, 2025). Poslovice kao jezične cjeline nose dva značenja – denotativno (doslovno) i konotativno (preneseno), a njihova se predmetna obrada na Portalu vršila prema oba. Tako je dobivene termine bilo potrebno sustavno organizirati u cjelinu kakvu će korisnici Portala moći koristiti za lak pronalazak poslovica ne samo prema željenim terminima/konceptima u oba značenja, već i prema novima koje im možda nisu pale na pamet. Ovakvu vrstu pretraživanja omogućuje upravo dvostruki tezaurus poslovica u denotativnom i konotativnom značenju. Teorijske i metodološke implikacije izrade ovakvog tezaurusa postavile su Aleksa Varga i Feldvari (2022), a ostvarene su predmetnom obradom korpusa suvremenih hrvatskih poslovica kao prethodnim korakom izrade hrvatskog paremiološkog tezaurusa, što su ujedno i ciljevi ovog rada. 2 Predmetna obrada Predmetna obrada jedan je od temeljnih postupaka organizacije informacija na području knjižnične i informacijske znanosti čiji je primarni cilj što konkretniji opis teme, odnosno predmeta određenog dokumenta. Ovaj proces omogućuje raspoređivanje dokumenata prema njihovom sadržaju u fizičkim i digitalnim okruženjima, što je temelj za učinkovito dohvaćanje informacija u suvremenim informacijskim sustavima (Stipanov, 2007). Iako je postupak predmetnog označivanja opisan u brojnim pravilnicima, priručnicima, standardima i udžbenicima, kao i od strane brojnih autora, u kontekstu ovog rada držat ćemo se Lancastera (1998), koji ovaj postupak opisuje u dva koraka: konceptualnu/intelektualnu/predmetnu analizu, prilikom koje se određuje predmet dokumenta, odnosno njegova očemnost (engl. aboutness) i prijevod rezultata dobivenih konceptualnom analizom u konkretne termine za predmetno označivanje. Pojam očemnosti u kontekst je informacijskih znanosti prvi uveo Fairthorne (1969) razlikujući ekstenzijsku očemnost, odnosno sadržaj inherentan dokumentu koji je svojom prirodom neodvojiv od Petrović, B.: Predmetna obrada i izrada paremiološkog tezaurusa suvremenih hrvatskih poslovica Organizacija znanja, 2025, 30 (1–2), 2530008 3 / 24 njega, i intenzijsku očemnost, odnosno ono što se može zaključiti iz sadržaja dokumenta i ovisi o interpretaciji predmetnog stručnjaka i korisničkim potrebama. Prilikom predmetne obrade, svaki se predmetni stručnjak treba voditi trima pitanjima: Što je dokument?, O čemu je dokument? i Za koga je dokument? (Langridge, 1989). Opis sadržaja dokumenta omogućuju jezici za predmetno označivanje, odnosno predmetni jezici – dokumentacijski jezici koji omogućuju dosljedan pristup sadržaju dokumenta u katalogu, bibliografiji ili kazalu i koji se sastoje od kontroliranog rječnika i prikazuju odnose između termina u njemu (semantičke strukture), a mogu sadržavati i sintaktička pravila za slaganje pojmova u nizove (Kolbas, 2000). Prema Rowley i Farrowu (2017), predmetni se jezici dijele na kontrolirane i nekontrolirane, pri čemu kontrolirani jezici koriste termine iz kontroliranog rječnika, dok nekontrolirani preuzimaju termine izravno iz teksta dokumenta. Kontrolirani predmetni jezici se dijele na klasifikacijske (npr. klasifikacijske sheme) i abecedne (npr. tezaurusi i popisi predmetnih odrednica). Izrada predmetnih jezika oslanja se na tri jamstva koja osiguravaju legitimnost temelja samog rječnika: jamstvu predloška, jamstvu uporabe i jamstvu strukture. Jamstvo predloška podrazumijeva empirijski razvoj rječnika na osnovu dokumenata koji se opisuju i osigurava da se terminologija predmetnog jezika razvija na temelju stvarnih potreba korpusa koji se obrađuje, a ne na teoretskim pretpostavkama. Jamstvo uporabe uzima u obzir rječnik korisnika i potrebu prilagodbe predmetnog jezika terminima koje korisnici upotrebljavaju, čemu ide u prilog Cutterova izjava kako je uporaba vrhovni arbitrar, pritom se odnoseći na uporabu od strane korisnika, a ne predmetnih stručnjaka. Ovo jamstvo osigurava poboljšanu učinkovitost dohvaćanja informacija u sustavima. Naposljetku, jamstvo strukture opravdava uključivanje termina koji pružaju korisnu strukturalnu funkciju u predmetnom jeziku, omogućujući popunjavanje praznina u hijerarhiji ili okupljanje specifičnijih srodnih termina (Svenonius, 2000). Iako je uporaba jamstva prilikom izrade predmetnih rječnika vrlo korisna, ponekad se u ovom smislu susrećemo i s poteškoćama u definiranju domene rječnika, odnosno termina koje ćemo uključiti, a koje ne u rječnik. Naime, pojedine discipline, u prvom redu u društvenim i humanističkim znanostima, imaju razmjerno male tehničke rječnike te je predmet njihovog istraživanja često leksički neodređen, što za posljedicu ima nemogućnost jednostavnog izražavanja tog predmeta jednom riječju ili frazom. Najbolji je primjer ovog fenomena termin kultura koji, ovisno o predmetnom području, može imati brojna značenja, što nameće pitanje svrsishodnosti normativne kontrole ovakvog vokabulara (Svenonius, 2000). 3 Tezaurus Terminološki rječnik koji sadrži sustavno organizirano stručno nazivlje danog znanstvenog područja okosnica je svake znanstvene discipline. Povijesno gledano, pojam tezaurus potječe od latinskog thesaurus i grčkog θησαυρός (riznica, blago), a u suvremenom smislu prvi puta ga je u upotrebu uveo Peter Mark Roget 1852. godine objavom Tezaurusa engleskih riječi i fraza koji je postao temelj za taksonomske rječnike, čime se koncept tezaurus počinje širiti kao naziv za leksikografski priručnik organiziran po konceptima i značenjima. U knjižničnoj i informacijskoj znanosti (engl. Library and Information Science, LIS) ovaj se termin odnosi na kontrolirani rječnik koji služi terminološkoj kontroli, odnosno prevođenju prirodnog jezika iz dokumenta kojeg se opisuje, jezika predmetnog stručnjaka i korisnika na kontrolirani jezik za predmetno označivanje, i obrnuto (Nikolić-Hoyt, 1996; Reitz, 1996; ISO, 1986). Petrović, B.: Predmetna obrada i izrada paremiološkog tezaurusa suvremenih hrvatskih poslovica Organizacija znanja, 2025, 30 (1–2), 2530008 4 / 24 U kontekstu LIS-a i istraživanja provedenog u ovome radu, razlikujemo dvije vrste tezaurusa: tezauruse opće namjene (engl. General-Purpose Thesauri) i strukturirane tezauruse, odnosno tezauruse za dohvaćanje informacija (engl. Infomation Retrieval (IR) Thesauri). Tezaurusi opće namjene koriste se prije svega na području jezikoslovlja i uobičajeno se temelje na razini jednog leksema, čime su nepogodni za traženje i pretraživanje informacija, dok su IR tezaurusi strukturirani te uspostavljaju hijerarhiju i odnose između termina, čime olakšavaju dohvaćanje informacija (Aitchison et al., 2000). U ovome ćemo se radu baviti opisom i izradom IR tezaurusa. Tehnička dokumentacija koja prati razvoj i izradu tezaurusa vrlo je opširna, no u kontekstu ovoga rada ističemo standard ISO 2788:1986 – Smjernice za izradbu i razvoj jednojezičnih tezaurusa koji navodi kako učinkovitost predmetnog označivanja kao sredstva za identificiranje i pronalazak dokumenta ovisi o dobro složenom jeziku za predmetno označivanje, pri čemu se sastavljač takvog jezika suočava s tri glavne poteškoće: određivanjem predmeta dokumenta, odabirom termina koji primjereno sažimaju taj predmet i označavanjem odnosa između koncepata koje ti termini reprezentiraju (ISO, 1986). Konkretne korake izrade tezaurusa, koji će ujedno biti i uvršteni u metodologiju ovoga istraživanja, predlaže Shearer (2004), a oni su: 1. prikupljanje prirodnih riječi iz dokumenata koji će biti obuhvaćeni 2. spajanje sinonima i razrješenje homografije 3. stvaranje faseta okupljanjem deskriptora 4. slaganje faseta i podfaseta 5. dodavanje novih deskriptora radi popunjavanja značajnijih praznina 6. notacija 7. identificiranje veza između deskriptora među fasetama 8. stvaranje abecednog kazala i 9. stvaranje abecednog prikaza. Deskriptori, odnosno preferirani termini, jedni su od osnovnih gradivnih elemenata tezaurusa koji jedinstveno predstavljaju pojmove u kontroliranom rječniku. Odabir deskriptora temelji se na prethodno spomenuta tri jamstva: na jamstvu predloška empirijskim utemeljenjem deskriptora u analiziranoj građi, na jamstvu uporabe usklađivanjem termina korištenih kao deskriptora s rječnikom korisnika te na strukturnom jamstvu popunjavanjem hijerarhijskih praznina radi dosljedne organizacije. Uz to, deskriptori moraju biti jednoznačni, treba izbjegavati korištenje sinonimnih i dvostrukih termina kao deskriptora te, ukoliko je potrebno, mogu se koristiti napomene o uporabi i značenju termina (engl. scope note, SN) za razrješenje polisemije. Semantička mreža tezaurusa temelji se na tri vrste veza: hijerarhijski odnosi (općenitiji, širi termini – BT i specifičniji, uži termini – NT), odnosi ekvivalencije (uputnice s nepreferiranih na preferirane termine – USE i obratno – UF) i asocijativni odnosi (semantički/funkcionalno srodni termini izvan stroge hijerarhije – RT), što omogućuje dosljedno predmetno označivanje, a posljedično i intuitivno pretraživanje informacijskih sustava (Aitchison, Gilchrist i Bawden, 2000; Urbanija, 2005; ANSI i NISO, 2010). Tezaurus se uobičajeno prezentira kroz abecedni i hijerarhijski prikaz, uz moguće grafičke sheme i permutirano kazalo složenih termina. Također je potrebno definirati tipografiju, pravila uporabe velikih i malih slova, format prikaza i opseg metapodataka (definicije, Petrović, B.: Predmetna obrada i izrada paremiološkog tezaurusa suvremenih hrvatskih poslovica Organizacija znanja, 2025, 30 (1–2), 2530008 5 / 24 napomene o upotrebi, frekvencije pojavljivanja) ovisno o kategorijama korisnika (stručnjaci, predmetni stručnjaci, krajnji korisnici). Grafički prikazi pomažu u vizualizaciji strukture, a abecedna kazala olakšavaju brzo traženje termina (Urbanija, 2005; ANSI i NISO, 2010). 4 Metodologija 4.1 Ciljevi istraživanja Prvi cilj ovoga istraživanja bio je predmetno obraditi 108 suvremenih poslovica i njihovih varijantnih oblika prikupljenih u sklopu istraživanja Alekse Varge (2023), a koje se smatraju najčešće korištenim poslovicama prema Hrvatskom nacionalnom korpusu, Hrvatskoj jezičnoj riznici i korpusu hrWaC označavajući svaku pojedinu poslovicu ključnim riječima u denotativnom (doslovnom) i konotativnim (prenesenim) značenjima. Drugi, krajnji cilj ovoga istraživanja proizlazi iz prvoga, a to je iz termina koji su dobiveni predmetnom obradom izraditi deskriptore te pomoću njih, prateći metodologiju izrade tezaurusa, izraditi dvostruki tezaurus suvremenih hrvatskih poslovica u denotativnom (doslovnom) i konotativnom (prenesenom) značenju. Važno je naglasiti da cilj tezaurusa poslovica nije potpuna terminološka preciznost kao pri izradi znanstvenog tezaurusa, nego grupiranje poslovica po dominantnim temama i značenjima, kako bi korisnik lako pronašao srodne poslovice. Pritom su važniji iskustveni, emocionalni i narativni odnosi među pojmovima nego stroga semantička hijerarhija. Za razliku od tehničkih ili znanstvenih tezaurusa koji počivaju na preciznim definicijama i formalnim klasifikacijama, tezaurus poslovica temelji se na interpretaciji kulturnog i jezičnog značenja, pri čemu naglasak nije na jednoznačnosti termina, već na njihovoj sposobnosti povezivanja poslovica u zajedničke tematske cjeline. 4.2 Metodologija predmetnog označivanja i izrade tezaurusa S obzirom na dvojaki cilj ovoga istraživanja, metodologija se također može razložiti na dva dijela. 4.2.1 Predmetno označivanje suvremenih poslovica: postupci i metode Prvi korak predmetnog označivanja suvremenih poslovica bila je predmetna obrada poslovice u denotativnom (doslovnom) značenju, pri čemu se denotativna (doslovna) analiza odvijala tako da su se leksički elementi poslovice interpretirali, odnosno preuzimali de visu 2 . Tako su, primjerice, za poslovicu Tko rano rani, dvije sreće grabi odabrani termini ranjenje, sreća i grabljenje, pri čemu se, za potrebe pretraživanja Portala, slijedilo pravilo prebacivanja svih imenica u nominativ jednine, svih pridjeva u imenice u nominativu jednine i svih glagola u glagolske imenice, također u nominativu jednine. Od ovog se pravila odstupa iznimno, u slučajevima kada bi tako tvorene riječi bile prosječnom korisniku nejasne ili kada bi tvoreni oblik graničio s negramatičnim, odnosno kada bi deskriptor bio nepretraživ i neupotrebljiv. Drugi korak podrazumijevao je pregledavanje Šarić-Wittscheninog Rječnika sinonima hrvatskoga jezika (Šarić i Wittschen, 2008) kako bi se utvrdile istoznačnice i bliskoznačnice dobivenih termina, ali i mrežnih jezičnih baza ukoliko određena riječ nije jasna. U tu su svrhu 2 Denotacija je „dogovoreno doslovno, svjesno i relativno stabilno značenje znaka” (Institut za hrvatski jezik i jezikoslovlje, 2025a). Kako denotativno značenje predstavlja osnovno, doslovno značenje riječi neovisno o kontekstu, odnosno ono što većina govornika pod tim izrazom podrazumijeva bez dodatnih tematskih/predmetnih asocijacija, kod denotativnog (doslovnog) značenja poslovice radi se samo doslovna analiza prisutnih ključnih riječi u samoj poslovici (Olimovna i Ibodullayevna, 2025). Petrović, B.: Predmetna obrada i izrada paremiološkog tezaurusa suvremenih hrvatskih poslovica Organizacija znanja, 2025, 30 (1–2), 2530008 6 / 24 korišteni portali Kontekst.io (Kontekst.io, 2025), Hrvatski jezični portal (Hrvatski jezični portal, n. d.), korpusne baze (Hrvatska jezična riznica, Hrvatski nacionalni korpus, Hrvatski mrežni korpus hrWaC te korpusi MaCoCu i ClassSla) putem sustava Sketch Engine (Sketch Engine, 2025), portal Struna (Institut za hrvatski jezik i jezikoslovlje, 2025a) te Kolokacijska baza hrvatskoga jezika (Institut za hrvatski jezik i jezikoslovlje, 2025b). Primarni je izvor za određivanje sinonima i kvazisinonima bio Šarić-Wittschenin Rječnik sinonima hrvatskoga jezika s obzirom na to da je on prvi hrvatski leksikografski rječnik sinonima. On je trenutno i jedini hrvatski rječnik svoje vrste, upravo iz razloga što u hrvatskom jezikoslovlju nije postignuto suglasje oko toga što se sve podrazumijeva pod pojmom sinonima (Opašić, 2010). Pri odabiru sinonima i kvazisinonima iz Rječnika se uzimala u obzir samo prva kategorija sinonima, odnosno ona semantički najbliža terminu koji se obrađuje 3 . Iako su termini iz prve kategorije semantički bliski terminima koji se predmetno obrađuju, nisu svi sinonimi jednako prikladni u svim kontekstima poslovica. Iako sinonimija, kao što je već navedeno, može podrazumijevati zamjenjivost u svim kontekstima, u praksi je ta zamjenjivost često ograničena. Stoga su odabrani oni sinonimi koji se mogu najprirodnije uklopiti u značenje poslovice koja se predmetno obrađuje. Također, neki termini iz prve kategorije, iako bliski terminu koji se obrađuje, mogu imati dodatna značenja ili asocijacije koje bi mogle dovesti do nejasnoća 4 . Termini iz druge i treće, odnosno ostalih razina razmatrali su se kao potencijalni srodni termini. Uz to, portal Kontekst.io također je korišten kao izvor za određivanje srodnih termina jer pomoću statističke sličnosti u kontekstu predlaže riječi koje se često pojavljuju u sličnim kontekstima, no ne nužno sa sličnim značenjem. Ovakvim uvidom u kontekstualnu sličnost termina, a ne njihovu značenjsku istovjetnost, pogodan je izvor za određivanje srodnih termina. U nastavku se donosi primjer traženja sinonima, kvazisinonima i srodnih termina za termin sreća u Šarić-Wittscheninom Rječniku sinonima hrvatskoga jezika i na portalu Kontekst.io. Tako ćemo, primjerice, pomoću Rječnika sinonima povezati termine zadovoljstvo i ushit kao sinonime i kvazisinonime te blagostanje kao srodan termin (Slika 1.), a pomoću portala Kontekst.io na termin sreća povezati termin ugoda kao srodan termin (Slika 2.). 3 U Rječniku pod Napomenama o strukturi rječnika i uputama za upotrebu pod odjeljkom Poredak sinonima u sinonimnim nizovima stoji kako „[s]inonimi u sinonimnim nizovima nisu poredani abecedno. U određivanju poretka nastojala se uzimati u obzir značenjska bliskost s natuknicom: riječi značenjski bliže natuknici načelno su smještene prije riječi značenjski udaljenijih od nje.“ (Šarić i Wittschen, 2008) 4 Primjerice, kod poslovice Tko rano rani, dvije sreće grabi, za termina sreća u denotativnom značenju, prema Šarić-Wittscheninom (2008) Rječniku određeni su sljedeći sinonimi prve kategorije: zadovoljstvo, smirenost, duševni mir/sklad, sklad, blaženstvo, ushit i zanos. Sinonimi iz prve kategorije poput smirenost, duševni mir/sklad, sklad, blaženstvo i zanos nose konotacije koje nisu u potpunosti kompatibilne s praktičnim (svakodnevnim) značenjem termina sreća u ovoj poslovici. Primjerice, smirenost i duševni mir više upućuju na pasivno, statično stanje, dok ova poslovica govori o aktivnom postizanju nagrade. Blaženstvo i zanos često imaju religiozne i filozofske konotacije. Stoga su kao najprirodniji sinonimni/kvazisinonimni termini za termin sreća u ovom kontekstu odabrani zadovoljstvo i ushit. Petrović, B.: Predmetna obrada i izrada paremiološkog tezaurusa suvremenih hrvatskih poslovica Organizacija znanja, 2025, 30 (1–2), 2530008 7 / 24 Slika 1: Potencijalni sinonimi, kvazisinonimi i srodni termini za termin „sreća“ u Šarić-Wittscheninom Rječniku sinonima hrvatskoga jezika (izvor: Šarić i Wittschen, 2008) Slika 2: Potencijalni sinonimi, kvazisinonimi i srodni termini za termin „sreća“ na portalu Kontekst.io (izvor: Kontekst.io, 2025) Treći korak podrazumijevao je završnu predmetnu obradu za denotativno (doslovno) značenje, pri čemu su se popisivali svi odabrani termini iz poslovica te svi sinonimi, kvazisinonimi i srodni termini koji su pronađeni u navedenim rječnicima, portalima, bazama i korpusima. Primjerice, za termin sreća popis bi izgledao kako slijedi: sreća (sinonimi/kvazisinonimi: zadovoljstvo, ushit; srodni termini: blagostanje, ugoda). U četvrtom se koraku kreće s konotativnom analizom poslovica koja se temelji na Lancasterovoj metodi predmetnog označivanja, a podrazumijeva dva koraka: intelektualnu ili konceptualnu analizu, prilikom koje se određuje predmet (očemnost) poslovice i prijevod Petrović, B.: Predmetna obrada i izrada paremiološkog tezaurusa suvremenih hrvatskih poslovica Organizacija znanja, 2025, 30 (1–2), 2530008 8 / 24 rezultata dobivenih konceptualnom analizom u konkretne termine za predmetno označivanje (Lancaster, 1998). U ovom se koraku najprije konzultiraju korpusne baze, gdje se iz konteksta u kojima se određena poslovica koristi zaključuje koje je njezino značenje, odnosno očemnost. U nastavku se donose rezultati korpusne analize na primjeru korpusnih baza hrWaC i MaCoCu za poslovicu Tko rano rani, dvije sreće grabi. Tako, primjerice, vidimo da se prema korpusu hrWaC na portalu kako.hr (8. rezultat) ova poslovica koristi u kontekstu vježbanja, gdje se ističe da oni koji rano ustaju i vježbaju ujutro ostvaruju dvostruku korist – ne samo da su fizički aktivni, već i dan započinju energično i s osjećajem postignuća (Slika 3.). U korpusu MaCoCu vidimo kako se ova poslovica koristi na portalu 24sata.hr u kontekstu kupovine obuće na sniženju (9. rezultat). Poslovica ovdje prenosi poruku kako oni koji djeluju pravovremeno, odnosno koji prvi reagiraju na sniženja i kupuju unaprijed, uspijevaju kupiti željene proizvode po povoljnijoj cijeni. Također, u istom korpusu vidimo da se ova poslovica koristi na portalu stilistika.org (16. rezultat), gdje se dodatno uspoređuje s poslovicom U radiše svega biše, u štediše još i više., koja dodatno ističe vrijednost marljivosti i upornog rada kao put do većeg uspjeha i blagostanja. Obje poslovice zajedno šalju poruku kako proaktivnost, trud i disciplina donose višestruke prednosti u svakodnevnom životu (Slika 4.). Tako smo za navedenu poslovicu odredili da joj je konotativno (preneseno) značenje vezano uz važnost ranog ustajanja, odnosno započinjanja nekog posla što je ranije moguće kako bi se postigli optimalni rezultati. Slika 3: Korpusna analiza poslovice „Tko rano rani, dvije sreće grabi“ u korpusu hrWaC (izvor: Sketch Engine, 2025) Slika 4: Korpusna analiza poslovice „Tko rano rani, dvije sreće grabi“ u korpusu MaCoCu (izvor: Sketch Engine, 2025) Petrović, B.: Predmetna obrada i izrada paremiološkog tezaurusa suvremenih hrvatskih poslovica Organizacija znanja, 2025, 30 (1–2), 2530008 9 / 24 Nakon što se iz korpusnih baza preko konteksta zaključilo koja bi mogla biti očemnost poslovice, kreće se na peti korak, odnosno drugi korak predmetnog označivanja – dodavanje termina za predmetno označivanje u konotativnom (prenesenom) značenju. U ovom bi slučaju za navedenu poslovicu Tko rano rani, dvije sreće grabi to bili termini ustrajnost i revnost. Šesti korak podrazumijeva pretraživanje odabranih termina u spomenutom Rječniku sinonima i mrežnim jezičnim bazama kako bi se dobilo što više potencijalnih sinonima, kvazisinonima i srodnih termina po kojima bi korisnik mogao tražiti određenu poslovicu. Ovdje se vodi jamstvom uporabe i obogaćivanja ulaznog korisničkog rječnika sa svrhom olakšavanja pretraživanja korisnicima prema nedeskriptorima. U nastavku se donosi primjer traženja sinonima, kvazisinonima i srodnih termina za termin ustrajnost u Šarić-Wittscheninom Rječniku sinonima hrvatskoga jezika i na portalu Kontekst.io. Tako ćemo, primjerice, na termin ustrajnost pomoću Rječnika sinonima povezati termine izdržljivost i postojanost kao sinonime i kvazisinonime 5 (Slika 5.), a pomoću portala Kontekst.io povezat ćemo srodne termine strpljivost i marljivost, koji su ujedno jedni od posljednjih termina (odnosno semantički najudaljenijih od termina ustrajnost) u Rječniku sinonima (Slika 6.). Dakle, za poslovicu Tko rano rani, dvije sreće grabi za termine za predmetno označivanje na temelju Rječnika sinonima i portala Kontekst.io odabrani su sljedeći termini: ustrajnost (sinonimi/kvazisinonimi: izdržljivost, postojanost; srodni termini: strpljivost, marljivost i revnost. Slika 5: Potencijalni sinonimi, kvazisinonimi i srodni termini za termin „ustrajnost“ u Šarić- Wittscheninom Rječniku sinonima hrvatskoga jezika (izvor: Šarić i Wittschen, 2008) Slika 6: Potencijalni sinonimi, kvazisinonimi i srodni termini za termin „ustrajnost“ na portalu Kontekst.io (izvor: Kontekst.io, 2025) 5 Pojedine rječničke natuknice nemaju kategorije sinonima, već se samo nudi nenumerirani popis. U takvim su se slučajevima kao sinonimi i kvazisinonimi preferirali termini koji su najizravnije semantički povezani s terminom koji se obrađuje, tako da se slijedio prethodno obrazloženi Poredak sinonima u sinonimnim nizovima. Petrović, B.: Predmetna obrada i izrada paremiološkog tezaurusa suvremenih hrvatskih poslovica Organizacija znanja, 2025, 30 (1–2), 2530008 10 / 24 Sedmi i završni korak podrazumijeva korištenje alata umjetne inteligencije, odnosno velikih jezičnih modela kao pomoć pri dodatnoj provjeri konotativnog (prenesenog) značenja poslovice, pri čemu su odabrani modeli GPT-4.5, Sonar i Claude 3.7 (koji su dio Perplexityja) 6 . U nastavku slijedi primjer odgovora Perplexityja na upit Molim te, reci mi koje je konotativno, odnosno preneseno značenje poslovice Tko rano rani, dvije sreće grabi te navedi sve izvore koje si koristio za pisanje odgovora. Nakon što Perplexity ponudi odgovor, na temelju pročitanog teksta potvrđuje se kako se konotativno (preneseno) značenje ove poslovice odnosi na vrijednost marljivosti, discipline i proaktivnosti, naglašavajući kako rano ustajanje i pravovremeno djelovanje povećavaju izglede za uspjeh, sreću i ostvarenje životnih ciljeva (Slika 7.). Nakon potvrde konotativnog (prenesenog) značenja poslovice, tekst odgovora Perplexityja predmetno se obrađuje tako da se izdvajaju termini u konotativnom (prenesenom) značenju. Potom se do tada izdvojenim terminima dodaju novi sinonimi/kvazisinonimi/srodni termini, ukoliko bi se isti pojavili tijekom predmetne obrade odgovora Perplexityja. Tako ćemo, primjerice, na osnovu dolje navedenog odgovora (Slika 7.) za ovu poslovicu terminima ustrajnost (sinonimi/kvazisinonimi: izdržljivost, postojanost; srodni termini: strpljivost, marljivost) i revnost dodati i srodne termine redovitost, proaktivnost i disciplina. Tako ćemo ukupno za poslovicu Tko rano rani, dvije sreće grabi imati 9 termina: ustrajnost (sinonimi/kvazisinonimi: izdržljivost, postojanost; srodni termini: disciplina, redovitost, strpljivost, marljivost) i revnost (srodni termin: proaktivnost). 6 Navedeni su modeli dio Perplexityja, alata umjetne inteligencije čija je komercijalna inačica besplatno dostupna studentima za korištenje u osobne i istraživačke svrhe (Perplexity, 2025). Standardizirani prompt, Molim te, reci mi koje je konotativno, odnosno preneseno značenje poslovice [poslovica] te navedi sve izvore koje si koristio za pisanje odgovora, oblikovan je prema načelima koja su postavili Chen, Zhang, Langrené i Zhu (Chen i sur., 2025) te su u svakom promptu izričito traženi izvori iz kojih proizlaze odgovori, a isti su dodatno provjereni. Petrović, B.: Predmetna obrada i izrada paremiološkog tezaurusa suvremenih hrvatskih poslovica Organizacija znanja, 2025, 30 (1–2), 2530008 11 / 24 Slika 7: Primjer konotativne analize poslovice „Tko rano rani, dvije sreće grabi“ u Perplexityju (izvor: Perplexity, 2025) Petrović, B.: Predmetna obrada i izrada paremiološkog tezaurusa suvremenih hrvatskih poslovica Organizacija znanja, 2025, 30 (1–2), 2530008 12 / 24 Grafički bi koraci predmetne obrade suvremenih poslovica izgledali kako slijedi (Slika 8.): Slika 8: Grafički prikaz toka predmetne obrade suvremenih poslovica (izvor: autor) Provedbom navedenih koraka kod svih 108 poslovica i njihovih varijantnih oblika dobiven je popis termina (zajedno s njihovim sinonimnim, kvazisinonimnim i srodnim oblicima) za svaku poslovicu u denotativnom i konotativnom značenju. 4.2.2 Izrada dvostrukog tezaurusa suvremenih poslovica: postupci i metode Nakon stvaranja popisa termina za denotativno i konotativno značenje svake poslovice, pristupilo se izradi dvostrukog tezaurusa suvremenih poslovica. Prvi tezaurus sadržava deskriptore u denotativnom značenju, a drugi sadržava deskriptore u konotativnom značenju. Izrada tezaurusa uvelike se temeljila na Shearerovoj metodologiji izrade tezaurusa (Shearer, 2004), dok su se prilikom izrade poštivala sva tri jamstva vezana uz domenu rječnika: jamstvo predloška, strukturno jamstvo i korisničko jamstvo. Poštivanje jamstva predloška očituje se kroz odabir termina za predmetno označivanje, a posebice deskriptora u denotativnom (doslovnom) značenju, iz dokumenata koji se obrađuju, u ovom slučaju iz poslovica. Tako se, primjerice, u tezaurusu mogu pronaći termini granuće, grehota i povaljivanje koji se, iako nisu dijelom svakodnevnog hrvatskog leksika, nalaze kao termini u tezaurusu jer su to riječi koje se koriste u poslovicama. Nadalje, poštivanje jamstva uporabe očituje se kroz korištenje sinonima, kvazisinonima i srodnih termina koji se nalaze na mrežnom portalu Kontekst.io, gdje Petrović, B.: Predmetna obrada i izrada paremiološkog tezaurusa suvremenih hrvatskih poslovica Organizacija znanja, 2025, 30 (1–2), 2530008 13 / 24 je vidljiva i sličnost njihova korištenja u kontekstu i učestalost, čime se osigurava da će korisnici moći pretraživati prema terminima koji su u skladu sa svakodnevnim rječnikom. Tako je, primjerice deskriptoru odsutnost dodan sinonim odsustvo, koji uz sličnost od 72 % ima indeks učestalosti od 2,25, a terminu iskorištavanje dodan je sinonim korištenje, koji uz sličnost od 69 % ima indeks učestalosti od čak 76,1. Naposljetku, jamstvo strukture očituje se kroz uključivanje termina koji nužno ne poštuju jamstva predloška ili uporabe, no imaju svrhu popunjavanja praznina u tezaurusu ili okupljanja specifičnih srodnih termina. Tako su, primjerice, oblikovane glavne fasete tezaurusa, pri čemu su nakon okupljanja deskriptora stvoreni novi termini koji su označavali čitavu fasetu, primjerice, faseta Promjena stanja i kretanje ili faseta Sukob, borba i nametanje i slično. Metodologija korištena pri izradi oba tezaurusa podrazumijevala je: 1. prikupljanje prirodnih riječi koje označavaju denotativno i konotativno značenje poslovica 2. spajanje sinonima, kvazisinonima i srodnih termina 3. stvaranje faseta okupljanjem deskriptora 4. slaganje faseta i podfaseta 5. dodavanje novih deskriptora radi popunjavanja značajnijih praznina 6. notacija 7. identificiranje veza između deskriptora među fasetama 8. stvaranje abecednog kazala i 9. stvaranje abecednog prikaza (Shearer, 2004). Prvi korak, prikupljanje prirodnih riječi koje označavaju denotativno i konotativno značenje poslovica već je obavljen predmetnim označivanjem poslovica. U drugom su koraku svi sinonimi i kvazisinonimi odabranih termina povezani tako da se odredio jedan deskriptor, a svi njegovi drugi oblici postali su nepreferirani termini (nedeskriptori). S obzirom da je u literaturi jedan od koraka i razrješavanje homografije, a da na našem uzorku nisu zamijećeni slučajevi homografije, istu nije bilo potrebno razrješavati. U trećem koraku okupljeni su deskriptori koji označavaju pojmove iste vrste (npr. grana, grm, stablo, lan, jabuka i sl.) tako da se skupovima od više takvih pojmova dodjeljuju nazivi koji čine grupu, odnosno fasetu (npr. biljni svijet). Za potrebe izrade ovog tezaurusa, izrađivala se samo jedna razina podfaseta. U četvrtom su se koraku izrađene fasete i podfasete složile kako bi tezaurusi dobili strukturu (Slika 9.): Slika 9: Primjer izrađenih faseta i podfaseta u tezaurusu (izvor: autor) Petrović, B.: Predmetna obrada i izrada paremiološkog tezaurusa suvremenih hrvatskih poslovica Organizacija znanja, 2025, 30 (1–2), 2530008 14 / 24 U petom koraku su se, po uočavanju praznina, a u skladu sa strukturnim jamstvom, u dobivenom popisu deskriptora stvarali novi, pri čemu se držalo pravila kako oni trebaju biti jednoznačni te se izbjegavalo korištenje kvazisinonima ili polisema kao deskriptora. Tako je u sljedećem primjeru stvoren novi deskriptor, nadređeni termin ekonomija, kako bi se u jednu fasetu mogli okupiti deskriptori bogatstvo, boljitak, dobit, financije, korist, održivost i profit (Slika 10.): Slika 10: Primjer izrade novog deskriptora ekonomija u službi nadređenog termina (izvor: autor) Šesti korak podrazumijevao je olakšavanje pronalaska deskriptora korisnicima preinakom dobivenog poretka deskriptora u standardnu notaciju (širi termin, engl. Broader Term, BT; uži termin, engl. Narrower Term, NT; srodni termin engl. Relater Term, RT; USE (eng. use) – uporabi: izabrani deskriptor za sinonim ili kvazisinonim; uputa za sinonim-sinonim; UF (eng. use for) – uporabi za: sinonim, kvazisinonim; uputa za deskriptor). Primjerice, za prethodno navedeni primjer preinaka poretka izgledala bi kako slijedi (Slika 11.): Slika 11: Preinačeni poredak deskriptora iz prethodnog primjera u standardnu notaciju (izvor: autor) Sedmi korak podrazumijevao je identificiranje veza između deskriptora među fasetama i izrađivanje unakrsnih uputnica između srodnih deskriptora u različitim fasetama. U nastavku slijedi primjer takvih uputnica za termine kruh (faseta hrana i prehrana) i želudac (faseta ljudsko tijelo i zdravlje) u tezaurusu termina u denotativnom značenju (Slika 12.): Petrović, B.: Predmetna obrada i izrada paremiološkog tezaurusa suvremenih hrvatskih poslovica Organizacija znanja, 2025, 30 (1–2), 2530008 15 / 24 Slika 12: Primjer unakrsnih uputnica između termina kruh i želudac (izvor: autor) Osmi korak podrazumijevao je stvaranje abecednog kazala kojim će korisnik moći olakšano pretraživati termine iz tezaurusa u abecednom poretku koristeći prethodno spomenute USE uputnice, primjerice, ako korisnik traži termin crnina, kraj istoga će stajati uputnica uporabi (USE), odnosno da se u tezaurusu kao preferirani, odobreni termin koristi termin crno; ili ako korisnik traži termin cura, kraj istoga će također stajati uputnica uporabi (USE), odnosno da se u tezaurusu kao preferirani, odobreni termin koristi termin djevojka. Primjerice, za slovo C u abecednom kazalu tezaurusa termina u denotativnom značenju, navedeno bi izgledalo kako slijedi (Slika 13.): Slika 13: Primjer slova C u abecednom kazalu (izvor: autor) Deveti i posljednji korak podrazumijevao je stvaranje abecednog prikaza samog tezaurusa. Primjerice, za fasetu ekonomija u tezaurusu termina u konotativnom značenju to bi izgledalo kako slijedi (Slika 14.): Slika 14: Primjer fasete ekonomija u abecednom prikazu (izvor: autor) Petrović, B.: Predmetna obrada i izrada paremiološkog tezaurusa suvremenih hrvatskih poslovica Organizacija znanja, 2025, 30 (1–2), 2530008 16 / 24 Predmetna obrada 108 suvremenih poslovica i izrada tezaurusa odvijala se od siječnja do svibnja 2025. godine 4.3 Uzorak Postupak odabira poslovica uključenih u ovo istraživanje započeo je projektom određivanja hrvatskog paremiološkog minimuma i optimuma 7 (2014. – 2018.), u sklopu kojega su provedena dva istraživanja 2014. i 2018. godine sa standardiziranim upitnikom poznavanja hrvatskih poslovica. S obzirom na to da je, kao što je već navedeno, većina hrvatskih poslovica dokumentirana u zbirkama iz 19. i 20. stoljeća (odnosno od 1846. do 1987. godine, a za razliku od nekih drugih jezika u kojima postoje već paremiološke zbirke ili rječnici poslovica), u istraživanju se nije moglo osloniti na metodološki opravdan izvor u vidu rječnika poslovica, već na vlastiti korpus autorice Alekse Varge koji je nastao prikupljanjem poslovica u razdoblju trajanja projekta i potvrđivanjem frekvencije njihovog korištenja u Hrvatskom nacionalnom korpusu, Hrvatskoj jezičnoj riznici i hrWaC korpusu. Tako je najprije sastavljen popis od 239 poslovica, koji je sužen na 207 oblika koji se pojavljuju u navedenim korpusima. Kako u trenutku istraživanja nije bio određen hrvatski paremiološki minimum i optimum, odnosno frekvencije korištenja i poznavanja poslovica među općom populacijom, pri odabiru poslovica oslanjalo se na prethodno spomenutu korpusnu analizu i frekvencije pojavljivanja poslovica u hrvatskim korpusima i mrežnim stranicama. Podvrgavanjem ovog popisa pilot-istraživanju na 21 lingvistu, popis je smanjen na 105 8 najčešćih hrvatskih poslovica poredanih po frekvenciji pojavljivanja, pri čemu su poslovice podijeljene u tri kategorije zastupljenosti: od najzastupljenijih (1-35), preko manje zastupljenih (36-70) do najmanje zastupljenih (71-105) (Aleksa Varga, 2023). 5 Rezultati 9 5.1 Suvremene poslovice: rezultati predmetne obrade Predmetnom obradom navedenim poslovicama dodijeljeno je ukupno 1723 termina, od toga 859 u denotativnom (doslovnom) značenju, od kojih su 188 sinonimi i kvazisinonimi, a 864 u konotativnom (prenesenom) značenju, od kojih su 231 sinonimi i kvazisinonim (za popis termina po poslovici i način njihove statističke obrade vidi Prilog 1 u Repozitoriju). Iz Tablice 1 vidljivo je kako su najčešće u denotativnom (doslovnom) značenju pojavljuju termini bivanje i čovjek (pojavljuju se 8 puta) te kuća i dva (pojavljuju se 6 puta), odnosno radi se o vrlo niskoj 7 Paremiološki je minimum skup najvažnijih, najčešće korištenih i najpoznatijih poslovica određenog jezika, a koje su potrebne za osnovno razumijevanje i sudjelovanje u usmenim i pisanim komunikacijskim situacijama. U praksi, to je popis poslovica koje bi svaki korisnik jezika trebao poznavati kako bi mogao učinkovito komunicirati i razumjeti kulturološke reference u korištenom jeziku. Paremiološki je optimum širi pojam i predstavlja skup različitih paremioloških minimuma, odnosno najpoznatijih i najkorištenijih poslovica potrebnih za poučavanje jezika kao materinjeg ili stranog te za kulturološku pismenost prosječno obrazovane osobe (Aleksa Varga i Hrisztova-Gotthard, 2019). 8 Na popisu korištenom za potrebe ovog diplomskog rada navedeno je 108 poslovičkih oblika s pripadajućim varijantnim oblicima. Autorica istraživanja i voditeljica projekta navodi kako se na proširenom popisu, uz poslovice, nalaze također dvije izreke i jedna ponovljena poslovica. 9 U rezultatima će se deskriptivno i na odabranim primjerima prikazati termini korišteni za predmetnu obradu suvremenih poslovica i fasete tezaurusa. Tablica s cjelovitim popisom dodijeljenih termina i klasifikacijskih oznaka po poslovici, oba tezaurusa i pripadajućim abecednim kazalima dostupni su na institucijskom Repozitoriju Filozofskog fakulteta Sveučilišta Josipa Jurja Strossmayera u Osijeku (DABAR) na sljedećoj poveznici: https://urn.nsk.hr/urn:nbn:hr:142:488805. Petrović, B.: Predmetna obrada i izrada paremiološkog tezaurusa suvremenih hrvatskih poslovica Organizacija znanja, 2025, 30 (1–2), 2530008 17 / 24 frekvenciji riječi. Ove su riječi uglavnom konkretne i vezane uz opipljive pojmove (novčić, ovan, škuda, hleb, kozlić i slično). Iz Tablice 2 vidljivo je kako termini u konotativnom (prenesenom) značenju pokazuju višu maksimalnu frekvenciju (termin ishod se pojavljuje 12 puta; oprez, pobjeda, postignuće i postizanje pojavljuju se 9 puta), ali i znatno veći broj pojmova s nižim frekvencijama (n = 4; n= 3) u odnosu na denotativne termine. Ove su riječi apstraktnije te pokrivaju širi raspon značenja (efikasnost, poticaj, pouzdanje, pouzdanost, rezultat i slično). Tablica 1: Frekvencije dodijeljenih ključnih riječi u denotativnom (doslovnom) značenju (izvor: autor) 10 Termin (denotativno značenje) frekvencija (n) bivanje, čovjek 8 kuća, dva 6 dan, dobronamjernost, dobrota, dobroćudnost, imanje 5 dolazak, duša, miš, novčić, ovan, pad, rađanje, stizanje, vođenje, škuda 4 djelovanje, dom, duljina, dužina, gladovanje, govorenje, hleb, hranjenje, htjenje, jarić, kamen, kozlić, kraj, kruh, kučina, mišljenje, muka, novac, nošenje, ovca, padanje, pamet, para, patnja, pravljenje, rad, radost, rođenje, ruka, san, tri, voda, zlo, ćud, 3 Tablica 2: Frekvencije dodijeljenih termina u konotativnom (prenesenom) značenju (izvor: autor) 11 Termin (konotativno značenje) frekvencija (n) ishod 12 oprez, pobjeda, postignuće, postizanje 9 uspjeh 8 korist, ponašanje, sigurnost 7 efikasnost, poticaj, pouzdanje, pouzdanost, rezultat, strpljenje 6 inicijativa, ljubav, odgovornost, poduzimanje, popustljivost, rad, savjesnost, snošljivost, svojta, tolerancija, uzvraćanje 5 akcija, aspiracija, cilj, djelovanje, dobrobit, izbjegavanje, izmjena, karakter, karakteristike, konflikt, konkurencija, mir, namjera, neprijateljstvo, održivost, prevencija, promjena, reciprocitet, roditelj, samodostatnost, svađa, svrha, utjecaj, vrijeme 4 domaćinstvo, harmonija, iskustvo, izgled, jednakost, kauzalnost, mudrost, napor, nepouzdanost, nepromišljenost, nerealnost, obitelj, odluka, opasnost, opstojnost, optimizam, osobitost, podrška, pokvarenost, posljedica, potpora, potvrda, pragmatičnost, praksa, problem, prolaznost, promišljenost, razboritost, realizacija, rizik, rutina, samostalnost, sličnost, sposobnost, sreća, sukob, suradnja, uzročnost, vanjština, vrijednost 3 5.2 Suvremene poslovice: tezaurusi u denotativnom (doslovnom) i konotativnom (prenesenom) značenju Što se tiče rezultata vezanih za drugi dio istraživanja, izrađeni tezaurus suvremenih poslovica u denotativnom (doslovnom) značenju sadrži 29 glavnih faseta i 380 podfaseta. Ukupno je evidentirao 409 deskriptora i 177 sinonima i kvazisinonima koji su označeni odnosom 10 U tablici su prikazane sve frekvencije veće od 2. 11 Idem. Petrović, B.: Predmetna obrada i izrada paremiološkog tezaurusa suvremenih hrvatskih poslovica Organizacija znanja, 2025, 30 (1–2), 2530008 18 / 24 ekvivalencije i uputnicom UF s nedeskriptora na deskriptor. Budući da je tezaurus izrađen s jednom razinom faseta, 29 glavnih faseta predstavljaju i 29 nadređenih termina (BT 12 ), dok je podređenih termina (NT) 380. Srodnih termina ima ukupno 31 par, odnosno 62 RT oznake. U nastavku se donosi primjer nekoliko faseta (faseta osjećaji i faseta hrana i prehrana) tezaurusa u denotativnom značenju, dok se cijeli tezaurus denotativnih značenja nalazi u Prilogu 2.1. na Repozitoriju (Slika 15.): Slika 15: Fasete osjećaji i hrana i prehrana tezaurusa u denotativnom značenju (izvor: autor) Izrađeni tezaurus suvremenih poslovica u konotativnom (prenesenom) značenju sadrži 23 glavne fasete i 244 podfasete, s ukupno 267 deskriptora i 216 sinonima i kvazisinonima (uputnica UF s nedeskriptora na deskriptor). Također je izrađena samo jedna razina faseta, stoga 23 glavne fasete predstavljaju 23 nadređena termina (BT), dok podređenih termina (NT) ima 244. Srodnih termina ima 27 parova, odnosno 54 RT oznake. U nastavku se donosi primjer nekoliko faseta (faseta rizik i posljedice, faseta komunikacija i faseta mudrost) tezaurusa u konotativnom značenju, dok se cjeloviti tezaurus konotativnih značenja nalazi u Prilogu 3.1. na Repozitoriju (Slika 16.): Slika 16: Fasete rizik i posljedice, komunikacija i mudrost tezaurusa u konotativnom značenju (izvor: autor) 12 Notacija za nadređene termine (BT) nije stavljana u tezaurus jer su glavne kategorije podebljane (engl. bold). Petrović, B.: Predmetna obrada i izrada paremiološkog tezaurusa suvremenih hrvatskih poslovica Organizacija znanja, 2025, 30 (1–2), 2530008 19 / 24 Naposljetku, nakon predmetne obrade poslovica i izrade tezaurusa suvremenih poslovica u denotativnom i konotativnom značenju, donosimo primjer njihove buduće funkcionalnosti na Portalu hrvatskih poslovica. Tako će, primjerice, korisnik koji u tražilicu upiše termin oprez (jer želi dobiti sve poslovice koje govore, odnosno čija je tema oprez) biti upućen (UF) na to da pretraži termin sigurnost jer je on preferirani termin. Tada će mu se prikazati faseta sigurnost (Slika 16.): Slika 16: Faseta sigurnost koja će korisniku biti prikazana u mrežnom sučelju nakon pretrage po terminu oprez i uputnici sigurnost (izvor: autor) gdje će vidjeti kako su za termin sigurnost uži termini (NT) nesigurnost, opstojnost, povoljnost i zaštita. Uz to što i podređeni termini imaju uputnice s neusvojenih oblika (UF), neki od njih imaju i srodne termine (RT) koji se nalaze u drugim fasetama. Na taj način će moći proširiti svoje pretraživanje dodatnim terminima koji mu možda prije uvida u tezaurus ne bi pali na pamet. Ukoliko korisnika, primjerice, budu zanimale sve poslovice koje u konotativnom (prenesenom) značenju govore o sigurnosti, odabirom tog termina prikazat će mu se sve poslovice (i njihovi varijantni oblici, ovdje navedeni unutar zagrada) koje su označene deskriptorom sigurnost (Slika 17.): Slika 17: Prikaz poslovica i njihovih varijantnih oblika označenih deskriptorom sigurnost u mrežnom sučelju (izvor: autor) Petrović, B.: Predmetna obrada i izrada paremiološkog tezaurusa suvremenih hrvatskih poslovica Organizacija znanja, 2025, 30 (1–2), 2530008 20 / 24 Ovakav način pretraživanja omogućuje korisnicima da brzo i učinkovito pretražuju i pronađu predmetne/tematske skupove poslovica koje odgovaraju njihovoj informacijskoj potrebi, uključujući i njihove varijantne oblike. 6 Zaključna rasprava Rezultati ovog istraživanja potvrđuju važnost teorijskih pretpostavki organizacije informacija, predmetne obrade i izrade tezaurusa te ih nadopunjuju konkretnom primjenom na korpusu suvremenih hrvatskih poslovica. Istraživanje se oslanja na temeljna načela organizacije informacija, pri čemu je predmetna obrada poslovica modificiranim Lancasterovim (1998) postupkom predmetnog označivanja pokazala kako i minimalne tekstualne jedinice, kao što su poslovice, mogu biti sustavno i višeslojno analizirane, što je u skladu s pristupima iz literature koji naglašavaju važnost konceptualne analize i rječničke kontrole. Korištenje prilagođenog Lancasterovog (1998) modela predmetnog označivanja, uz konzultaciju rječnika, korpusnih baza, mrežnih jezikoslovnih portala i umjetne inteligencije kao sredstva dodatne provjere potvrdilo je važnost uporabe kontroliranih rječnika za predmetno označivanje, odnosno rječničke kontrole, u skladu s međunarodnim standardom Z39.19 (ANSI i NISO, 2010), čime je postignuta dosljednost i preciznost u dodjeli i organizaciji termina. Međutim, važno je naglasiti da cilj izrade tezaurusa poslovica nije postizanje terminološke preciznosti kakva je karakteristična za znanstvene tezauruse. Umjesto toga, tezaurus poslovica usmjeren je na grupiranje poslovica prema dominantnim temama/predmetima i značenjima kako bi korisnik mogao što lakše pronaći srodne poslovice. Stoga, iako je u ovome radu postignuta određena dosljednost i preciznost u dodjeli termina korištenjem kontroliranih rječnika, naglasak i dalje ostaje na interpretaciji kulturnog i jezičnog značenja te na sposobnosti termina da povezuju poslovice u zajedničke tematske cjeline, što je neophodno za razumijevanje apstraktne i kulturno specifične građe kao što su poslovice. Primjena Shearerove (2004) metodologije izrade tezaurusa pri izradi dvostrukog tezaurusa ishodovala je strukturiranim i preglednim kontroliranim rječnicima u denotativnom (doslovnom) i konotativnom (prenesenom) značenju, koji će korisnicima Portala hrvatskih poslovica omogućiti pretraživanje prema različitim varijacijama apstrakcije i značenja, što je u skladu s teorijskim implikacijama koje navodi Svenonius (2000). Dodatnu vrijednost ovakvog tezaurusa čini upravo uspostavljanje odnosa srodnosti među deskriptorima koje opisuje Urbanija (2005), koji su od velikog značaja ne samo za predmetno označivanje, već i za samu obradu informacijskih zahtjeva korisnika. Takvi odnosi vode predmetnog stručnjaka i/ili korisnika kroz tezaurus upozoravajući ga na sve pojmove bliske traženom terminu i otvarajući mogućnost otkrivanja termina koje možda nije planirao koristiti, ali koji mogu biti relevantni za predmetnu obradu ili pretraživanje. U izradi tezaurusa na području LIS-a posebno je važno prepoznati da pojedini termini, poput kultura, mogu imati višestruka značenja ovisno o kontekstu primjene. Za razliku od znanstvenih tezaurusa, gdje se, kako navodi Svenonius (2000), termini nastoje definirati što univerzalnije i kontekstualno neovisno, ovaj tezaurus namjerno uključuje kontekstualno ovisne termine kako bi bolje odgovarao stvarnim potrebama korisnika i specifičnostima građe. Na primjer, termin kultura može u svakodnevnom označavati sveukupnost idejne, djelatne i materijalne organizacije načina života koja služi kao sredstvo prilagodbe okolini i osiguranja opstanka pojedinca i zajednice (Institut za hrvatski jezik i jezikoslovlje, 2025a), dok će u biologiji Petrović, B.: Predmetna obrada i izrada paremiološkog tezaurusa suvremenih hrvatskih poslovica Organizacija znanja, 2025, 30 (1–2), 2530008 21 / 24 značiti proces uzgoja stanica, tkiva ili mikroorganizama u kontroliranim laboratorijskim uvjetima, izvan njihovog prirodnog okoliša (Biology Online Dictionary, 2021). Ovakav pristup omogućuje preciznije pretraživanje, ali i razumijevanje informacija, pri čemu ističe i razlike normativne kontrole vokabulara u humanističkim i društvenim znanostima, gdje je značenje često određeno širim društvenim i kulturnim kontekstom (Svenonius, 2000). Poštivanjem jamstava predloška, uporabe i strukture pri izradi tezaurusa omogućeno je uključivanje relevantnih i strukturno nužnih termina, ali i onih svakodnevnih, korisnicima važnih, čime je u tezaurusima naglašen element praktične i svakodnevne upotrebljivosti te se potvrđuje važnost smjernica o nužnosti prilagodbe predmetnih jezika korisničkim potrebama i analiziranoj građi koje navodi Svenonius (2000). Međutim, unatoč brojnim prednostima ovakvog paremiološkog tezaurusa kao znanstvenog, istraživačkog i heurističkog alata, treba istaknuti ograničenja pri njegovoj izradi. Prvo ograničenje leži u činjenici kako je prilikom odabira sinonima i kvazisinonima za termine u denotativnom i konotativnom značenju bilo moguće na metodološki opravdan način osloniti se samo na Šarić-Wittschenin Rječnik sinonima hrvatskoga jezika s obzirom na to da je u trenutku provođenja ovog istraživanja to bio jedini rječnik svoje vrste na hrvatskom govornom području (Opašić, 2010). Ovakvo ograničenje izvora sinonima i kvazisinonima može bitno utjecati na razinu raznolikosti i sveobuhvatnosti paremiološkog tezaurusa. Budući da je leksička raznolikost hrvatskog jezika bogata i često regionalno uvjetovana, oslanjanjem na jedan rječnik potencijalno sužavamo opseg izraza koji bi mogli biti relevantni za paremiološku analizu, odnosno ograničavamo mogućnost uočavanja nijansi u značenju i uporabi pojedinih termina, pogotovo u konotativnom značenju gdje su semantičke razlike često suptilne i kontekstualno ovisne. Slijedom navedenog, nije moguće uputiti da se buduća istraživanja provode s više leksikografskih izvora. Međutim, daljnji razvoj hrvatske leksikografije, posebice u vidu izrade novih i specijaliziranih rječnika sinonima, bio bi od iznimne važnosti za daljnja istraživanja i projekte ove vrste. Drugo ograničenje svakako je subjektivnost predmetnog označivanja, prije svega prilikom određivanja očemnosti. Iako je za potrebe istraživanja korištena standardizirana Lancasterova metodologija predmetnog označivanja, svaki je njezin korak neminovno obilježen autorovom subjektivnom interpretacijom značenja. U kontekstu ovog istraživanja, ovaj je postupak tim više subjektivan jer se provodila predmetna obrada poslovica, koje su kulturno specifična i kontekstualno ovisna građa. Zbog toga je interpretacija značenja poslovice zahtijevala korištenje kombinacije različitih korpusnih baza i umjetne inteligencije, pri čemu je svaki alat otvorio mogućnost novih, različitih tumačenja, osobito u slučajevima gdje su se u poslovicama nalazili višeznačni izrazi, što dodatno potvrđuje neizbježnost subjektivnosti pri analizi ovakve vrste građe. S obzirom na to da se praktična dimenzija ovog rada ogleda u integraciji tezaurusa na Portal hrvatskih poslovica, koji je namijenjen istraživačima na području jezikoslovlja, ali i onima u informacijskim znanostima te u obrazovne svrhe na svim razinama obrazovanja, u obzir je trebalo uzimati i rječnike korisnika iz svih navedenih skupina te na tragu toga oblikovati termine kontroliranog rječnika – kako bi što veći broj korisnika mogao pronaći poslovice prema vlastitom rječniku. Ovakav metodološki pristup predmetnoj obradi i izradi tezaurusa kakvoga su postavile Aleksa Varga i Feldvari (2022) uvelike doprinosi pedagoškoj i znanstvenoj, ali i općedruštvenoj popularizaciji hrvatske paremiološke baštine. Izrađeni dvostruki tezaurus predstavlja značajan Petrović, B.: Predmetna obrada i izrada paremiološkog tezaurusa suvremenih hrvatskih poslovica Organizacija znanja, 2025, 30 (1–2), 2530008 22 / 24 doprinos digitalizaciji i popularizaciji hrvatske paremiološke baštine, pritom omogućujući preciznije pretraživanje, bolje razumijevanje i širu dostupnost poslovica u digitalnom okruženju. Uz to, ovakav pristup obradi paremiološke građe nudi i implikacije za daljnja istraživanja i projekte na području informacijskih znanosti, kulturne baštine i jezikoslovlja, primjerice, predmetne obrade i izrade tezaurusa hrvatskih poslovica od 12. do 19. stoljeća. Reference Aitchison, J., Gilchrist, A. i Bawden, D., 2000. Thesaurus construction and use: a practical manual. 4. izd. London: Aslib. Aleksa Varga, M. i Hrisztova-Gotthardt, H., 2019. Towards a Croatian paremiological minimum/optimum: a work in progress. U: Jukić, S., Macan, Ž., Visinko, K., Vodopija- Krstanović, I. i Zubčić, S., ur. Frazeologija, učenje i poučavanje: zbornik radova s Međunarodne znanstvene konferencije održane od 19. do 21. travnja 2018. godine u Rijeci. Rijeka: Sveučilište u Rijeci, Filozofski fakultet. Str. 11-23. Aleksa Varga, M. i Feldvari, K., 2022. Constructing the digital proverbial thesaurus: theoretical and methodological implications. U: Corpas Pastor, G. i Mitkov, R., ur. Computational and Corpus-Based Phraseology: 4th International Conference, Europhras 2022: Malaga, Spain, 28-30 September, 2022: Proceedings. Cham: Springer. Str. 1-15. Aleksa Varga, M., 2023. Inačice hrvatskih poslovica. U: Mikić Čolić, A. i Glušac, M., ur. Standardni i nestandardni idiomi: zbornik radova s međunarodnoga znanstvenog skupa Hrvatskog društva za primijenjenu lingivstiku održanoga od 9. do 11. lipnja 2022. u Osijeku. Zagreb: Hrvatsko društvo za primijenjenu lingvistiku. Str. 171-185. American National Standards Institute (ANSI) i National Information Standards Organization (NISO), 2010. Guidelines for the construction, format, and management of monolingual controlled vocabularies. (ANSI/NISO standard Z39.19-2005 (R2010)). Baltimore, MD: National Information Standards Organization. Dostupno na: https://doi.org./10.3789/ansi.niso.z39.19-2005R2010 [25. 2. 2025.] Biology Online Dictionary, 2021. BiologyOnline. Dostupno na: https://biologyonline.com/dictionary/ [10. 6. 2025.] Chen, B., Zhang, Z., Langrené, N. i Zhu, S., 2025. Unleashing the potential of prompt engineering for large language models. Patterns 6(6), 101260. Dostupno na: https://doi.org/10.1016/j.patter.2025.101260 [1. 6. 2025.] Doyle, C. C., Mieder, W. i Shapiro, F. R. (ur.), 2012. The Dictionary of modern proverbs. New Haven, CT: Yale University Press. Fairthorne, R., 1969. Content analysis, specification, and control. Annual Review of Information Science and Technology, 4, str. 73-109. Grzybek, P., Škara, D. and Heyken, Z. 1993. Der Weisheit der Gasse auf der Spur. – Eine empirische Pilotstudie zur Bekanntheit kroatischer Sprichwörter. Zeitschrift für Balkanologie, 29(2), str. 85–98. Petrović, B.: Predmetna obrada i izrada paremiološkog tezaurusa suvremenih hrvatskih poslovica Organizacija znanja, 2025, 30 (1–2), 2530008 23 / 24 Hrvatski jezični portal, n. d. Hrvatski jezični portal. Dostupno na: https://hjp.znanje.hr/ [25. 2. 2025.] Institut za hrvatski jezik i jezikoslovlje, 2025a. Struna: Hrvatsko strukovno nazivlje. Dostupno na: http://struna.ihjj.hr/ [25. 2. 2025.] Institut za hrvatski jezik i jezikoslovlje, 2025b. Kolokacijska baza hrvatskoga jezika. Dostupno na: http://ihjj.hr/kolokacije/ [25. 2. 2025.] International Organisation for Standardisation (ISO), 1985. Methods for examining documents, determining their subjects, and selecting indexing terms (ISO standard br. 5963:1985). Geneva: International Organization for Standardization. International Organisation for Standardisation (ISO), 1986. Guidelines for the establishment and development of monolingual thesauri. 2. izd. (ISO standard br. 2788:1986). Geneva: International Organization for Standardization. Kolbas, I., 2000. Načela izrade jezika za predmetno označivanje. Suvremena lingvistika 25(1- 2), str. 153-167. Dostupno na: https://hrcak.srce.hr/22633 [25. 2. 2025.] Kontekst.io, 2025. Kontekst.io. Dostupno na: https://kontekst.io/hrvatski [25. 2. 2025.] Lancaster, F. W., 1998. Indexing and abstracting in theory and practice. Illinois: University of Illinois. Langridge, D. W., 1989. Subject analysis: principles and procedures. London: Bowker-Saur. Litovkina, A., 2005. Magyar közmondástár. Budapest: Tinta Kiadó. Mieder, W., Kingsbury, S. A. i Harder, K. B. (ur.), 1996. A dictionary of american proverbs. New York, NY: Oxford University Press. Nikolić-Hoyt, A., 1996. U potrazi za boljom riječi. Suvremena lingvistika 22(41/42), str. 483- 488. Dostupno na: https://hrcak.srce.hr/file/38499 [25. 2. 2025.] Olimovna, N. F. i Ibodullayevna, H. K., 2025. The role of denotation and connotation in communication. Journal of Scientific Research, Modern Views and Innovations 1(3), str. 210- 211. Dostupno na: https://spaceknowladge.com/index.php/JOISRMVI/article/view/943 [13. 6. 2025.] Opašić, M., 2010. Hrabar, odvažan, izazovan... pothvat Ljiljane Šarić i Wiebke Wittschen. Fluminensia 22(2), str. 175-180. Dostupno na: https://hrcak.srce.hr/file/98039 [25. 2. 2025.] Perplexity, 2025. Perplexity. Dostupno na: https://www.perplexity.ai/ [25. 2. 2025.] Portal hrvatskih poslovica, 2025. Portal hrvatskih poslovica. Dostupno na: https://poslovice.ffos.hr/ [10. 6. 2025.] Reitz, J.M., 1996. Thesaurus, Online dictionary for library and information science (ODLIS). Dostupno na: https://odlis.abc-clio.com/odlis_t.html [25. 2. 2025.] Rowley, J. i Farrow, J., 2017. Organizing knowledge: an introduction to managing access to information. 3. izd. London: New York: Routledge. Petrović, B.: Predmetna obrada i izrada paremiološkog tezaurusa suvremenih hrvatskih poslovica Organizacija znanja, 2025, 30 (1–2), 2530008 24 / 24 Shearer, J. R., 2004. A practical exercise in building a thesaurus. U: Roe, S. K. i Thomas, A. R., ur. The thesaurus: review, renaissance, and revision. Binghamton: Haworth International Press. Sketch Engine, 2025. Sketch engine. Dostupno na: https://www.sketchengine.eu/ [25. 2. 2025.] Stipanov, J., 1998. Hrvatski knjižnični sustav i predmetna obrada. U: Lasić-Lazić, J., Leščić, J. i Petric, J., ur. Predmetna obradba – ishodišta i smjernice: zbornik radova. Zagreb: Hrvatsko knjižničarsko društvo. Str. 33-42. Stojkova, S., 2007. Bǎlgarski poslovici i pogovorki. Sofija: Izdatelstvo Kolibri. Svenonius, E., 2009. The intellectual foundation of information organization. Cambridge, MA: MIT Press. Šarić, Lj., i Wittschen, W., 2008. Rječnik sinonima hrvatskoga jezika. Zagreb: Naklada Jesenski i Turk. Urbanija, J. 2005. Metodologija izrade tezaurusa. Zagreb: Naklada Nediljko Dominović. Wander, K. F. W.,1867-1880. Deutsches Sprichwörter-Lexikon: Ein Hausschatz für das deutsche Volk (5 sv.). Leipzig: Brockhaus.