Strokovne razprave o podatku, informaciji in znanju Tomai Mohorič Fakulteta za računalništvo in informatiko, Univerza v Ljubljani tofnazm@fri.unMj,si Povzetek izraza podatek in informacija se pogosto uporabljata kot sinonima, Čeprav obstaja meči njima precejšnja pomenska razlika. Podobno se zadnje čase dogaja tudi z izrazom znanje, ki se ponekod uporablja v pomenu podatek. Namen prispevka je razčistiti pomenske razlike med omenjenimi izrazi. V prvem delu je poglobljeno predstavljen način človekovega dojemanja, razumevanja in predstavljanja sveta, v drugem delu pa so podane nekatere standardne definicije podatka, informacije in znanja. Afasfraci The terms data and information are often used as a synonyms in spite of quite a big semantic difference between them. Similar destiny shares the term knowledge, which is often used in place of term data. The intention of this article is to advocate tfiat each term mentioned has its own meaning. First, the human way of making perceptions, conceptions, and representations is thoroughly described, followed by some standard definitions of data, information, and knowledge. Uvod Izraza podatek in informacija se v vsakodnevnem življenju pogosto Uporabljata kot sinonima. Tudi na računalniškem področju med njima ni vedno potegnjene stroge ločnice. Do prekrivanja pomenov prihaja očividno zaradi enačenja procesov v človekovi glavi s procesi v računalniku. Tako govorimo o računalniški obdelavi puiiatkoi>, pa tudi o računalniški obdelavi ali procesiranju informacij. Marsikje lahko tudi preberemo, da se, na primer, vsebina tabele z numeričnimi podatki pri preslikavi-v graf spremeni v informacijo. Podobno je z znanjem. Kaj imajo ljudje v svojih glavah, kadar vedo nekaj? Ali lahko znanje izrazimo z besedami? Kako lahko nekdo zna stvari, ki jih je lažje narediti kot pa opisati - na primer, kako se zaveže vezalka na čevlju? Ce znanja ni moč izraziti z besedami, kako ga lahko nekomu posredujemo z besedami? V kakšni zvezi sta si znanje in svet? Kakšna so razmerja med zunanjim svetom, znanjem v glavi in jezikom, uporabljenim za izražanje znanja o svetu? Ali lahko znanje upravljamo? Očitno ga lahko, saj v okviru informacijskih sistemov obstaja disciplina, ki se ukvarja z njegovim upravljanjem. Pa je res znanje tisto, kar upravljamo? Kakšne misli se nam pode po glavi tačas, ko upravljamo znanje? Kot vse kaže, se da zastaviti veliko vprašanj, morebiti pa se da na kakšno tudi odgovoriti. 1. ČLOVEK IN NJEGOVO DOJEMANJE SVETA Kako človek dojema svet, katerega del je iudi sam? Odgovor na to vprašanje ni preprost in tudi ne vemo, ali bomo kdaj zvedeli za pravi odgovor. Pri iskanju odgovora si bomo pomagali z vrsto predpostavk, ki jih srečamo v [3] in [S]. Prva izmed njih je naslednja: ■ svet obstaja neodvisno od nas oziroma naših spoznavnih sposobnosti. Posamezniku je težko verjeti, da je obstajal svet pred njim in da bo obstajal tudi po njem. Zelo rad verjame, da svet brez njega ni tisti pravi svet Pravimo tudi, da živimo v svojem svetu, ki ga seveda tudi vidimo po svoje. Za potrebe našega prispevka se moramo privaditi na misel, da svet od posameznika ni prav veliko odvisen. Človek pa v svetu živi, ga spoznava in se odziva na spremembe v njem: a človek je sposoben s pomočjo svojih čutil opazovati in dojemati vtise o posameznih delih ali aspektih sveta, imenovanih tudi domene. Dojeto domeno razume človek kot množico prepoznavnih stvari, ki pa se lahko prekrivajo, vsebujejo druga drugo ali so druga z drugo v kakršnikoli povezavi (SI). Posledica dojemanja sveta so vtisi, ki jih Človek oblikuje v svojih mislih. Vtisi so lahko urejeni ali neurejeni, bežni, površni in tudi taki, ki na človeka naredijo močan vtis: ■ na osnovi dojetih vtisov iz sveta oblikuje človek v svoji glavi koncepcije (ideje, modele), pri čemer mu pomagajo mentalni procesi, kot so prepoznavanje, karakterizacija, abstrakcija, refleksija. Omenjeni procesi mu omogočajo opazovani svet spoznali, doumeti in razumeti. Pri tem lahko zaide tudi v težave. Dojeti vtisi ga lahko postavijo pred dilemo. Ufxmtbiid NfORM ATIK& 1999 številka3-letnikVli Strokovni-: razprave Svet Domene dojemanje Predstavitve predstavljanje Človekovo mišljenje simboli. Koncepcije, predstavitve in domene lahko predstavimo s pomenskim trikotnikom (S3), KONCEPCIJA označuje SI Dojemanje, razumevanje in predstavljanje delov sveta katera koncepcija je tista prava. Ali naj, na primer, vtis razume kot matico ali pa kot vijak (S2). je primerek PREDSTAVITEV označuje DOMENA 'miza' S2. Katera koncepcija je prava • ali je matica ali vijak? V človekovi glavi se tako zbere množica različnih koncepcij. Vsaka od njih prispeva k bolj poglobljenemu poznavanju sveta: ■ množica človekovih stabilnih in med seboj skladnih koncepcij sestavlja njegovo znanje. Pojav stabilnih koncepcij v Človekovi glavi je lahko posledica opazovanja in razumevanja sveta in/ali rezultat komunikacije s sočlovekom, ki se nanaša na ta isti svet. Vsaka taka koncepcija je dei Človekovega 'znanja o svetu'. Za posredovanje svojih koncepcij sočloveku uporablja Človek predstavitve. ■ Koncepcije se predstavijo s pomočjo nekega jezika na nekem pomnilniškem mediju (papir, računalniški pomnilnik,..,). Koncepcija predstavlja abstraktno idejo, kaj neka stvar je, kaj pomeni, kakšne vrste je, s kakšnimi lastnostmi jo lahko opišemo. Koncepciji lahko pripadajo objekti domene - primerki koncepcije, ki posedujejo prav lake lastnosti, kot jih koncepcija predstavlja. Ce želimo govoriti (pisati) <1 koncepcijah in objektih domene, jih je potrebno označiti, za kar se uporabljajo predstavitve - S3. Pomenski trikotnik Slika S3 prikazuje pomenski trikotnik (znan tudi kot Ogdenov predstavitveni trikotnik), katerega vrhnje oglišče je koncepcija, ki je predstavljena s predstavitvijo 'miza' (podatek), primerki koncepcije pa so elementi domene, ki obsega množico miz. V posameznih primerih lahko pomenskemu trikotniku kakšno oglišče tudi manjka. Obstajajo lahko koncepcije (npr, sedmeroglavi zmaj), katerih primerki ne obstajajo (domena je prazna množica). Pojavijo se lahko objekti, ki jih ne znamo klasificirati - ne poznamo njihovih koncepcij. In končno si lahko izmislimo predstavitve, ki ničesar ne označujejo, vsaj ne da bi mi vedeli. Predstavitev znanja o svetu obstaja i/ven človekove glave. To, kar človek ve in zna, je večidel sposoben tudi predstaviti soljudem. V ta namen izrazi svoje znanje s pomočjo jezika, besede in stavke pa zapiše s pomočjo simbolov: a podatek (podatki) je poljubna množica predstavitev znanja, izraženih s pomočjo jezika in zapisanih s pomočjo simbolov. Vsaka predstavitev postane tako del sveta, ki človeka obkroža. Predstavitev je lahko individualna, taka, ki jo razume le avtor predstavitve. Če pa naj nekaj pomeni tudi soljudem, se morajo le-ti z njo strinjati: ■ s stališča skupnosti (skupine ljudi) je pomembno, da je posamezna domena predstavljena na način, s katerim vsi soglašajo - ne glede na 'resnično' realnost. 1999 - številka 3 ■ letnik VI! tipombiid NFOft M ATI KA Strokovni-: razprave Taka 'realnost' skupine ljudi jc poimenovana kol 'medsubjektivna realnost'. To je torej realnost, za katero se je skupina ljudi dogovorila in znotraj katere obstaja komunikacija med njimi. Za opisane pojme pa obstajajo tudi okrajšave: ■ interpretacija je, na primer, dojemanje domene, ki rezu 1 tira v množici vtisov, tem vtisom sledi razumevanje vtisov, rezultat razumevanja pa so koncepcije - ali preprosto - znanje. Interpretacijo izvaja seveda človek, imenovan interpret, ki z opazovanjem okolja in s komunikacijo prihaja do novih spoznanj - novega znanja. Kot je bilo že omenjeno, se skupnost ljudi praviloma dogovori o 'resnični' realnosti /.nutraj katere lahko med seboj komunicira. Komunikacija temelji na izmenjavi sporočil: ■ sporočilo so podatki, ki jih odpošlje pošiljatelj prejemniku s posredovanjem medija, Pošiljatelj mora svoje koncepcije, ki jih želi posredovati prejemniku, najprej predstaviti s pomočjo jezika in simbolov na določenem mediju, nato pa jih odpošlje prejemniku. Prejemnik mora seveda poznati tako jezik, kot tudi simbole, s katerimi je sporočilo zapisano. In kaj je informacija: ■ informacija je inkrement znanja pridobljen s sprejemom sporočila. To je razlika med koncepcijami, pridobljenimi z interpretacijo sprejetega sporočila, in znanjem prejemnika pred sprejemom sporočila. Koliko znanja pridobi prejemnik z interpretacijo sporočila, je odvisno od marsičesa. Denimo, da je sporočilo zapisano s kitajskimi pismenkamt. Povprečen Slovenec jih bo dojel kot simpatične sličice, razumel pa jih seveda ne bo. Olajšajmo si problem - pri zapisovanju sporočila je bila uporabljena latinica. Črke sedaj poznamo, vendar, če je besedilo zapisano v španščini, bo marsikomu vse skupaj še vedno 'španska vas'. Sporočila še vedno ne bomo znali interpretirati. Šele če razumemo jezik in poznamo simbole, s katerimi je sporočilo zapisano, bomo znali razbrati, kaj nam sporočilo sporoča. Sporočilo torej znamo prebrati in ga razumemo. Za koliko se je povečalo naše znanje? Odvisno od tega, koliko smo že vedeli. Če se 'novica' nanaša na 'lanski sneg', ne bomo nič pametnejši. Če pa sporočilo sporoča pomembno, doslej neznano dejstvo, bo to pomenilo kar precejšen inkrement k našemu znanju. Prejeta informacija lahko torej poveča naše znanje, njena prava vrednost pa se pokaže tedaj, ko jo znamo učinkovito izkoristiti za sprejem odločitve, ki nam osebno ali pa širši skupnosti prinese koristi. 2. ŠE NEKAJ O PODATKIH IN INFORMACIJI V literaturi lahko srečamo še vrsto definicij, ki govore o tem, kaj so podatki in kaj je informacija, V [1] je podatek definiran na naslednji način1: ■ podatek je predstavitev informacije na formaliziran način, ki je primeren za komunikacijo, interpretacijo ali obdelavo (od Človeka ali stroja). Definicija pravi, da mora biti predstavitev izvedena na formaliziran način, kar pomeni, da mora obstajati neki predpis - konvencija, po katerem simbole ali vrednosti analognih veličin zapisujemo oziroma beremo. Nekoliko starejša definicija iz istega vira pa pravi: ■ podatek je poljubna predstavitev s pomočjo simbolov ali analognih veličin, ki ji je pripisan, ali se ji lahko pripiše neki pomen. Iz definicije lahko izluščimo, da je podatek lahko diskreten, če se pri predstavitvi uporabljajo simboli {npr. 25" C), ali pa analogen, če se za predstavitev uporablja kakšna fizikalna veličina {npr, dolžina živosrebrnega stolpca). Obema definicijama je skupno to, da se podatku lahko pripiše neki pomen na osnovi nekega predpisa znotraj nekega konteksta. Kaj pa pomeni izraz informacija? Po ISO je pomen naslednji: ■ informacija je znanje, ki se nanaša na objekte, kot so dejstva, dogodki, stvari, procesi ali ideje, skupaj s koncepti, ki imajo v okviru nekega konteksta določen pomen. G.C, Everest [2] je zapisal definicijo nekoliko drugače, ki pa se po pomenu vsekakor ujema s predhodnico: ■ informacija so ovrednoteni podatki v posamezni specifični situaciji. Zadnji dve definiciji implicitno predpostavljata, da obstaja interpret, ki informacijo izlušči iz podatkov. Kot pa smo že omenili, informacija ni nekaj absolutnega in nekaj takega, kar bi bilo vsebovano v podatkih, pač pa je njena količina močno odvisna od obstoječega inter-pretovega znanja. Avtor ene izmed zelo znanih definicij informacije je Borje Langefors [4]. Definicija je znana tudi pod imenom informacijska enačba. Langefors pravi naslednje: m Informacija jc novo spoznanje, ki ga človek (interpret) doda svojemu poznavanju sveta. Odnos med informacijo, podatki, časom in interpreterjevim znanjem predstavlja informacijska enačba: I = i(D, S, t). Simboli v informacijski enačbi pomenijo naslednje: I -količina informacije, i - informacijska funkcija, D -podatki, S - prejemnikovo znanje, t - Čas, ki je na voljo prejemniku za interpretacijo podatkov. 1 V komentarju k slovarju je zapisano, da povzema definicije Iz standarda ISO/IEC2382, Information technology Vocabulary, nptmibjtntKFORMÄT1KA 1999 - številka 3 - letnik VII Strokovni-: razprave Zaključke, ki jih je povzel Langefors iz omenjene definicije, pa lahko strnemo v naslednje trditve: podatki niso informacija; podatki ne vsebujejo informacije, podatki posredujejo informacijo le tistemu prejemniku, katerega znanje je skladno z izbrano predstavitvijo podatkov in modelom sveta, na katerega se nanašajo. Definicija se od predhodnih razlikuje predvsem po tem, da v njej nastopa dodaten parameter Čas ali bolje rečeno pravočasnost. Kot je bilo že omenjeno, je informacija koristna le, če se lahko na njeni osnovi tudi ukrepa - in to pravočasno ukrepa. Zgodi se lahko, da je posredovana količina podatkov tako velika, da jih v času, ki je na voljo za ukrepanje, ni mogoče interpretirati. Prej ali stej sicer pridemo do konca in iz podatkov Izluščimo informacijo, vendar za ukrepanje je lahko že prepozno - ali kot pravi pesnik 'ura zamujena ne Vrne se nobena'. Do podobnega izida lahko pridemo tudi v primeru, ko je prava informacija sicer na voljo, ni pa človeka, ki bi pravočasno ukrepal na njeni osnovi. Langeforsovo definicijo je zanimivo primerjati z definicijo informacije, ki se uporablja v informacijski teoriji. Informacija je v lem primeru definirana kot: » znanje, ki zmanjša negotovost, povezano s pojavom določenega dogodka iz končne množice možnih dogodkov. Informacija, ki jo pridobimo s tem, ko zvemo, da sc je pripetil določen dogodek x, se izračuna po formuli: S3, Informacija kot funkcija verjetnosti nastopa posameznega dogodka ■ I = - I°g2 p(x) [bit] Običajno se kot enota informacije uporablja bit, če je logaritem dvojiški, nit, če je logaritem naravni in dit, če je logaritem desetiški. Če poiščemo korespondenco med omenjenima definicijama, potem so podatki v slednjem primeru sporočilo, da se je pripetil dogodek Xj, znanje pa je poznavanje verjetnosti nastopa posameznih dogodkov p(xt), i = l..n. Količina informacije, ki jo izračunamo po omenjeni formuli, se ujema s trditvijo, da je informacija le neko novo spoznanje. Če se namreč pripeti zelo verjeten dogodek (p(x,) = 1), potem je to enakovredno sprejetim podatkom, ki nam sporočajo nekaj, kar smo že vedeti, zato je 1 = 0 in nimamo torej ničesar dodati k svojemu prejšnjemu znanju. In narobe, če se pripeti malo verjeten dogodek (p(x,) = 0), na primer, da zadenemo na tomboli terno, pridobimo v tem primeru zelo veliko količino informacije (S3), 3. ZAKLJUČEK Oba, človek in računalnik sta si podobna v tem, da sprejemata podatke iz okolja, pri tem, kaj z njimi storita, pa sta si različna. Človek podatkom s pomočjo svojega že obstoječega znanja pripiše pomen, s tem svoje znanje dopolni in na njegovi osnovi ustrezno ukrepa. Nasprotno pa računalnik podatkom ne pripisuje pomena, pač pa jih s pomočjo v njem že shranjenih podatkov in programov le preoblikuje iz ene oblike v drugo. Na kratko lahko rečemo, da so podatki vse, kar lahko zapišemo na tak ali drugačen pomnilniSki medij, informacija in znanje pa sodita v sfero človekovega notranjega miselnega sveta, 4. Viri [1] Dictionary of Computer Science - The staridardized voeübula/y. ISG/IEC2382, 1997, ISBN 2-12-486922-1 [2] EVEREST, Gordon C.; Data base Management, 1986, (str. 7 -11), McGraw-Hill, ISBN 0-07-Y66456-0 f3j FALKENBERG, Eckhard D. in ostali: A Framework of Information System Concepts, (str. 16 -12), IFIP 1998, ISBN 3-901882-01-4 [4] LANGEFORS, Börje: Infological Models and Information Users Views, (Str. 17 - 31), Information Systems 5(1), 1980 [5] S0WA. John E: Conceptual Structures, 1984, (str, 1 • 26), Addison-Wesley, ISBN 0-201-14472-7 Doc. dr Tomaž Mohorič je zaposlen na Fakulteti za računalništvo in informatiko, kjer predava vrsto predmetov 5 področja podatkovnih baz in informacijskih sistemov. Raziskovalno se ukvarja s konceptualnim modeliranjem, z načrtovanjem relacijskih in objektno usmerjenih podatkovnih baz ter s sistemi za upravljanje podatkovnih baz. 1909 -Številka 3 -letnik VII u/jonibi ioI NFORM AT IKA