Miroslav NOVAK* * Dr. Miroslav Novak je arhivski svetnik v Pokrajinskem arhivu Maribor, Slovenija "Preslikave podatkov" kot temeljna metoda njihovega upravljanja v arhivih NOVAK, Miroslav, "Data Mapping" as Basic Methodology for Data Management in Archives. Atlanti , Vol. 19, Trieste 2009, pp. 329-339. Original in Slovenian, abstract in English, Italian and Slovenian, summary in English Basic activity in archival institution is the management of all kinds of data. They are present in different "materialized" and "non-materialized" documents, sometimes just as information or data. They are organized as databases, knowledge, records etc. All these data entities are managed by the different professional tradition, with implementation of different solutions. In the archival practice we can find even different standards or other technical documents and professional documentation, which are used for the same or similar archival material or processes. These approaches can be named as "ad hoc" approaches. They are based on the requests about special and adapted solutions and processes. From the archival point of view they are useful only in preliminary archival work. Different technical possibilities of data acquisition (scanning, photographing, microfilming, photocopying, typing etc.), different professional practices and different "ad hoc" processes cause also serious long term archival professional and methodological problems. Author suggests their solutions on the base of direct and indirect data mapping as approach for basic methodology of data management in archi- NOVAK, Miroslav, La mappatura dei dati come metodologia di base per la ge-stione dei dati in archivio. Atlanti , Vol. 19, Trieste 2009, pp. 329-339. L 'attivita basilare nelle istituzioni archivisti-che e la gestione di tutti i tipi di dati. Essi sono presenti in forma materiale e non materiale, a volte solo come semplici informazioni o dati. Sono organizzati sotto forma di database, documenti, ecc. Tutti questi dati sono gestiti da tradizioni professionali diverse, con 1. UVOD V arhivih posvečamo veliko pozornost racionalizaciji postopkov in hkrati s tem zahtevam po celoviti strokovni obravnavi arhivskega gradiva. Te pa ne obsegajo zgolj aktivnosti na originalnih dokumentih, ampak tudi na njegovih raznovrstnih reprodukcijah in informativnih pomagalih, vključno z obvladovanjem zgodovinskega, materialno-tehničnega in uporabniškega konteksta. Za uresničevanje postavljenega cilja najdemo v arhivskih ustanovah različno prakso, ki temelji na različni tradiciji in filozofiji dojemanja arhivskih strokovnih izhodišč. Razlike opazimo tako med arhivskimi ustanovami kot tudi znotraj njih. Razloge za njihov obstoj moremo iskati v relativno nizki doseženi stopnji splošnega razvoja arhivske vede, na drugi strani pa je to pogosto izraz intenzivnih miselnih procesov posameznikov v smeri iskanja in implementacije rešitev obvladovanja množice unikatnih podatkov. Kreativnost in inovativnost posameznikov, ki je sicer dobrodošla na mikro nivoju, se v kontekstu izgradnje kompleksnih sistemov na makro nivoju skozi čas prelevi v coklo razvoja celotne arhivske službe določene družbe. Ta s sistemskega stališča generira množice problemov v segmentu integracije produktov arhivskega dela. V praksi to običajno pomeni ciklično odpiranje istovrstnih strokovnih problemov, popravljanje že izvedenih informativnih pomagal, v skrajnosti tudi njihovo praktično neuporabnost, nadalje nečitljivost zapisanih arhivskih vsebin, neustrezno kvaliteto izvedenih reprodukcij arhivskih dokumentov itd. Obstoječa praksa reševanja teh problemov dejansko temelji na logično in vsebinsko različnih metodoloških rešitvah, predvsem pa na praksi uveljavljanja načela "unikatnosti" rešitev. Pri mnogih izmed njih lahko celo podvomimo v strokovnost. Tako izhodišče torej ni ustrezno niti za nadaljnji strokovni razvoj, niti za vsakodnevno arhivsko strokovno delo. Kot alternativa se pojavlja standardizacija postopkov in metod dela v arhivih. Ta ne obsega zgolj implementacije mednarodnih arhivskih strokovnih standardov, ampak predvsem aktivnosti razvoja nacionalnih standardov, ki so v skladu s splošnimi usmeritvami ohranjanja nacionalnih in s tem tudi personalnih identitet posameznikov. V segmentu realizacije in standardizacije moramo upoštevati več strokovnih in organizacijskih izhodišč. Eno izmed njih je "vzajem- nost", ki jo je potrebno v arhivski teoriji in praksi v prihodnosti dosledneje promovirati in tudi praktično uresničevati. V kontekstu standardizacije produktov arhivskih strokovnih aktivnosti moremo ločiti "horizontalno" in "vertikalno" medgeneracijsko vzajemnost. Horizontalna vzajemnost predstavlja medsebojno kooperativ-nost obstoječega arhivskega intelektualnega strokovnega potenciala na področju: - vrednotenja, prevzemanja, hrambe in obdelave arhivskega gradiva; - izgradnje vzajemnih arhivskih informacijskih sistemov ter poznejše povzemanje in izmenjava podatkovnih struktur; - izmenjave strokovnih znanj in dosežkov s področja arhivske teorije in prakse itd. Vertikalna medgeneracijska vzajemnost pomeni, da morajo nove generacije arhivskih strokovnih delavcev nadaljevati svoje delo neposredno na doseženih rezultatih predhodnih generacij, tako v intelektualnem kot tudi v tehnološkem smislu. Te zahteve so danes vsaj teoretično hitreje in lažje uresničljive kot kadarkoli v preteklosti. V ta namen imamo na razpolago mnogovrstne tehnološko-tehnične in arhivsko strokovne rešitve, vključno z dobro in preizkušeno arhivsko prakso, sredstva in načine hitre izmenjave strokovnih znanj, standarde za zapisovanje arhivskega gradiva1, standarde izmenjavo podatkov2 itd. Sodobni izzivi arhivske teorije in prakse s področja vzajemnosti morajo biti usmerjeni predvsem v določanje načinov oblikovanja informacijskih celot, postopkov povzemanja in transferov množice različnih arhivskih vsebin iz izvornih v ponorna okolja itd. Temeljiti morajo na zahtevi po razvoju splošne "metodologije arhivskega strokovnega dela". Ta mora upoštevati različne oblike manipuliranja s podatki v različnih realnih in elektronskih okoljih za različne namene, kar pomeni, da mora biti dovolj abstraktna in hkrati praktično uporabna. implementazione o con soluzioni differenti. Nella pratica archivistica possiamo trovare anche norme diverse o altri documenti tecnici o documentazione professionale, usati per lo stesso (o similare) materiale o procedimento archivistico. Questepossono venir denominate come soluzioni "ad hoc". Sono basate sulla ri-chiesta di soluzioni e procedimenti speciali o adattati. Dalpunto di vista archivistico sono utili soltanto in una prima fase del lavoro ar-chivistico. Le diverse possibilita tecniche di acquisizione dei dati (scanner, fotografia, mi-crofilmatura, fotocopia, dattilografia), differenti pratiche professionali e diversificati procedimenti "adhoc"causano sul lungo termine problemi archivisticiprofessionali e metodolo-giche. L 'autore suggerisce la loro soluzione sulla base di una mappatura diretta ed indiretta dei dati come approccio per la metodologia di base della gestione dei dati in archivio. NOVAK, Miroslav, "Preslikave podatkov" kot temeljna metoda njihovega upravljanja v arhivih. Atlanti, Zv. 19, Trst 2009, str. 329-339. Osnovno dejavnost arhivov predstavlja upravljanje z mnogovrstnimi oblikami podatkov. Ti se pojavljajo kot "materializirani" in "ne-materializirani" dokumenti, kot informacije ali kot podatki sami po sebi. Organizirani so v zbirke podatkov, množice znanj, zapisov itd. Vse vrste podatkovnih entitet arhivski delavci upravljajo na podlagi različnih strokovnih tradicij, z uporabo različnih rešitev. V 2. IZHODIŠČA RAZVOJA TEMELJNE ARHIVSKE METODOLOGIJE Osnovne enote obravnavanja arhivskih vsebin predstavljajo na različne načine zapisani podatki. Te je potrebno ob medijih in sredstvih za zapisovanje v arhivski teoriji in praksi opredeliti kot osrednjo entiteto pristopov reševanja sodobnih arhivskih strokovnih problemov. Informacije, konteksti, vsebine ter spoznanja in znanja, ki temeljijo na arhivskem gradivu, tako predstavljajo le nadgradnjo osnovnega obravnavanja podatkov. Posebno mesto je v tej hierarhiji potrebno dodeliti dokumentom, ki nastajajo po določenih postopkih in kontekstih z namenom zagotavljanja lastne javne vere ne glede na čas in prostor nastanka oz. uporabe. Vendar njihova kompleksnost in pojavnost lahko vpliva le posredno na osnovna metodološka izhodišča arhivskega strokovnega dela (Slika 1). 1. Omenim naj arhivske strokovne standarde: ISADg(2), ISAAR(CPF)2, ISDF, ISDIAH^ 2. Omenim naj samo standarde za izmenjavo podatkov: MARC, EAD2000, METS, MODS, Dublin Core, EAC-CPF_ praksi najdemo celo različne standarde in drugo tehnično oz. strokovno dokumentacijo, ki jo uporabljajo za obravnavanje enakih ali podobnih arhivskih vsebin ali procesov. Take pristope imenujemo "ad hoc" pristope. Temeljijo na zahtevah po posebnih in prilagojenih rešitvah in procesih. Z arhivskega stališča so uporabni le v pripravljalnih fazah arhivskega strokovnega dela, pozneje pa ne več. Različne tehnološke možnosti zajemanja podatkov (skeniranje, digitalno ali klasično fotografiranje, mikrofilmanje, barvno in črno-belo fotokopiranje, prepisovanje itd.), nestandardizirana strokovna praksa in različni "ad hoc" procesi povzročajo resne dolgoročne arhivsko strokovne in metodološke probleme. Kot osnovo njihovih rešitev avtor predlaga implementacijo temeljne metodologije upravljanja podatkov v arhivih na podlagi posrednih ali neposrednih preslikav podatkov. SUMMARY In archives a great attention is given to the rationalization of the professional processes and to the demands on professional treating of archival material. These include not only activities in the original documents, but also their wide range of reproductions and archival finding aids, including the management of historical, material-technical and user's context. Basic units of treatment of archival content represent a variety of recorded data. In the archival theory and practice the "data" Slika št. 1: Poenostavljeni model relacij osrednjih entitet pristopov reševanja arhivskih strokovnih problemov Pri manipulaciji s podatki se srečujemo s tremi, za arhivske strokovne delavce osnovnimi aktivnostmi: oblikovanje (ustvarjanje, zapisovanje, dodajanje) in brisanje (uničenje, odstranjevanje) podatkov znotraj enega sistema ter preslikanje (različne oblike kopiranja, prepisovanja, izpisovanja) podatkov iz enega v drugi sistem. Skozi čas je arhivska stroka dokaj jasno oblikovala odnos do oblikovanja podatkov (vrednotenje in popisovanje arhivskega gradiva, dokumentiranje stanj in procesov z dokumenti itd.). Prav tako ima zgrajen odnos do brisanja podatkov (vrednotenje in izločanje oz. uničenje tistih dokumentov, ki nimajo arhivske vrednosti in jim je potekel rok hrambe). Dosedanja arhivska praksa pa ni v zadostni meri razvila celovitega metodološkega pristopa do preslikav podatkov iz poljubnega izvornega v katerikoli znani ponorni sistem. Danes uporabljene rešitve s tega področja predstavljajo le bolj ali manj uspešne, pa še to kratkoročne, tehnološke implementacije posameznih izvedb. Pri tem pa ne gre samo npr. za digitalizacijo arhivskega gradiva v najširšem pomenu besede, ter za fotokopiranje ali mikrofilmanje in za podobne tehnike preslikav dokumentov. Tako paradigmo je mogoče najti v celotnem spektru obravnavanja postopkov preslikav vsebin ali pojavnih obliko arhivskega gradiva. Posebno mesto v tem kontekstu imajo objave arhivskega gradiva (izvedba pojavne oblike dokumenta v drugem sistemu) in predstavitve, kot so razstave (predstavitve vsebin in velika abstrakcija njihovih kontekstov vključno z zagotavljanjem originalnosti arhivskih dokumentov) in druge oblike predstavitev arhivskih vsebin (radijske in televizijske oddaje, predavanja in podobno). V to skupino lahko prištevamo tudi popisovanje in izdelovanje različnih oblik arhivskih informativnih pomagal. Pri tem se na podatkovnem nivoju postavljajo zelo osnovna arhivska strokovna vprašanja, ki so povezana z oblikovanjem naslovov popisnih enot, dojemanjem logične strukture arhivskega gradiva in organizacije vsebin, razumevanjem in obvladovanjem kontekstov, zagotavljanjem "ustrezne" kvalitete reprodukcij, dovoljevanjem posegov v arhivske vsebine in to ne samo s stališča interpretacije arhivskih vsebin, ampak tudi s stališča njihove materialne pojavnosti v postopkih restavracije in konzervacije poškodovanega arhivskega gradiva. Kot model obravnavanja podatkov v arhivih nam tako more služiti splošni komunikacijski model. V osnovi je bil model razvit v okviru informacijskih znanosti, za potrebe arhivistike pa ga je potrebno le nekoliko prilagoditi zaradi specifičnosti "komuniciranja" z in preko arhivskega gradiva. 3. SPLOŠNI MODEL PRESLIKAV PODATKOV Preslikave pojavov ali stanj realnega sveta ali kakorkoli zapisanih vsebin predstavljajo pomembno aktivnost na področju njihovega ohranjanja. Izvedene so na različne načine, s pomočjo različnih tehnologij in sistemov zapisovanja. S postopkovnega stališča jih lahko izvedemo v najmanj treh zaporednih korakih (točka 1 do 3), običajno pa v štirih korakih: 1. določitev izvora, 2. določitev cilja ali ponora preslikave, 3. izvedba postopka preslikave, 4. dokumentiranje kontekstnih in tehničnih metapodatkov. Kot spremljevalni dejavnik preslikave se pojavlja motnja ali šum, ki glede na uporabljeno tehnologijo omejuje izvedbo preslikave. Za odpravljanje posledic šuma moramo v postopku preslikav dodati še povratno zvezo. Ta predstavlja korektivni dejavnik uspešne preslikave. Kot dodatni dejavnik se pojavlja še dokumentiranje kontekstnih in/ali tehničnih metapodatkov. Ta v osnovi zagotavlja sle-dljivost postopka preslikave. Preslikava predstavlja postopek, ki ga izvede človek ali naprava, ki zna sprejeti izvorne podatke, jih obdelati in nato posredovati rezultate v ponoru. V predstavljenem modelu predstavlja izvor ali izhodišče vsak relevanten vir podatkov, ki omogoča izvedbo postopkov preslikav v okviru znanih tehnoloških rešitev. Ponor ali cilj je vsaka oblika ali okolje, v katerega je mogoča izvedba preslikave v okviru znanih tehnoloških rešitev. Šum je motnja v preslikavi, kar pomeni, da ta ni usklajena z načrtovanim ali pričakovanim izvajanjem preslikave. Šum zmanjšujemo tako, da vzpostavimo povratno zvezo, npr. s preverjanjem rezultatov v ponoru s tistimi iz izvora. Povratna zveza predstavlja način samoregulacije preslikav vrednosti, s tem da zaključuje tokokrog izhodnih informacij, s pomočjo katerih sprejemamo odločitve o vhodnih vrednostih v novem postopku preslikav. must he recognized as a central entity of approaches for solving the problems relating the data managements of preserved archival material. By manipulation with data we can define three basic archival operations: creating (registering, adding etc.) and deleting (the destruction, removing etc.) inside the system and data mapping between different systems (printing, writing, copying etc.). Over time, the archival theory and practice has developed a quite clear relationship to the creation of data (assessment and cataloging of archival material, documenting of states and processes, etc.). It has built also a solid relationship to the data deleting (evaluations and destruction of those documents that have no archival value and their retention period has expired). But the current archival practice has not sufficiently developed a comprehensive methodological approach to data mapping from any source system to any known target system. As a basic model of data treatment in the archives we use the general communication schema. It was developed in the context for needs of information science. Because of the specificity of "communication" with and through the archival material, it is necessary to make some adjustments on it for archival purposes. Data mapping of written content in any way constitutes an important activity in the process of preserving of the information with historical value. Process it self can be carried out in different ways, using different technologies and recording systems. From a procedural point of view it can be done in at least three sequential steps (point 1 to 3), usually in four steps: 1. to determine the origin 2. setting up a goal or target of data map- 3. implementation of process of data mapping, 4. documenting contextual and technical metadata. As an accompanying factor of data mapping occurs disturbance or noise. It depends on the different restrictions (technology, processes, content etc.). For regulation of the effects of noise in the process of data mapping the reverse link must be added. It represents a correcti- ve factor for successful process of data mapping. The documenting of contextual and/or technical metadata can appear as an additional and optional factor of data mapping process. This basically ensures traceability of the data mapping process. Data mapping is basically a complex process, which consists of many sub-processes, activities and technologies. In the frame of possibilities these processes can be - archivists alone with help of the human senses and devices for recording, - archivists in the interaction with one or more automated devices or - various automatic devices with minimal human intervention. Data mapping procedures include also the processes of transformation, migration and data conversion. Irrespective of the type of data mappings and applied technologies some activities are quite standardized. As a general rule it is necessary to carry out preparing procedures, beginning with the implementation of the analysis of data source structures, characteristics of records, forms, media, inspecting the results etc. Based on the appearance of the original we can realize the following types of analysis: - formal, - content and - data analysis, including the creation of the profile(s) of one or more data structures. In the next stage of the process of data mapping of content or data structures we must identify needs for those data values in source system which should be added or taken away to meet the requirements of target system. When the data structures of source system appear in various media or in different versions, we should build an appropriate profile for each manifestation. Furthermore, we must pay particular attention to a useful minimum common content section and manifestations in a particular item, which is defined as "serve as the contact" or "as the service point" and is referred to as "S" point. Completion of successful data mapping means, that the mapped data are in the target environment successfully integrated without any negative impact on 3. Preslikave se pojavljajo kot: enostavna projekcija s pomočjo naprav - projektorjev, prepis vsebin s pomočjo človeka in naprav - pisalnih strojev, izdelava povzetkov s pomočjo človeka in naprave-računalnika, oblikovanje gesel s pomočjo človeka, kazal s pomočjo človeka in naprav - računalnika, napotil s pomočjo človeka in naprav - računalnika itd. Slika št. 2: Splošni model preslikav v arhivski teoriji in praksi Dokumentiranje postopka predstavlja komplementarno aktivnost, s katero opredelimo izvedeno preslikavo praviloma s časom in prostorom ter uporabljeno tehnologijo praviloma v ponoru, uspešnost izvedbe postopka, odgovorne osebe itd. Pri tem se je potrebno posebej osredotočiti na znane in potrebne tehnične in kon-tekstne metapodatke. Z njimi moremo pozneje ponovno rekonstruirati samo preslikavo, njeno uspešnost in kontekstnost, morebitne posledice na poznejše preslikave itd. Preslikava podatkov je v osnovi zapleten postopek, ki je sestavljen iz mnogih podpostopkov, aktivnosti in uporabljenih tehnologij, ki ga v okviru omejitev in sposobnosti izvaja: - človek sam s svojimi čutili in pripomočki za zapisovanje, - človek v interakciji z eno ali več samodejnimi napravami - različne samodejne naprave z minimalnimi človeškimi po- ali segi. Vsaka faza preslikave je neposredno odvisna od ciljev postopka, uporabljene tehnologije ter pojavnih oblik vsebin in tipov zapisov podatkov v ponoru3. Arhivisti pri svojem delu neprenehoma izvajajo splošne postopke preslikav. Ti so vgrajeni v postopke arhivskega strokovnega urejevalnega dela, v postopke uporabe arhivskega gradiva, njegovega materialnega varovanja in dolgoročne hrambe itd. V praksi so prepleteni še z drugimi postopki, ki jih posamezniki izvajajo na nivoju pojavnih oblik dokumentov arhivske vrednosti ali njihovih informativnih pomagal oz. kontekstov. Postopki preslikav vključujejo tudi postopke transformacije, migracije in konverzije podatkov oz. zapisov. V praksi torej pomeni, da so preslikave dejansko prepletene s kombinacijami omenjenih postopkov. Če postopke preslikav izvajajo v virtualnem okolju, ti niso zgolj programsko-tehnične narave, ki bi jih načeloma lahko izvedli informatiki sami, ampak so to predvsem arhivski strokovni postopki ugotavljanja in vzpostavljanja ustreznih (virtualnih) povezav znotraj posameznih podatkovnih struktur in kontekstov, ki so vzpostavljene med njimi. Tako ob specializacijah s področja informacijske tehnologije potrebujemo za njihovo realizacijo še izkušnje arhivistov - raziskovalcev, ki poznajo arhivsko gradivo z vsebinsko kontekstnega stališča. Ne glede na vrste preslikav in uporabljene tehnologije so procesi preslikav dokaj standardizirani. Praviloma je potrebno izvesti pripravljalne postopke, ki se začenjajo z izvajanjem analiz izvornih podatkovnih struktur, značilnosti zapisov, pojavnih oblik nosilcev itd. Pri tem moramo izhajati iz splošno znanih dejstev, ki so povezana s postopki transformacije in po potrebi tudi njihove migracije in konverzije. Na podlagi pojavne oblike izvornega sistema lahko opravimo naslednje vrste analiz: - formalno, - vsebinsko in - podatkovno analizo, vključno z izdelavo profila(ov) ene ali več podatkovnih struktur izvornega sistema. Pri formalni analizi ugotavljamo zunanje - formalne oblike izvornega sistema, kot so nosilci podatkov, načini zapisov, kvaliteta berljivosti znakov in druge posebne elemente izvornega sistema, ki vplivajo na njegovo splošno uporabnost. Rezultati teh analiz običajno dajejo odgovore na vprašanje, ali so izvorni sistemi uporabni do te mere, da je na njihovi podlagi mogoče uspešno nadaljevati načrtovane postopke preslikav. Pri vsebinski analizi ugotavljamo popolnost oz. celovitost vsebin izvornega sistema. Pri tem je potrebno posebno pozornost posvečati problemom, ki so povezani z oblikovanjem, zajemanjem in poznejšim upravljanjem ter razumevanjem kontekstov med podatkovnimi strukturami. Rezultati vsebinske analize dajejo odgovore na vprašanja, ki so povezana z vzpostavljanjem načinov in oblik relacij ter kvantifikacijo kontekstnih povezav v okviru ene podatkovne strukture. Ob vsebinski analizi izvajamo tudi podatkovno analizo. Pri tem ugotavljamo obstoj in značilnosti enega ali več tipov podatkovnih struktur v okviru obravnavane celote. Rezultati tovrstne analize kažejo na to, ali je obravnavana podatkovna struktura opredeljena kot tista, kateri: - lahko neposredno določimo strukturo, kot so formularji, vnosni obrazci ali drugi vzorci podatkovnih struktur. Pri njih natančno opredelimo nazive posameznih sestavnih delov podatkovne strukture, ki se ponavljajo pri vsakem vnosu podatkov. Določamo relacije med posameznimi sestavnimi deli podatkovne strukture, ki jih lahko natančno opredelimo bodisi z zaporedjem zajemanja podatkov, preko vzpostavljenih ključev ali na kakšen drug način. - Izpostavljeno podatkovno strukturo lahko opredelimo pri tabelah, seznamih, popisih ali drugih vzorcih z izpostavljenimi oznakami njihovih vrednosti. Pri njih je podatkovna struktura določena consistency of target system. Archivists should adopt the data mapping scheme as the basis for developing other needed methodologies such as methodology of the inventory of specific types of archival material, methodology of collecting the material-technical data, the methodology to establish historical and archival contexts etc. na začetku tabele ali seznama in se pri drugem in vseh ostalih vnosih podatkov razume sama po sebi. Odnosi znotraj tovrstnih podatkovnih struktur so določeni z vrstnim redom zajetih podatkov, v nekaterih primerih tudi preko različnih ključev ali drugače. - Posredno določljiva podatkovna struktura je tista, ki je lahko delno strukturirana ali pa njeno strukturo določimo izključno preko razumevanja vsebin prostih besedilnih ali nebesedilnih podatkovnih zbirk. Razmerja med podatki lahko razberemo predvsem iz vsebin posameznih zapisov. Pri vsebinski analizi moramo opredeliti predvsem: - načine in oblike predstavitev podatkovnih struktur, - načine in oblike odnosov med posameznimi elementi strukture ter - težišča odnosov in njihove kazalce. Rezultati izvedbe vseh treh analiz predstavljajo osnovo za izdelavo profila izvornega sistema. Ta mora posredovati dejansko sliko stanja na področju podatkovnih struktur in njihovih vsebinskih relacij. Naslednjo stopnjo v postopku preslikav vsebin in podatkovnih struktur nam predstavlja ugotavljanje potreb po tistih podatkovnih vrednostih, ki jih je potrebno dodati izvornemu sistemu, da zadostijo zahtevam ponornega sistema. Ko so izvorne podatkovne strukture na različnih medijih ali v različnih verzijah, moramo izdelati ustrezen profil za vsako od njegovih pojavnih oblik. Hkrati izvedemo še dodatne aktivnosti v zvezi z ureditvijo razmerij med znanimi verzijami in določili/zahtevami po-nornega sistema. Ob tem moramo posvetiti posebno pozornost oblikovanju minimalnega skupnega uporabnega preseka vsebin in pojavnih oblik v določeni točki, ki jo opredeljujemo kot "stično" ali "standardno točko" ter jo označujemo kot "točko S". V točki "S" je po izvedeni prvi preslikavi oblikovana standardna oblika podatkovne strukture izvora, ki omogoča nadaljnjo obdelavo in/ali uporabo v ponornem sistemu. Za doseganje standardizirane podatkovne strukture v "točki S" je potrebno vložiti delo, ki v postopku preslikav doda vrednost po-nornemu sistemu glede na izvorni sistem. V tej zvezi lahko oblikujemo naslednje ugotovitve: - pri nestandardni izvorni podatkovni strukturi je potrebno zagotoviti več časa in intelektualnega potenciala za dosego standardne "točke S". - Količina potrebnega vloženega kapitala za uresničitev "točke S" je obratno-sorazmerna s stopnjo standardizacije podatkovne strukture izvornega sistema. - Z večanjem nivoja standardizacije izvornega sistema se manjša delež kapitala, ki je potreben za doseganje neposredne preslikave v ponorni sistem. Postopki preslikav so običajno kompleksni, v določenih primerih tudi dolgotrajni bodisi s tehnološkega, organizacijskega ali arhivskega strokovnega stališča. Kompleksnost je toliko večja, če vključuje tudi migracije in konverzije podatkov. Glede na stopnjo razvitosti informacijske tehnologije, dosežen nivo splošnega znanja s področja transformacije, migracije in konverzije podatkovnih struktur moremo pri preslikavah ločiti: - popolnoma avtomatizirane postopke (intervencija človeka je omejena zgolj na začetek in na potrditev zaključka postopkov preslikav). Z obstoječo informacijsko tehnologijo še v arhivih ni mogoče izvesti popolnoma samodejnega uresničevanja vseh postopkov preslikav podatkovnih struktur. Mogoče pa je avtomatizirati večje kompleksne postopke, npr. s pomočjo t. i. paketnih obdelav. Pri tem morajo biti jasno do očeni kriteriji, ki so odvisni od strojne in programske opreme, od zasnove in realizacije izvornega informacijskega sistema, oblikovanja ponornega sistema itd. Kot primer naj navedem samo paketno spreminjanje velikosti digitalnih slik, oblike zapisa, kvalitete zapisa itd. - Delno računalniško podprte postopke, pri katerih je potrebna intervencija človeka tako ob začetku in potrjevanju zaključka postopka preslikav kot tudi ob drugih kritičnih fazah postopka, predvsem pri preverjanjih delnih rezultatov preslikav. Tovrstne postopke je smotrno izvajati pri tistih delih preslikav, pri katerih vzpostavljamo povezave z že zajetimi podatkovnimi strukturami, selektivno dodajamo ali odvzemamo konstante, pri postopkih digitalizacije, pri realizaciji pra-reprodukcij izvornega sistema oz. pri izvajanju določenih konverzij na podlagi znanih in implementiranih pravil obdelav. - Popolnoma ne-avtomatizirane postopke preslikav. V tem primerih govorimo o ponovnem zajemanju podatkov, npr. s prepisovanjem vsebin s pomočjo sredstev za zapisovanje ali preko drugih tehničnih sredstev, kot so različne vrste tipkovnic ali drugih naprav za zajemanje podatkov (skenerji, digitalni fotoaparati in druge podobne naprave). Način ročnega prepisovanja ali novega zajemanja uporabimo takrat, ko zaradi slabe kvalitete posameznih elementov izvornega sistema, predvsem podatkovnih nosilcev ali deformiranega podatkovnega signala, postopka delne računalniške podpore ni mogoče uresničiti, ali pa bi bili stroški njegove priprave oz. izvajanja višji, kot če bi potrebne podatke zajeli s prepisovanjem. V postopku preslikav podatkovnih struktur moramo po vsaki zaključeni celoti postopka opraviti preverjanje uspešnosti postopka in stopnjo doseženih rezultatov (povratna zveza). To je potrebno izvesti tudi na področju postopkov transformacije, migracije oz. konverzije podatkovnih struktur. Če je postopek kombiniran, je potrebno posebej preverjati uspešnost vsake zaključene aktivnosti ali postopka. Pri migraciji moramo med drugim preverjati število prenesenih bitov, število stavkov, število datotek itd. Pri konverziji preverjamo uspešnost same spremembe načina zapisa, posebno pozornost posvečamo posebnim znakom in drugim posebnostim uporabljenega znakovnega nabora izvornega sistema. Prenos podatkov v ponorni sistem je uspešen le pod pogojem, če je bila pravilno opravljena transformacija v predhodnih postopkih. Samo preverjanje rezultatov ponornega sistema mora biti usmerjeno v dve smeri: - preverjanje stanja z izvornim sistemom, - preverjanje stanja s specifikacijami v "točki S". Vendar morata biti v ponornem sistemu uresničena dva predpogoja: - oblika podatkov v standardni strojni kodi iz "točke S" se mora ujemati z zahtevami ponornega sistema, - podatkovna struktura v točki "S" mora popolnoma ustrezati podatkovni strukturi ponornega sistema. To pomeni, da v fazi preslikav podatkovnih struktur iz "točke S" v ponorni sistem ugotavljamo razmerja med določenimi specifikacijami v točki "S" in zahtevami ponornega sistema. Postopek je potrebno ponavljati vsakokrat, ko se potrebe po-nornega sistema glede na izvorni sistem spremenijo do te mere, da vodijo v nedoslednost in s tem tudi neusklajenost v točki "S". Iz tega lahko povzamemo ugotovitev, da so zahteve ponornega sistema najprej odvisne od izvedbe izvornega sistema in šele nato od specifikacij v točki"S". Postopki preslikav podatkovnih struktur iz "točke S" v ponorni sistem so podobni preslikavam iz izvornega sistema v "točko S". Glede na pojavno obliko so lahko: - avtomatizirani brez izvajanja kontrolnih zapisov, - avtomatizirani z izvajanjem kontrolnih izpisov ali - delno avtomatizirani, pri čemer je potrebno imeti možnosti tako izpisa vrednosti, ki se prenašajo kot tudi aktivnega poseganja v posamezne elemente podatkovne strukture, ki se nahaja v postopku odčitavanja. V tem kontekstu moramo omeniti tudi spremembe tipov posameznih podatkovnih struktur, kot so datum, uporabljeni merski sistem in podobno, še posebej, če ti niso v skladu s podatkovnimi tipi ponornega sistema. Po opravljeni proceduri prenašanja podatkov v ponorni sistem je potrebno izvesti analizo doseženih rezultatov postopka glede na točko "S". Pri tem moramo ugotavljati celovitost prenesenih podatkovnih struktur, ustreznost konverzij znakovnih naborov, tipov posameznih podatkovnih struktur in drugega. V primeru, da ponorni sistem predstavlja tehnološko-tehnični napredek uporabe informacijske tehnologije glede na izvorni sistem, je s stališča arhivske teorije in prakse potrebno med drugim preveriti novonastala kontekstna razmerja, ki morajo jasno odražati enake vrednosti, kot so predstavljene v izvornem sistemu. Zaključek uspešne preslikave vključno z migracijo, transformacijo in morebitno konverzijo vsebin postopka predstavlja nesporna ugotovitev, da so podatki preneseni iz izvornega sistema v ponorni sistem, vključno z njihovimi konteksti, in da so bili v novem okolju uspešno integrirani, ne da bi kakorkoli negativno vplivali na samo konsistentnost ponornega sistema. 4. ZAKLJUČEK Vprašanje obravnavanja podatkov in njihovih struktur je bilo v arhivski teoriji vedno prisotno, vendar je imelo v preteklosti manjšo intenziteto. Razlogov zato je več. Eden izmed njih je gotovo posvečanje večje pozornosti problemom, ki so povezani z dokumenti, drugi pa je tehnološko tehnične narave. S problemi upravljanja podatkov v okoljih, ki temeljijo na analognih zapisih, so se arhivski strokovni delavci srečevali predvsem pri oblikovanju kartotek, kazal, indeksov. To je bilo še toliko bolj prisotno v primerih, ko so obstajala originalna informativna pomagala. Podobno je bilo v segmentih reproduci-ranja arhivskih dokumentov, kjer arhivisti s tehnološkega stališča niso mogli intenzivneje posegati v rezultate preslikav. Ob tem moremo opozoriti na to, da so bili vzpostavljeni procesi enostavni in nezahtevni. Z uvajanjem množice tehnoloških rešitev v procese arhivskega strokovnega dela postajajo ti vedno bolj kompleksni. To pa zahteva tudi relativno visoko stopnjo standardizacije in metodološke dovršenosti vseh vrst arhivskih strokovnih opravil. Če moremo zahteve po standardizaciji izpolnjevati na podlagi arhivskih strokovnih in drugih standardov, pa je na področju metodologije arhivskega strokovnega dela še veliko za izvesti. Na to nas opozarjajo preko svetovnega spleta splošno dostopne podatkovne zbirke. Pri nekaterih lahko opazimo strokovno in metodološko šibke zapise, še posebej, če so pri izgradnji podatkovne zbirke implementirali izkušnje in metodologijo izdelave klasičnih arhivskih informativnih pomagal. Podobne probleme najdemo pri digitaliziranih podobah arhivskih dokumentov in še kje. Glede na to, da so v vseh primerih osnovne entitete obravnavanja podatki, je potrebno razviti metodološke rešitve njihovega upravljanja na podlagi splošne komunikacijske sheme. Ta je teoretično enostavna in znana, predvsem na področju informatike. Arhivski strokovni delavci bi morali to shemo sprejeti in jo praktično nadgraditi v shemo preslikav podatkov v arhivih. Na njeni osnovi je mogoče razviti potrebne metodologije arhivskega strokovnega dela. Omenim naj samo metodologijo popisovanja posameznih vrst arhivskega gradiva, metodologijo zbiranja materialno-tehničnih podatkov, metodologijo vzpostavljanja historičnih in arhivističnih kontekstov itd. 5. VIRI IN LITERATURA - Duranti, L.: Arhivski zapisi: teorija i praksa. Zagreb: Hrvatski državni arhiv, 2000. - EAC Encoded Archival Context. Pridobljeno 31. 8. 2009 s spletne strani http://jefferson. village.virginia.edu/eac/. - EAC-CPF Encoded Archival Context - Corporate bodies, Persons, and Families. Pridobljeno 31. 8. 2009 s spletne strani http://eac.staatsbibliothek-berlin. de/. - EAD Encoded Archival Description. Version 2002. Pridobljeno 31. 8. 2009 s spletne strani http://www.loc.gov/ ead/index.html. - Elektronski dokumenti: priročnik za arhiviste. Ljubljana: Arhiv Republike Slovenije, 2006. - Glažar, N.: Organizacijsko komuniciranje arhivov - hraniteljev arhivskega gradiva. Ljubljana: Arhiv Republike Slovenije, 2002. - Kožar, A.: Arhivistika u teoriji i praksi 2. Tuzla: Arhiv Tuzlanskog kantona: Društvo arhivskih zaposlenika Tuzlanskog kantona, 2005. - MADS Metadata Authority Description Standard. Pridobljeno 31. 8. 2009 s spletne strani http://www.loc. gov/standards/mads/. - MARC Standards. Pridobljeno 31. 5. 2009 s spletne strani http://www.loc. gov/marc. - METS Metadata Encoding & Transmission Standard. Pridobljeno 31. 8. 2009 s spletne strani http://www.loc.gov/standards/mets/. - MODS Metadata Object Description Standard. Pridobljeno 31. 8. 2009 s spletne strani http://www.loc. gov/standards/mods/. - Novak, M.: Preslikave vsebin v arhivskih strokovnih postopkih. Maribor: Pokrajinski arhiv, 2007. - Pregelj, Ž. E.: Transformacija podatkov iz obstoječih informativnih pomagal v podatkovno strukturo za prenos v InfoArh na primeru Pokrajinskega arhiva v Novi Gorici. Strokovna naloga. Nova Gorica: Pokrajinski arhiv, 2004.