01 Izpitni centri ECDL ECDL (European Computer Driving License), ki ga v Sloveniji imenujemo evropsko raËunalni.ko spriËevalo, je standardni program usposabljanja uporabnikov, ki da zaposlenim potrebno znanje za delo s standardnimi raËunalni.kimi programi na informatiziranem delovnem mestu, delodajalcem pa pomeni dokazilo o usposobljenosti. V Evropi je za uvajanje, usposabljanje in nadzor izvajanja ECDL poobla.Ëena ustanova ECDL Fundation, v Sloveniji pa je kot Ëlan CEPIS (Council of European Professional Informatics) to pravico pridobilo Slovensko dru.tvo INFORMATIKA. V draavah Evropske unije so pri uvajanju ECDL moËno angaairane srednje in visoke .ole, aktivni pa so tudi razliËni vladni resorji. Posebno pomembno je, da velja spriËevalo v 148 draavah, ki so vkljuËene v program ECDL. Doslej je bilo v svetu izdanih ae veË kot 11,6 milijona indeksov, v Sloveniji veË kot 17.000, in podeljenih veË kot 11.000 spriËeval. Za izpitne centre v Sloveniji je usposobljenih osem organizacij, katerih logotipe objavljamo. UPORABNA INFORMATIKA 2017 ©TEVILKA 1 JAN/FEB/MAR LETNIK XXV ISSN 1318-1882 Znanstveni prispevki Matjaa Roblek,Tomaa Kern Pristopkprenoviin informacijski podpori razvojnega procesav srednje velikem podjetju 3 Mateja Grobelnik, Jurij JakliË Znanja in sposobnosti podatkovnih znanstvenikov:pregled in analiza stanja v Sloveniji 17 Damijan Kozina, Davorin KofjaË, Andrej ©kraba Razvoj modela sistemske dinamike investiranjain donosnosti kapitalav organizacijiin realizacijav obliki spletne aplikacije 45 Strokovni prispevki Boris OvËjak,TatjanaWelzerDruaovec,Gregor PolanËiË Primerjava zmogljivosti veËplatformsko razvitih mobilnih aplikacij 58 Informacije Iz Islovarja 73 INFORMATIKA 2017 ©TEVILKA 1 JAN/FEB/MAR LETNIK XXV ISSN 1318-1882 Ustanovitelj in izdajatelj Slovensko dru.tvo INFORMATIKA Litostrojska cesta 54, 1000 Ljubljana Predstavnik Niko Schlamberger Odgovorni urednik Jurij JakliË Uredni.ki odbor Marko Bajec,Vesna BosiljVuk.iE, Sjaak Brinkkemper,Gregor Hauc, Jurij JakliË, Andrej KovaËiË, Jan von Knop, Jan Mendling, Miodrag PopoviE, Katarina Puc, Vladislav RajkoviË, Ivan Rozman, Pedro Simoes Coelho, JohnTaylor, Mirko Vintar,TatjanaWelzerDruaovec Recenzenti Alenka Baggia, Marko Bajec, Marko Bohanec, Renato Burazer, Janez Dem.ar, Dejan Dinevski, Sa.a Divjak, Nadja Dobnik, Jure Erjavec, Aleksandar GavriË,Miro Gradi.ar, Ale.Groznik,Tanja Grublje.iË, Mojca Indihar ©temberger, Jurij JakliË, Mirjana KljajiE Bor.tnar, Monika Klun, Andrej KovaËiË, Nives Kreuh, Marjan Krisper, RobertLeskovar,Luka PavliË, Ale. PopoviË,Uro. RajkoviË, Vladislav RajkoviË, Aiva Rant, Andrej Robida, Niko Schlamberger, MarinaTrkman, PeterTrkman,TomaaTurk, Mirko Vintar, Borut Werber, Bo.tjan Avanut TehniËna urednica MiraTurk ©kraba Lektoriranje MiraTurk ©kraba (slov.) Marvelingua (angl.) Oblikovanje KOFEIN DIZAJN, d. o. o. Prelom in tisk Boex DTP, d. o. o., Ljubljana Naklada 600 izvodov Naslov uredni.tva Slovensko dru.tvo INFORMATIKA Uredni.tvo revije Uporabna informatika Litostrojska cesta 54, 1000 Ljubljana www.uporabna-informatika.si Revija izhaja Ëetrtletno. Cena posamezne .tevilke je 20,00 EUR. Letna naroËnina za podjetja 85,00 EUR, za vsak nadaljnji izvod 60,00 EUR, za posameznike 35,00 EUR, za .tudente in seniorje 15,00 EUR.Vcenoje vkljuËen DDV. Revija Uporabna informatikajeod .tevilke 4/VII vkljuËena v mednarodno bazo INSPEC. Revija Uporabna informatikaje pod zaporedno .tevilko 666 vpisana v razvid medijev,kiga vodi Ministrstvo zakulturo RS. Revija Uporabna informatikaje vkljuËenav Digitalno knjianico Slovenije (dLib.si). YSlovensko dru.tvo INFORMATIKA Vabilo avtorjem Vreviji Uporabna informatika objavljamo kakovostne izvirne Ëlanke domaËih in tujih av­torjevznaj.ir.egapodroËjainformatikevposlovanju podjetij,javniupraviin zasebnem aivljenjuna znanstveni,strokovniininformativniravni;.eposebno spodbujamoobjavo interdisciplinarnih Ëlankov. Zato vabimo avtorje,da prispevke,ki ustrezajo omenjenim usmeritvam, po.ljejo uredni.tvurevijepo elektronski po.ti na naslov ui@drustvo­-informatika.si. Avtorjeprosimo,dapri pripravi prispevka upo.tevajo navodila, objavljenav nadaljeva­ nju ter na naslovu http://www.uporabna-informatika.si. Za kakovost prispevkov skrbi mednarodni uredni.ki odbor. »lanki so anonimno recen­zirani,o objavipana podlagirecenzij samostojno odloËauredni.ki odbor. Recenzenti lahko zahtevajo, da avtorji besedilo spremenijo v skladu s priporoËili in da popravljeni Ëlanek ponovno prejmejo v pregled. Uredni.tvo pa lahko .e pred recenzijo zavrne objavo prispevka,Ëe njegova vsebina ne ustreza vsebinski usmeritvirevije aliËe Ëlanek ne ustreza kriterijemza objavovreviji. Pred objavo Ëlanka mora avtor podpisati izjavoo avtorstvu,skatero potrjuje original­nost Ëlanka in dovoljuje prenos materialnih avtorskih pravic. NenaroËenih prispevkov ne vraËamoinne honoriramo. Avtorjiprejmejo enoletno naroËninonarevijo Uporabna informatika,ki vkljuËuje avtorski izvodrevijein.e nadaljnje tri zaporedne .tevilke. Ssvojim prispevkomvreviji Uporabna informatika boste prispevalik.irjenju znanja na podroËju informatike. Aelimo si Ëim veË prispevkov z raznoliko in zanimivo tematiko in se jih ae vnaprej veselimo. Uredni.tvorevije Navodila avtorjem Ëlankov »lanke objavljamo pravilomav sloven.Ëini, Ëlanke tujih avtorjevpav angle.Ëini. Bese­dilonajbo jezikovno skrbno pripravljeno.PriporoËamo zmernostpri uporabitujkin‡ kjerje mogoËe‡njihovo zamenjavos slovenskimi izrazi.VpomoËpri iskanju sloven­skih ustreznic priporoËamo uporabo spletnega terminolo.kega slovarja Slovenskega dru.tva Informatika Islovar (www.islovar.org). Znanstveni Ëlanek naj obsega najveË 40.000 znakov, strokovni Ëlanki do 30.000 zna­ kov, obvestila in poroËila pa do 8.000 znakov. »lanek naj bo praviloma predloaen v urejevalniku besedil Word (*.doc ali *.docx) v enojnem razmaku, brez posebnih znakov ali poudarjenih Ërk. Za loËilom na koncu stav­ka napravite samo en prazen prostor, pri odstavkih ne uporabljajte zamika. Naslovu Ëlanka naj sledi za vsakega avtorja polno ime, ustanova, v kateri je zaposlen, naslovin elektronski naslov. Sledinaj povzetekvsloven.Ëinivobsegu8do10 vrsticin seznamod5do8kljuËnih besed,ki najbolje opredeljujejo vsebinski okvir Ëlanka.Pred povzetkomvangle.Ëininajbo.e angle.kiprevod naslova, prav takopanaj bodo doda­ne kljuËne besedevangle.Ëini. Obratno veljavprimerupredloaitve Ëlankavangle.Ëini. Razdelkinaj bodo naslovljeniin o.tevilËeniz arabskimi .tevilkami. Slike in tabele vkljuËite v besedilo. Opremite jih z naslovom in o.tevilËite z arabskimi .tevilkami. Vsako sliko in tabelo razloaite tudi v besedilu Ëlanka. »e v Ëlanku uporab­ljate slike ali tabele drugih avtorjev, navedite vir pod sliko oz. tabelo. Revijo tiskamo v Ërno-beli tehniki, zato barvne slike ali fotografije kot original niso primerne. Slik zaslonov ne objavljamo, razen Ëe so nujno potrebne za razumevanje besedila. Slike, grafikoni,organizacijskeshemeipd.najimajobelo podlago.EnaËbe o.tevilËitevokle­pajih desno od enaËbe. Vbesediluse sklicujtena navedeno literaturo skladnos pravili sistemaAPAnavajanja bibliografskihreferenc, najpogosteje torejv obliki (Novak&KovaË, 2008, str. 235). Na koncu Ëlanka navedite samo v Ëlanku uporabljeno literaturo in vire v enotnem seznamupo abecednemredu avtorjev, prav takovskladuspraviliAPA.VeËo sistemu APA, katerega uporabo omogoËa tudi urejevalnik besedil Word 2007, najdete na strani http://owl.english.purdue.edu/owl/resource/560/01/. »lanku dodajte kratek aivljenjepis vsakega avtorjav obsegudo8 vrstic,v katerem poudarite predvsem strokovne doseake. Pristopkprenoviin informacijski podpori razvojnega procesav srednje velikem podjetju Matjaa Roblek,Tomaa Kern, Univerzav Mariboru matjaz.roblek@um.si; tomaz.kern@um.si IzvleËek Podjetja,ki rastejoiz malegav srednje veliko, sprejemajo pomembne odloËitveo spreminjanju organiziranostiprocesovino ustreznosti informa­cijske podpore. PoveËanje .tevila razliËicprocesovin izjemvposlovanju zahtevaprenovo poslovanja, sicerse pojavijo teaavein napakepri izvajanju posla, npr. napaËne interpretacije dogovoraskupcem, zaloaenost kljuËnih podatkov, ponavljanje slabo izvedenih opravil, zamude, dolgotrajnako­munikacijamed izvajalci.Eden izmed naËinovre.evanja omenjeneproblematike,kipri izvajalcihni priljubljen,je vpeljava doloËene stopnjeformali­zacijev poslovanje, kar obsega tudiprepoznavanjein standardizacijo poslovnihprocesov. Ugotavljamo,daje poseben izziv razvitiin uporabiti ustrezen pristop poveËevanja formalizacije znanjsko intenzivnihprocesovv srednje velikih podjetjih, med katera uvr.Ëamoproces razvoja novega proizvoda. Zato smo na podlagi dognanj obstojeËih znanj oblikovali nov, prilagojen pristopkprenovi poslovnihprocesov,kije primeren za srednje velika podjetja in opredeljuje, kako prenoviti, organizirati in informacijsko podpreti razvojni proces, da se ohranijo poglavitne prednosti zagonskega podjetja(npr. fleksibilnost, odzivnost, inovativnost), hkratipaje vzpostavljena uËinkovita izrabavirovin omogoËeno soËasno vodenjeneprestane­ga razvoja veËjega .tevila novih izdelkov.Vprvem delu prispevkapredstavljamo metodolo.ka izhodi.Ëa,ki so bila podlaga za oblikovanje pristopa kprenoviprocesa razvoja novegaproizvodavsrednje velikem podjetju.Vdrugemdelu prispevkapapredstavljamorezultate validacijepredlaga­nega pristopa na praktiËnem primeru. KljuËne besede: prenova poslovnihprocesov, razvoj novegaproizvoda, informacijska podpora,srednje veliko podjetje. Abstract Approach to reengineering and information support of new product development process in a middle-sized company When the company outgrows the size of a small business it must carryout significant changes in its organization and IT support. An increased numberofprocess variantsand exceptionsinthe businessrequiresprocessreengineering, otherwiseproblemsand mistakes occur, e.g. misin­terpretationoftheagreementwiththebuyer,misplaceofkeydata,repetitionofpoorperformedtasks, additionaltimespentonsolving collusi­ons between employees.The actionof managementthatisnotwell acceptedby employeesis implementationofa certaindegreeofformalizati­on into the business, including the identification and standardization of business processes.We found particularly challenging to develop and applytheappropriateapproachtoincreaseformalizationof knowledge intensiveprocessesinamedium-sized enterprises, especiallytheprocess of developinganewproduct(NPD).This article describesnew,tailoredapproachto businessprocessreengineering,whichis suitableformedi­um-sized enterprises.It was developedonthe basisof new findingsand existing knowledge.Itis possibletoreneworganizationand information support of the renewed development process in order to preserve the main advantages of start-up companies (e.g. flexibility, responsiveness, and innovation),and simultaneouslyavoid explosionof operation costsintermsof rationaluseofresourceswhenwemanage continuousand parallel developmentof severalnewproducts.Infirstpartofthe article,wepresent methodology,whichhasbeenusedasabasisforreengine­ering of NPD process in a medium-sized company. In the second part of the article we present practical results and validation of the proposed approach. Keywords: businessprocessreengineering, newproduct development, information systems, medium-sized enterprises. UVOD Rast podjetja prina.a pomembne spremembe v organizacijo in informacijsko podporo podjetja.PoveËase potrebapofor­malizaciji oz. potreba po vnaprej predpisani stopnji detajlira­nosti procesa.PoveËase potrebapo tipiziranosti oz. potreba po razvr.Ëanju procesov v razliËne kategorije, ki jih razliËno vodimoin informacijsko podpiramo.PoveËa se stopnja stan­dardiziranosti oz. potreba po izvajanju procesa po vnaprej predpisanem naËinu, ki naj bi bil optimalen z zelo razliËnih vidikov, npr. z vidika uËinkovite izrabe Ëlove.kih virov, fi­ziËnih sredstev, informacijske tehnologije, zagotavljanja ka­kovosti izdelka procesa. Procesov v lasti podjetja je vedno veË in niso veË samostojni, ampak so v smislu predhodnih in poslediËnih procesnih povezav integriraniv procesno mreao. To pomeni, da lahko napaka ali nekontrolirana izbolj.ava v enem procesu povzroËi skrite teaave v celotni mreai. Zato se vodenje in delovanje zagonskega podjetja bistveno razlikuje od poslovanja zrelega podjetja. Ena izmed moanosti, da natanËno opredelimo, kaj je majhno in kaj srednje veliko podjetje, je sklice­vanje na Zakon o gospodarskih druabah (ZGD, 2016, Ëlen 55). Z vidika organiziranosti podjetja je pomem­ben tisti del, v katerem zakon govori o .tevilu zapo­slenih. Zagonska podjetja so ob ustanovitvi obiËajno razvr.Ëena med mikro podjetja, Ëe imajo povpreËno .tevilo delavcev v poslovnem letu manj.e od deset. V primeru rasti preidejo zakonsko med majhna pod­jetja, ko imajo povpreËno .tevilo delavcev v poslov­nem letu veËje od deset in manj.e od petdeset. Zanimivo je (PoliËar, 2008), da se organiziranost podjetij, ki imajo deset ali manj zaposlenih, obËutno ne razlikuje od tistih, ki imajo do petdeset zaposlenih. Organiziranost je bistveno drugaËna pri velikih pod­jetjih z dvesto petdeset ali veË zaposlenimi. Za mikro in majhna podjetja je dokazano (Kern, 1998), da za uspe.no delovanje nimajo izrazite potrebe po forma­lizaciji poslovnih procesov: organizacijska struktura in procesi so nestrukturirani in dinamiËni, odvisni od pokritja zahtevanega znanja z razpoloaljivim znanjem zaposlenih. Za velika podjetja je nasprotno dokazano (Stevenson, 2015), da mora obstajati veËja formalizacija, tipizacija in standardizacija procesov z namenom doseganja uspe.nega in hkrati uËinko­vitega poslovanja. Isto delovno mesto zaseda veË razliËnih oseb, zato organizacijska struktura ni enaka kadrovski strukturi. Procesi so kompleksni, njihova medsebojna odvisnost pogosto ni transparentna. Srednje velika podjetja (angl. Medium Enterpri­se, ME) se po .tevilu zaposlenih nahajajo na preho­du med malimi in velikimi, in zaposlujejo med 50 in 250 delavcev. Zanimalo nas je, ali imajo srednje velika podjetja potrebo po prepoznavanju in pre­novi poslovnih procesov, kak.na je prava stopnja formalizacije njihovih procesov, kako fleksibilna naj bo informacijska podpora in predvsem ali je splo.ni metodolo.ki pristop k prenovi procesov lahko enak kot pri velikih podjetjih. V literaturi zasledimo trditve (Snidermann, 2012), da so prednosti srednje velikih podjetij pred mikro podjetji v laajem spopadanju s poslovnimi izzivi, preprosteje pridobijo finanËna sredstva za financira­nje inovacij in laaje vzgajajo ter zadraujejo kljuËne ta­lente v podjetju. Prednosti srednje velikih pred veli­kimi podjetji pa so v veËji agilnosti ob spremembah v poslovnem okolju, so bliaje kupcu in laaje ohranjajo izvorni navdih ustanovitve podjetja pri zaposlenih, npr. zaposleni se ob zahtevani novi ali dodatni nalo­gi ne spra.uje, ali je to delo v njegovem opisu del in nalog, ampak opravi dodeljeno nalogo. Iz pregleda raziskav smo dobili potrditev (Basu idr., 2003), da tudi srednje velika podjetja naËrtno izvajajo projekte prenove procesov in njihove infor­macijske podpore. Ugotavljajo pa, da ta podjetja k prenovi pristopajo mnogo bolj racionalno kot velika podjetja. Strogo omejujejo finanËne vire in potreb­ni Ëas za izvedbo sprememb v procesih, zato so te vpeljane hitreje in bolj preprosto. Prenova procesov je pogosto podrejena zmoanostim sodobnih infor­macijskih re.itev, najpogosteje tistim, ki so trenutno v branai, v kateri deluje podjetje, prepoznana kot najbolj.a praksa. Ugotovljeno je tudi, da srednje veli­ko podjetje zaËenja prepoznavati z rastjo obsega po­slovanja razliËne vrste procesov in njihovo delitev na vsebinsko sorodne sklope ‡ podprocese. V Ëlanku najprej predstavljamo pomen znanjsko intenzivnih procesov za srednje velika podjetja, nato prikaaemo metodolo.ke razlike med prenovo proce­sov za veËja podjetja in prenovo, ki upo.teva posebno­sti srednje velikih podjetij. Sledi vrednotenje uspe.nosti oblikovanega pristopa na primeru srednje velikega podjetja in razprava o rezultatih ob upo.tevanju trenu­tnih omejitev, ki bodo predmet nadaljnjih raziskav. 2 ZNANJSKO INTENZIVNI PROCESI IN NJIHOVA FORMALIZIRANOST Znanjsko intenzivnost poslovnega procesa opi.emo z dinamiko in inovativnostjo eksplicitnega, implicit­nega in kulturnega znanja (Drakos, 2014): • Eksplicitno znanje procesa je zapisano na doku­mentih, fotografijah, zvoËnih zapisih, risbah, mo­delih, tehnolo.kih postopkih. Sem spadajo tudi poslovna pravila, organizacijska navodila in stan­dardne procedure, ki poosebljajo naËin, kako pod­jetje deluje in koordinira delo. Eksplicitno znanje lahko neprestano zapisujemo in prena.amo med zaposlene. • Implicitno ali skrito znanje procesa je tisto, zara­di katerega je doloËeni posameznik pri opravlja­nju svojega dela bolj.i od drugega kljub enako­vrednemu dostopu do eksplicitnega znanja in ob predpostavki enakih izhodi.Ënih sposobnosti posameznikov. Izkazujejo ga dobra presoja, spret­nost, strokovnost, kreativnost in skrito znanje, prepoznamo ga v vrhunski izvedbi doloËene na­loge. Implicitno znanje je teako zapisati, opredeli­ti s pravili ali enaËbami, in se ga je teako nauËiti. Gre za kombinacijo izku.enj in celovitega pozna­vanja podroËja ob hkratnem odliËnem poznava­nju najmanj.e podrobnosti za izvedbo naloge (mojstrstvo). • Kulturno znanje procesa sestavljajo neformal­no oblikovana stali.Ëa, prepriËanja, odnosi, nor­me, vrednote, rituali, simboli (logotipi) in kultne osebnosti, kot so zgodbe ustanoviteljev podjetja. To vpliva na oblikovanje odnosa in obna.anja za­poslenih do podjetja. Kulturno znanje se prena.a s sodelovanjem med zaposlenimi, preko opazo­vanja naËina izvedbe dela cenjenih delavcev men­torjev in lahko povzroËa neformalen naËin izved­be nalog mimo predpisanih pravil. V mikro ali majhnem podjetju znanjsko intenziv­ nost obvladujeta implicitno in kulturno znanje. »e bi se prevladovanje teh dveh vrst znanja nadaljevalo tudi v srednje velikem podjetju, bi zaposleni ob po­veËanem obsegu dela v znanjsko intenzivnih proce­sih veËino Ëasa: • iskali nove informacije in poizvedovali za infor­macijami, ki niso zapisane, • opravljali nepotrebne poti in neformalno sestan­kovali, ker ne vemo, ali so vsi seznanjeni s proble­matiko, Ëe to ni zapisano, • se redundantno in nasprotujoËe odloËali, npr. po­navljali ae dane ukaze ali izdajali razliËna navodi­la za isti primer, ker odzivi niso zapisani. Pomanjkanje eksplicitnega znanja pomeni veË napak v procesih, veË napaËnih odloËitev, po nepo­trebnem poveËano umsko obremenjenost zaposlenih in nepotrebne povratne zanke pri izvedbi dela. Ko re.evanje teh teaav pomembno zmanj.a uËinkovitost dela zaposlenih, kar se dogodi v primeru prehoda podjetja v srednje veliko podjetje, je treba .prenoviti« proces tako, da doloËimo eksplicitno znanje (kaj), ki ga je treba obvladovati, oz. moramo vzpostaviti doloËeno stopnjo formaliziranosti in standardizira­nosti procesa (kje, kdo, zakaj). Teaava je v tem, da zaposleni teako dojamejo, da jim bo formaliziranost vrnila izgubljeno uËinkovitost, .e posebno zaposle­ni na znanjsko intenzivni procesih. Formalizacijo in standardizacijo, ki jo v majhnem podjetju ni, prepo­znajo kot .e dodatno poslab.anje uËinkovitosti oz. kot poveËano .birokratizacijo« dela. Ta odziv lahko omilimo s primerno informacijsko re.itvijo, ki mora prispevati k preprostosti avtomatizacije zapisovanja eksplicitnega znanja in dostopanja do njega. Na podlagi raziskanega lahko ugotovimo, da na­daljnji uspe.en razvoj srednje velikih podjetij ni mo­goË brez zaËetka uvajanja formalizacije in informacij­ske podpore v znanjsko intenzivnih procesih. 2.1 Proces razvoja novega izdelka V proizvodnih podjetjih je predstavnik skupine znanjsko intenzivnih procesov, pri katerih priËaku­jemo od zaposlenih izrazito eksplorativnost, proces razvoja novega izdelka (RNP). V malem podjetju v procesu razvoja novega izdelka dominirata impli­citno in kulturno znanje, ker je proces v veËini pri­merov oblikoval ustanovitelj podjetja (PoliËar, 2008). Z veËanjem obsega dela v primeru srednje velikega podjetja in s prisotnostjo podjetja v globalnih oskr­bovalnih verigah, ki so podvraena odliËnosti pre­ko upo.tevanja doloËenih panoanih standardov, se poveËuje potreba po obvladovanju eksplicitnega znanja. Postavlja se vpra.anje, kako doseËi .ravno pravo« stopnjo formalizacije procesa razvoja nove­ga izdelka v srednje velikem podjetju, da ohranimo ustanovitveni duh, zagon in sodelovanje zaposlenih, kot je bilo pri izvedbi prve ponovitve razvoja izdel­ka, in zagotovimo uËinkovito ponovljivo razvija­nje novih izdelkov, ne da bi eksploatacijski procesi (proizvodnja, nabava, prodaja, raËunovodstvo ipd.), pri katerih dominirajo pravila, ponovljivost, rutina, omejevali izvajanje procesa razvoja novega izdelka. Srednje veliko podjetje ima v primerjavi z mikro ali malim podjetjem veË hkrati aktivnih razvojnih timov, od katerih zahtevajo stalne inovacije, veliko novih izdelkov, stroge omejitve pri doseganju zahte­vanih rokov plasiranja novega izdelka na trg, strog nadzor proraËuna razvojnega dela in stro.kov raz­vojnih projektov. Drai tudi, da se pri srednje velikih podjetjih stopnja novosti v novih izdelkih od projek­ta do projekta zelo razlikuje in da obstajajo razliËne kategorije .novih« izdelkov (FactBook.org, 2015), ki zopet vplivajo na vzpostavitev veËje ali manj.e stop­nje formalnosti v procesu razvoja novega izdelka: • Radikalno novih izdelkov je malo, a so kljuËni za trajno rast prihodkov podjetja; izdelki pomenijo nove sistemske re.itve, so proailci novih platform. V razvoj je vkljuËenih zelo veliko zaposlenih (tudi zunanjih) zelo razliËnih poklicnih profilov. • Veliko je izpeljank izdelkov, pri katerih kupci zahtevajo majhne spremembe v obliki ali funkciji izdelka. Proailec spremembe na izdelku je lahko tudi posledica optimizacije lastnega proizvodne­ga procesa. To so razliËice znanih izdelkov ali izbolj.ave obstojeËih, dovoljujejo hiter razvoj, v razvoj je vkljuËenih malo zaposlenih ozkega profi­la. Ti izdelki zagotavljajo kratkoroËen denarni tok in ohranjanje tranih deleaev obstojeËih izdelkov. • Industrializacija izdelka oz. razvoj procesa izde­lave ae razvitega izdelka kupca je pogosto do­minanten pristop v srednje velikih podjetjih. Pri tem podjetje uporabi lastno .razvojno znanje« za razvoj procesa izdelave in povezanih gradnikov (orodij, avtomatizacije transporta, podajalnikov, strojev, robotov). »e srednje velika podjetja uspejo dobro razviti proces, tudi prevzamejo proizvod­njo izdelkov, kar pomeni dodaten .razvoj« vseh kontrolnih, oskrbovalnih, logistiËnih, transport­ nih in distribucijskih elementov izdelave izdel­ ka. Tudi te .nove izdelke« srednje veliko podjetje uvr.Ëa v proces razvoja novega izdelka. Postavlja se novo vpra.anje, kako v srednje ve­likem podjetju vzpostaviti uËinkovito formalizacijo procesa razvoja novega izdelka, ki bo omogoËala obvladovanje tako raznovrstnih razvojnih projektov razvoja novega izdelka. 2.2 Informatiziranost razvojnega procesa Za strukturni pregled informatiziranosti procesa raz­voja novega izdelka smo uporabili bazo posnetih raz­vojnih procesov slovenskih proizvodnih podjetij, ki se ukvarjajo z razvojem (Roblek, Kern, 1998‡2016). V raziskavi je bilo zajetih osem podjetij, ki so ustrezala kriteriju mikro ali majhnega podjetja, sedem podjetij, ki so ustrezala kriteriju srednje velikega podjetja, in .est velikih podjetij. V analiziranih majhnih in mikro podjetjih sestav­ljajo informacijski sistem za podporo procesa raz­voja novega izdelka orodja za raËunalni.ko podprto naËrtovanje (angl. Computer Added Design, CAD), s katerimi je podprto ekspertno delo znanjskih de­lavcev razvijalcev. Poleg tega uporabljajo standard­ne informacijske re.itve za podporo komuniciranju (e­po.ta, spletni portali naroËnikov) in raËunalni.ke preglednice (MS Excel). V srednje velikem podjetju je informacijska pod­pora procesa razvoja novega izdelka ae precej bolj kompleksna (slika 1). Vsa analizirana srednje veli­ka podjetja na strate.kem nivoju prepoznavajo dve podroËji procesov: obvladovanje aivljenjskega cikla Poslovni nivo: • Procesi PLM Obvladovanje aivljenjskega cikla izdelkov • Pravila NPD SCM Obvladovanje oskrbovalne verige PPC Razvoj novega izdelka Planiranje MDM ObvladovanjematiËnih podatkov in vodenje proizvodnje Sistemi Sistemi ERP APS Informacijski nivo: • Sistemi • Podatki Sistemi PM Slika 1: Kompleksnost informacijskega sistema za podporo procesu razvoja novega izdelka v srednje velikem podjetju izdelka (angl. Product Lifecycle Management, PLM) ter obvladovanje oskrbovalnih verig (angl. Supply Chain Management, SCM). Na operativnem nivoju prepoznavajo proces razvoja novega izdelka (angl. New Product Development, NPD) ter proces plani­ranja in vodenja proizvodnje (angl. Production Plan­ning and Control, PPC). Med njima zahtevajo uËin­kovito procesno in podatkovno povezavo. Na informacijskem nivoju (sistemi in podatki) so v srednje velikem podjetju poleg orodij CAD prisotni projektni informacijski sistemi (angl. Project Mana­gement, PM; Project Portfolio Management, PPM), informacijski sistemi za vodenje in obvladovanje poteka tehniËne dokumentacije (npr. Windchill) in vodenje druge razvojne dokumentacije (angl. Docu­ment Management Systems, DMS). Vsa analizirana srednje velika podjetja izkazujejo veliko veËjo potrebo po ustreznem obvladovanju ma­tiËnih podatkov kot mala podjetja (angl. Master Data Management, MDM) in po vzpostavitvi zanesljive po­datkovne povezave med razvojnim in produkcijskim delom celovitega informacijskega sistema podjetja, ki vkljuËuje poslovni informacijski sistem (angl. En­terprise Resource Planning, ERP), napredne sisteme za planiranje in vodenje proizvodnje (angl. Advance Planning and Scheduling, APS; Manufacturing Exe­cution System, MES) in sisteme za vodenje skladi.Ëa (angl. Warehouse Management System, WMS). KljuËni poudarek uporabnikov razvojnih informa­cijskih sistemov v srednje velikem podjetju je, da se za­radi uporabe razliËnih informacijskih sistemov in po­vezav med njimi ne smejo oslabiti sposobnosti procesa razvoja novega izdelka in z njim povezanih procesov. 2.3 Formaliziranost organizacije razvojnega procesa »eprav v raziskavi povezujemo velikost podjetja s .tevilom zaposlenih in stopnjo formaliziranosti orga­nizacije procesa razvoja novega izdelka, je dokazano (Horie in Ikawa, 2014), da je pomembno upo.tevati tudi, ali so podjetja nova (navadno manj.a) ali ob­stojeËa (navadno veËja, kar pa ni pravilo). Avtorji dokaaejo, da je vztrajanje na obstojeËem procesu raz­voja novega izdelka neugoden dejavnik za podjetje, ko to raste iz malega v srednje veliko. ©tudija (Woschke idr., 2016) ugotavlja, da srednje velika podjetja podjetja zaËenjajo meriti .izgube« v procesu razvoja novega izdelka, kot so Ëakalni Ëasi, podvajanje dela, materialni stro.ki, in da re.itve i.Ëejo tudi v formalizaciji in standardizaciji tega procesa. ©tudija, opravljena na podroËju Irske (Robbins, 2014), dokazuje, da je dobra uËinkovitost procesa razvoja novega izdelka v majhnih in srednje velikih podjetjih v splo.nem odvisna od dobro opredelje­ne strategije inovativnosti in dobro formaliziranega procesa. Ta .tudija ugotavlja, da dve tretjini inovacij­sko aktivnih srednje velikih podjetij na Irskem nima inovacijske strategije, .e manj pa jih ima formaliziran proces razvoja novega izdelka. Posebno je zanimivo, da podjetja, ki imajo formalizirano organizacijo tega procesa, izkazujejo vi.je donose in dosegajo bolj ra­dikalne inovacije. V kontekstu raziskave je pomembna tudi .tudija Leitholda idr. (2016), opravljena v NemËiji, ki ugotav­lja, kako morajo biti formalno organizirani procesi razvoja novega izdelka v srednje velikih podjetjih. Avtorji povezujejo standardiziranost procesa razvoja novega izdelka z uspe.nostjo podjetja in dokaaejo, da je kljuËna lastnost dobro organiziranega procesa razvoja novega izdelka v srednje velikem podjetju sposobnost, da ga je mogoËe hitro prilagajati. V smi­slu formalizacije mora biti .uzakonjena« prilagodlji­vost strukture procesa razvoja novega izdelka. Iz navedenega lahko ugotovimo, da srednje ve­lika podjetja morajo formalizirati proces razvoja no­vega izdelka. Iz omenjenih in drugih raziskav (Poetz in Schreier, 2012; Sosa idr., 2015; Woschke idr., 2016; Rajasekaran idr., 2016) je tudi razvidno, kako forma­liziran mora biti proces razvoja novega izdelka, da bi bil uËinkovit. Glede na teaave srednje velikega podjetja pri za­upanju v pozitiven uËinek formaliziranosti procesa razvoja novega izdelka nismo zasledili raziskav, ki bi predlagale, kako naj se izvede prehod iz neforma­liziranega v formalizirano stanje. Mala podjetja pri prehodu v srednje velika v veËini primerov nimajo vzpostavljene vsaj temeljne formalizacije procesov, zato ne moremo uporabiti klasiËne metode prenove poslovnih procesov za velika podjetja, v katerih so obstojeËi procesi vnaprej znani, zapisani in obvlado­vani ter v katerih zaposleni razumejo njihovo korist pri dvigovanju uËinkovitosti procesov in naËrtova­nju njihove informatizacije. 2.4 Spreminjanje razvojnega procesa Kot izhodi.Ëno bazo metodologij za oblikovanje pristopa k prenovi procesa razvoja novega izdelka v srednje velikih podjetjih smo uporabili nabor po Harmonu (Harmon, 2015): • metode re.evanja splo.nih procesnih problemov; v grobem jih razvr.Ëamo v dve podskupini: ‡ .metode od zgoraj navzdol« oz. metode, ki celo­vito obravnavajo re.evanje problemov v proce­sih: metoda Rummler­Brache, metoda prenove poslovnih procesov (angl. Business Process Re­engineering, BPR), upravljanje poslovnih proce­sov (angl. Business Process Management, BPM), ‡ .metode od spodaj navzgor« oz. metode, ki procesno problematiko obravnavajo in re.ujejo lokalno: 6 sigma (angl. Six sigma), vitko raz­mi.ljanje (angl. Lean Thinking), metodologija Toyotinega proizvodnega sistema (angl. Toyota Production System, TPS); • metode za re.evanje specifiËnih problemov; ve­zane so na re.evanje problemov na specifiËnem strokovnem podroËju podjetja: ‡ metode za izbolj.evanje strukturiranih proce­sov, npr. stro.kovna analiza na podlagi aktivno­sti (angl. Activity Based Costing, ABC), ‡ metode za izbolj.evanje proizvodnih in oskr­bovalnih procesov, npr. teorija omejitev (angl. Theory of Contraints), referenËni modeli za izbolj.anje oskrbovalne verige (angl. Supply Chain Operations Reference, SCOR), ‡ metode za izbolj.evanje procesov razvoja novega izdelka, npr. teorija organizacije izvajanja aktiv­nosti, pri kateri zahtevamo inovacije (angl. The­ory of the resolution of invention­related tasks, TRIZ). Pri pripravi primernega pristopa k prenovi proce­sa razvoja novega izdelka v srednje velikem podjetju smo upo.tevali te posebnosti: poslovna fleksibilnost srednje velikega podjetja zahteva veliko dinamiko in hitrost pri uvajanju sprememb v proces razvoja nove­ga izdelka, proces razvoja novega izdelka v srednje velikem podjetju je zelo znanjsko intenziven in nima standardnega izhoda (ki pa mora biti v skladu s stan­dardi oskrbovalne verige), proces razvoja novega iz­delka je odvisen od dobre podpore povezanih proce­sov, in preprosta uporaba razvojnih informacijskih sis­temov je kljuËna za vzpostavitev formalizacije procesa razvoja novega izdelka, ki jo bodo sprejeli izvajalci. Postavlja se vpra.anje, katero metodologijo izbra­ti za spreminjanje procesa razvoja novega izdelka in jo nadgraditi za posamezen primer, da bomo ohranili vse dobre lastnosti procesa razvoja novega izdelka v srednje velikem podjetju in odpravili vse slabosti, ki so posledica rasti podjetja. 3 METODOLOgIJA PRENOVE PROCESA RAZVOJA NOVEgA IZDELKA V SREDNJE VELIKEM PODJETJU Pred zaËetkom prenove smo oblikovali tri znaËil­ne skupine procesov, ki si sledijo po pomembnosti upravljanja procesov (Kern, 1998): • procese, ki zagotavljajo kljuËno konkurenËno prednost srednje velikega podjetja v poslovanju in so v lasti srednje velikega podjetja, npr. proces razvoja novega izdelka; imenujemo jih tudi iden­tifikacijski procesi; • procese, ki morajo prej.nji skupini procesov za­gotoviti hitro podporo in odziv ter so zaradi tega prav tako organizacijsko vkljuËeni v prenovo procesov srednje velikega podjetja, npr. strate.ko prodajanje, strate.ko nabavljanje, upravljanje ka­drov, zagotavljanje kakovosti; imenujemo jih tudi temeljni procesi; • procese, ki jih srednje veliko podjetje zaradi eko­nomiËnosti poslovanja kot storitve najpogosteje najema v poslovnem okolju, npr. pravni procesi, vzdraevanje informacijske podpore; imenujemo jih tudi podporni procesi. Drugo in tretjo skupino procesov smo v skladu s priporoËili literature prenovili z uporabo informacij­skih re.itev najbolj.e prakse. S tem smo dosegli hitro implementacijo preverjeno koristnih sprememb v poslovanje. Za prvo skupino procesov, ki so praviloma znanj­sko intenzivni in vsebujejo .znanje« podjetja, ki sred­nje veliko podjetje najbolj varuje pred konkurenËni­mi podjetji, je bilo treba prilagoditi metodo prenove. To so .najstarej.i procesi« podjetja, s katerimi se za­posleni najbolje identificirajo. Imenujemo jih identi­fikacijski procesi in s seboj v rast podjetja prina.ajo prakso poslovanja iz Ëasa ustanovitve podjetja. Iz­ziv za prenavljanje pomenijo zato, ker so omogoËili uspeh podjetja, torej so kot .ustrezno« prepoznani v poslovnem sistemu in zunaj njega, npr. pri razvojnih partnerjih. Oboji z rastjo podjetja spoznavajo (zlasti menedament srednje velikega podjetja), da jih je tre­ba prilagoditi novi, mnogo veËji frekvenci ponavlja­nja .razvoja« in kupcem z zahtevnej.imi pogoji (npr. raznimi certifikati), pri Ëemer izvajalci v procesu kljub dokazanim pozitivnim uËinkom ne verjamejo, da sta re.itev formaliziranost in standardiziranost. Postavlja se izziv, kako metodolo.ko pristopiti k prenovi znanjsko intenzivnih procesov v srednje ve­likem podjetju (prva skupina) ob predpostavki, da so spremembe v procesih druge in tretje skupine podre­jene procesom prve skupine. 3.1 Izdelava pred.tudije Pri odloËanju o stopnji formalizacije procesa razvoja novega izdelka oz. vzpostavitve zajemanja eksplicit­nega znanja v srednje velikem podjetju smo najprej v okviru pred.tudije ugotavljali, koliko so izvajalci v procesu ae zreli za tak prehod. Pomagali smo si s prilagojeno matriko (Drakos, 2014) na sliki 2, ki pri­kazuje, kako zaposleni v procesu razvoja novega izdelka interpretirajo pomembnost evidentiranja, prena.anja in ponovne uporabe razliËnih vrst znanja pri prehodu iz malega v srednje veliko podjetje. Z lastniki ali vodstvom srednje velikega podjetja oz. naroËniki uvajanja formalizacije v procese smo pred prenovo procesa razvoja novega izdelka pre­verili, kak.en je trenutni pogled zaposlenih na pre­toËnost oz. prenos znanja med zaposlenimi v tem procesu. Tako lahko ugotovimo, kolik.en vpliv ima .organiziranost« procesa razvoja novega izdelka iz Ëasa malega podjetja na trenutno delo zaposlenih v razvoju in ali so zreli na vzpostavitev formalizacije procesa. Na sliki 2 so rezultati raziskave SME (Dra­kos, 2014) in razlik med njimi. • Raziskava trdi, da je za zaposlene v proce­su razvoja novega izdelka majhnega podjetja najpomembnej.e implicitno strokovno znanje, ki omogoËa razvoj novega izdelka. Zaradi nezaupa­nja, npr. bojazen pred krajo implicitnega znanja, ideje, majhen tim (do deset Ëlanov), deluje tako, da vsak Ëlan tima prispeva svoje .specialno« znanje. Pri tem ne Ëutijo potrebe po evidentiranju, niti po prenosu tega znanja drugim Ëlanom, niti po po­novni uporabi. Cilj tima je plasirati na trg prvi nov izdelek brez razmisleka, ali bo kdaj pri.lo do po­novitve razvojnega procesa in bi potrebovali bazo znanja. Tim pogosto deluje usklajeno po normah vodje tima (navadno lastnika), zato je pomemben prenos kulturnega znanja med sodelujoËimi. • V srednje velikem podjetju, ki v skrajnem prime­ru po ZGD zaposluje ae blizu 250 ljudi, sodeluje v procesu razvoja novega izdelka 20 do 30 in veË zaposlenih. Ker so razvijalci medsebojno odvisni od informacij, postaneta pomembna prenos in hranjenje eksplicitnega znanja (baza znanja) za uËinkovito in kakovostno ponavljanje procesov razvoja novega izdelka. »e imamo opravka s srednje velikim podjetjem, v katerem z vidika formaliziranosti procesa razvoja novega izdelka pri zaposlenih .e vedno prevladuje naËin razmi.ljanja malega podjetja, potem moramo ta razkorak v miselnosti pomembno upo.tevati pri spreminjanju formaliziranosti procesa. Ta organiza­cijski vidik smo preuËili v okviru pred.tudije in je bil podlaga za oblikovanje pristopa k prenovi procesa razvoja novega izdelka v obravnavanem srednje ve­likem podjetju. K spremembi organizacije procesov v obravnavi srednje velikega podjetja smo pristopili na projek­tni naËin (PetroviË idr., 2010). Vodstvo se je zave­dalo omenjenega razkoraka v miselnosti izvajalcev (opisano na sliki 2), kar smo ugotovili s pred.tudijo. Pred.tudija je bila opravljena v obliki projektne naloge, pri kateri smo s pomoËjo vodenih intervju­jev s kljuËnimi udeleaenci v procesu razvoja novega izdelka in vodilnimi delavci v podjetju izdelali gro­be modele procesov (angl. Function Tree, FT; Value Pomembnost obvladovanja znanja v Znanjski tokovi procesu RNP (malo podjetje) Nastanek Prenos VeËkratna raba Eksplicitno • • • Vrste znanja Implicitno • • • Kulturno • • • Pomembnost obvladovanja znanja v Znanjski tokovi procesu RNP (ME) Nastanek Prenos VeËkratna raba Eksplicitno • • Legenda: Vrste znanja Implicitno •• •• Nepomembno • Pomembno Kulturno ••• • Zelo pomembno Slika 2: Strinjanje izvajalcev srednje velikega podjetja (ME) po obvladovanje znanja (eksplicitnega, implicitnega in kulturnega) v procesu razvoja novega izdelka (RNP) Added Chain, VAC) in jih ob tem spra.evali, v kateri smeri vidijo re.itev teaav v procesu razvoja novega izdelka. V pred.tudiji je bil ugotovljen velik razko­rak pri razumevanju koristi, potreb in naËina forma­lizacije oz. zajema eksplicitnega znanja, njegovega prenosa in ponovne uporabe tako eksterno (zahteve strank, priËakovanja dobaviteljev) kot interno (med lastniki, menedamentom podjetja in izvajalci). Re­zultat pred.tudije je bila pripravljena projektna defi­nicija projekta prenove. 3.2 Popis in analiza procesov Zaradi zahteve srednje velikega podjetja po hitri in pomembni izbolj.avi procesa razvoja novega izdelka je bila za spreminjanje procesov izbrana metoda BPR (Kern, 2003). Podjetje pred projektom ni prepoznavalo procesov (zgolj z grobim zapisom v ISO­standardih), zato je bilo treba najprej vzpostaviti menedament po­slovnih procesov. V prvem delu projekta spreminja­nja organizacije procesov sta bili izvedeni dve fazi: • posnetek stanja; identifikacija procesov in la­stnikov procesov, podroben opis procesov, po­pis dokumentnega in informacijskega sistema, popis obstojeËe organizacijske strukture in kad­rov, vzpostavitev mreae procesov; posnetek je vkljuËeval izdelavo organizacijskih in kadro­vskih modelov, procesnih modelov v tehniki raz.irjene dogodkovne procesne verige (angl. Extended Event Process Chain, eEPC) v enot­nem procesnem repozitoriju, ki je bil zgrajen v orodju ARIS; • analiza; vkljuËevala je analizo pomembnosti procesov (za kupca, za podjetje), strokovno in strukturno analizo konkurenËnega stanja proce­sov (interno in eksterno problematiko, izzive in priloanosti za izbolj.ave) ter izdelavo prioritetne liste procesov za spreminjanje. V odvisnosti od zmoanosti virov podjetja in podrejenosti proce­sov so bili oblikovani sklopi povezanih procesov, ki se bodo skupaj prenavljali glede na radikal­nost potrebnih sprememb. Izbrani so bili sklopi procesov, ki se bodo spreminjali po metodi BPR (radikalno), in sklopi procesov, ki se bodo spre­minjali po majhnih, postopnih korakih. Nekateri od teh so se spreminjali ae med analizo v obli­ki hitrih ukrepov (angl. Quick Wins), Ëe je bilo prek mreae procesov ugotovljeno, da na njih ne bo vplivalo spreminjanje procesov z zahtevo po radikalni prenovi. Slika 3 prikazuje sedem faktorjev, po katerih smo ocenjevali in definirali kljuËne procese za prenovo, od katerih ima vsak faktor veË podrejenih kriterijev (Kokalj, 2012). Proces razvoja novega izdelka je bil po veËkriterijski analizi izbran kot kljuËni proces srednje velikega podjetja, ki ga je treba hitro in radikalno spremeniti, da bo Ëim hitreje zagotavljal zahtevano eksplicitno znanje vsem deleanikom procesa (inter­nim in eksternim). Slika 3: Faktorji za razvrstitev procesa med kljuËne za prenovo Stolpec % variance predstavlja porazdelitev va­riabilnosti osnovnih spremenljivk. Navedeni so faktorji, ki skupaj pojasnjujejo 77,068 % variance (nastavljeno glede na raziskavo Urh, 2011). Privzete uteai posameznih faktorjev so preraËunane tako, da 77,068 predstavlja 100 %. Privzete vrednosti uteai je mogoËe spreminjati glede na branao podjetja z dr­sniki. Vrednost faktorja predstavljajo vrednosti po­drejenih izmerjenih spremenljivk analiziranega pro­cesa, pomnoaene z uteajo. V konkretnem primeru je proces razvoja novega izdelka dobil skupno oceno 11,559 (vsota vrednosti vseh faktorjev). Vi.ja kot je skupna ocena glede na druge procese, bolj je proces kljuËen za prenovo glede na ostale. 3.3 Prenova procesa razvoja novega izdelka V prvem koraku prenove smo doloËili znaËilnosti procesa razvoja novega izdelka glede na strukturira­ nost procesa/izhoda procesa. Ugotovili smo, da gre metodolo.ko za delno strukturiran .case­like« pro­ ces, ki ima lastnosti: • od vsebine razvojnega naroËila je odvisen nabor standardnih aktivnosti procesa, • veËina aktivnosti v procesu je znanjsko intenziv­nih (so dominantne v procesu), • pomembna je odvisnost procesa od delno ali pov­sem nestrukturiranih informacij, • naËin dela je predpisan z ohlapnimi pravili, ki predstavljajo usmeritve za izvajanje, • proces ima dolge pretoËne Ëase in nepredvidljive povratne zanke (stopnja novosti), • izdelek procesa razvoja novega izdelka je sestav­ljen iz nestandardnih elementov, odvisnih od primera (nastanejo preteano v nestrukturiranem delu procesa), in standardnih odvisnih elementov (izdelki strukturiranega dela procesa in poveza­nih podpornih poslovnih procesov), • v eni ponovitvi procesa nastopa mnogo razliËnih znanjskih izvajalcev. To pomeni, da ima proces razvoja novega izdel­ ka vse lastnosti za vodenje na projektni naËin z ne­kaj .posebnostmi«: baza razpoloaljivih aktivnosti projekta je fiksna, uporabljeni resursi so vedno ena­ki, nekateri deli procesa so strukturirani in vedno enaki. Zato smo smernice prenove procesa razvoja novega izdelka najprej zaËrtali z uporabo sistema mejnikov (slika 4). Ta koncept nam omogoËa, da zelo raznovrstne zahteve po razvoju, ki zahtevajo razliËen nabor razvojnih aktivnosti, spremljamo in vodimo na projektni naËin prek standardnega nabo­ra .nadzornih toËk« (mejnikov), ki nam s procesnega vidika omogoËajo medsebojno primerjavo in nadzor nad uspe.nostjo in uËinkovitostjo ponovitve procesa razvoja novega izdelka. Vsak mejnik ima doloËeno odgovorno osebo (skrbnika), nabor dokumentov in njihove statuse, pravila in kriterije, s katerimi dovo­ljuje nadaljevanje izvajanja procesa razvoja novega izdelka. Pri tem pa sistem mejnikov ne sme ovirati soËasnosti razvojnih aktivnosti in projektov. Posebno pozornost potrebujejo mejniki, ki pred­stavljajo .povezave« oz. .vrata« v proces razvoja novega izdelka ali iz njega v podporne procese, kot so nabava materialov, obraËun plaË, likvidacija raËu­nov ipd. Ti podporni procesi so visoko strukturirani in zahtevajo podatkovno precizno strukturirane iz­hodne informacije iz mnogo manj strukturiranih in­formacij (.case­like«) procesov, kot je razvoj novega izdelka. Z vidika razvijalcev je to nepotrebna preci­znost oz. birokracija. Hkrati so neprecizne poveza­ve procesa razvoja novega izdelka do podpornih procesov zelo dovzetne za generiranje nepotrebnih novih variant v podpornih procesih, za podatkov­na neskladja, neizvedljivost (nezaaeleno pojavljanje alternativ). V drugem koraku smo doloËili mejnike, da so skladni z vsebino procesa, torej z izrabo najbolj.e prakse na podroËju organizacije procesa razvoja no­vega izdelka. Ker pri srednje velikem podjetju aelimo hitro uvesti spremembe, zmanj.ati vpliv obstojeËega kulturnega znanja in razkriti implicitno znanje, so za­posleni obËutljivi na strokovno usposobljenost vodje prenove. Zato morajo imeti vse predlagane spremem­be teoretiËno in metodolo.ko podlago vsaj v: • splo.no dokazanih doseakih raziskav na podroËju organizacije procesa razvoja novega izdelka, npr. doloËitev razvojnih faz v tem procesu (Kennet, 2013), • najbolj.i praksi na podroËju organizacije procesa razvoja novega izdelka, ki je neodvisna od pano­ge, npr. najbolj.a praksa pri organizaciji proce­sov, ki obvladujejo aivljenjski cikel izdelka (angl. Product Lifecycle Operations Reference, PLCOR) (APICS, 2014), • panoani najbolj.i praksi na podroËju organizacije procesa razvoja novega izdelka; za razvoj v avto­mobilski panogi npr. metoda APQP (Morris, 2012). Strokovna podkovanost svetovalcev, ki prenav­ ljajo proces razvoja novega izdelka, omogoËa, da bodo zaposleni s svojim implicitnim in kulturnim znanjem zaupali v spremembe in jih sprejeli. S tem tudi preseaemo dolgotrajno razpravo o .internih posebnostih« v procesu razvoja novega izdelka in dokaaemo, da posebnosti niso strokovno utemeljene. Drugi korak metodologije vsebuje tudi doloËitev kljuËnih aktivnosti, vhodno­izhodnih dokumentov, pravil, formul, delovnih vlog, s katerimi je oprem­ljena posamezna aktivnost procesa razvoja novega izdelka, da je dobro opravljena v smislu optimuma celotnega procesa (slika 5). V strukturiranem delu procesa razvoja novega izdelka je natanËno doloËe­no tudi zaporedje aktivnosti. Nato sledi .e zadnji del prenove, zasedanje delovnih vlog z zaposlenimi, nji­hovimi lastnimi kompetencami, ki so znaËilnosti kon­kretnega srednje velikega podjetja. To lahko povzroËi tudi spremembo organizacijske strukture podjetja. V tretjem koraku prenove smo pristopili k avto­matizaciji spremenjene organizacije procesa razvoja novega izdelka. Za srednje velika podjetja so inve­sticije v informacijsko­komunikacijsko tehnologijo relativno veliko finanËno breme pri prenovi procesa. Zato so podjetja pripravljena sprejeti kompromise med zaËrtano strate.ko prenovo procesa (eksklu­zivnostjo) in operativno sposobnostjo (ceno) infor­macijske re.itve. To pomeni, da se najniaja raven spreminjanja procesa (zapisi podatkov, izmenjave informacij med sistemi) dogaja soËasno z implemen­tacijo ali prilagoditvijo ae izbranega informacijskega sistema. To je dejansko ae prva iteracija postopne izbolj.ave novega procesa razvoja novega izdelka (novi kot bo). V tem koraku prenove je treba doloËi­ti, katere aktivnosti procesa razvoja novega izdelka zahtevajo: Proces NPD 1. Generiranje idej Znanjsko ‡ Strukturirano ‡ BPM 2. Faza zasnove Znanjsko ‡ Nestrukturirano ‡ CM 3. Faza razvoja 4. Faza poskusne proizvodnje Rutinsko ‡ Strukturirano ‡ BPM Slika 5: Strukturiranje procesa razvoja novega izdelka (angl. NPD) v skladu z aeleno formalizacijo eksplicitnega znanja • transakcijski naËin podpore; to velja predvsem za strukturirane dele procesa razvoja novega izdelka, pri katerih je prisotna velika frekvenca generiranja podatkov in informacij, ki so na vo­ljo podpornim oz. povezanim procesom srednje velikega podjetja, npr. moduli ERP (obraËunski del, plaËe), specialni moduli ERP (npr. za vodenje projektov); • dokumentni naËin podpore; to je primerno pred­vsem za delno in popolnoma nestrukturirane dele procesa razvoja novega izdelka, pri katerih vodi­mo verzije datotek in skrbimo, da se te v nekem dogovorjenem zaporedju potrjujejo, npr. sistemi DMS in Workflow; • znanjski naËin podpore; to so sistemi CAD/CAM, simulatorji, ki sluaijo za podporo razvoja in izde­lave izdelka; • analitiËni naËin podpore; pri Ëemer gre za orodja poslovne inteligence (angl. Business Inteligence, BI), s katerimi na poslovni ravni spremljamo ka­zalnike uspe.nosti in uËinkovitosti procesa razvo­ja novega izdelka. REZULTATI PRENOVE PROCESARAZVOJA NOVEgAIZDELKA Podjetje, v katerem je bila opravljena prenova, je po slovenski zakonodaji srednje veliko podjetje in delu­je na podroËju razvoja in proizvodnje sestavnih de­lov kot sistemski dobavitelj za avtomobilsko in dru­ge industrije. Podjetje je preteano izvozno naravnano in sodeluje v mednarodnih razvojno oskrbovalnih verigah. Od zakljuËka uvedbe sprememb v procesu raz­voja novega izdelka v referenËnem srednje velikem podjetju je preteklo pol leta. Po raziskavi McAfee (2002) je preteklo premalo Ëasa, da bi lahko verodo­stojno analizirali spremembo klasiËnih ekonomskih kazalnikov pred prenovo in po njej. V prispevku predstavljamo preliminarne rezultate v spremembi izbranih procesnih strukturnih kazalnikov, ki doka­zano (Urh idr., 2015) ustrezno napovedujejo kasnej.e dejanske spremembe klasiËnih ekonomskih kazalni­kov. Analiza strukturnih kazalnikov je bila izvedena s pomoËjo analitiËnega modula orodja ARIS 9.8., v katerem jih tudi izraËunavamo. 4.1 Analiza spremembe organizacijskih elementov (izvajalcev)v procesu Z analizo doloËimo za vse zaporedno izvajane ak­tivnosti (v nadaljevanju funkcije) izbranega proce­sa, ali obstaja pri tranziciji med dvema funkcijama sprememba izvajalca v organizacijski enoti, delovni skupini, delovni vlogi ali osebi. Organizacijski elementi in funkcije procesa so povezani prek dveh tipov povezav: ali sodelujejo pri izvedbi ali so odgovorni za izvedbo. »e imajo vsi organizacijski elementi tip povezave .sodeluje« na funkcijo, so vsi organizacijski elementi potreb­ni, da se funkcija izvede. »e imajo vsi tip povezave .odgovoren za izvedbo«, je za izvedbo funkcije po­treben le en organizacijski element, ostali predstav­ljajo alternativne izvajalce. Kot rezultat izvajanja funkcij z alternativnimi or­ganizacijskimi elementi izraËunavamo dve vrednosti menjav organizacijskih elementov v zaporedju pro­cesa: Ëe je sprememba moana in neobvezna (alterna­tiva), se minimalna vrednost ne poveËa, poveËa se maksimalna vrednost. V primeru obvezne spremem­be se poveËata obe vrednosti. Zaradi poenostavitve pri vrednotenju pri analizi vsa razvejanja v procesu obravnavamo kot operator IN. Pojavna kopija objekta predstavlja veËkratno pojavljanje objekta na analizi­ranem modelu, ki je enoliËno zapisan v repozitoriju objektov. Tabela 1:Organizacijska sprememba: primerjava kot je in kot bo Stopnja organizacijske spremembe/izbolj.ave v procesu RNP Kot je Kot bo a) ©tevilo procesnih funkcij 144 77 b) ©tevilo razliËnih organizacijskih vlog 43 38 c) ©tevilo menjav organizacijskih vlog (pojavne kopije) pri prehodu med funkcijami procesa (tranzicije) 125 96 Ë) Minimalno .tevilo organizacijskih sprememb 73 86 d) Razmerje min. .t. org. sprememb (Ë) /tranzicij (c) 0,58 0,9 e) Maksimalno .tevilo organizacijskih sprememb 90 90 f) Razmerje maks. .t. org. sprememb (e) /tranzicij (c) 0,72 0,94 Analiza spremembe nosilcev informacij v procesu Za vse funkcije v zaporedju izvajanja izbranega pro­cesa izraËunavamo spremembe v nosilcih informacij (npr. dokumentih, e­po.ti, datoteki). Menjava obsta­ja, Ëe dve zaporedni funkciji (ena tranzicija) v proce­su nimata skupnega vsaj enega identiËnega nosilca informacij. Tabela 2:Dokumentacijska sprememba: primerjava kot je in kot bo Stopnja dokumentne spremembe/izbolj.ave v Kot je Kot bo procesu RNP a) ©tevilo razliËnih nosilcev informacij 99 106 b) ©tevilo tranzicij nosilcev informacij 50 81 c) Tranzicije z menjavami nosilcev informacij 20 28 Ë) Razmerje menjav nosilcev informacij (c) /.tevilo 0,4 0,35 tranzicij (b) Analiza spremembe informacijskih sistemov v procesu IzraËunava za vse funkcije procesa, ali so podprte z informacijskim sistemom. Poleg tega se za vse za­poredne funkcije preverja, ali obstaja zamenjava in­formacijskega sistema. Zamenjava obstaja, Ëe dve zaporedni funkciji (ena tranzicija) nimata vsaj enega identiËnega informacijskega sistema. Tabela 3:Informacijska sprememba: primerjava kot je in kot bo Stopnja informacijske spremembe/izbolj.ave v Kot je Kot bo procesu RNP a) ©tevilo razliËnih informacijski sistemov ali modulov 44 17 b) Funkcije z informacijskimi sistemi v % 45,65 62,34 c) ©tevilo tranzicij informacijskih sistemov 91 63 Ë) ©tevilo menjav informacijskih sistemov 32 17 d) Razmerje menjav .tevila informacijskih sistemov (Ë)/ 0,35 0,27 .tevilo tranzicij (c) 5 RAZPRAVA Iz primera in na podlagi ugotovitev, ki so navedene v nadaljevanju, lahko sklepamo, da je predstavljeni pristop mogoËe uporabiti v okoljih, v katerih poteka­jo projekti razvoja novih proizvodov. • Iz tabele 1 je razvidno, da je bil prenovljeni pro­ces poenoten: .tevilo funkcij v novem procesu se je zmanj.alo za 67 glede na obstojeËi proces pri isti konvenciji zapisa procesa (za laajo predstavo navajamo, da ima povpreËna razvojna kontrolna lista APQP, ki zagotavlja odliËno razvit izdelek in njegov proces, prek 300 kontrol dokumentov in aktivnosti (pri tem povratne zanke oz. neuspe.ni prehodi niso upo.tevani); to pomeni, da jih novi proces obdela mnogo bolj vitko in uËinko­vito. To smo storili preteano s poenotenjem in zdruaevanjem dela zaposlenih v formaliziranem .strukturiranem delu« procesa razvoja novega izdelka. V proces je alociranih za 12 odstotkov manj razliËnih delovnih vlog (kot bo 38 proti kot je 43). Razmerje med minimalnim in maksimalnim .tevilom delovnih vlog glede na .tevilo funkcij je v procesu kot bo poenoteno, kar kaae na odpravo alternativnih poti oz. ad hoc procesnih blianjic. Ker je razmerje v obeh primerih v kot bo veËje od kot je (v kot bo je razmerje med min. in maks. skoraj 1 : 1), je ob upo.tevanju zmanj.anja .tevila delov­nih vlog razvidno, da je odgovornost za izvedbo posamezne aktivnosti razvoja novega izdelka ja­sno alocirana posameznemu izvajalcu. • Iz tabele 2 je razvidno, da se je .tevilo nosilcev informacij poveËalo s kot je 99 na kot bo 106. To utemeljuje veËjo formalizacijo procesa oz. vi.jo stopnjo kreiranja eksplicitnega znanja, kot se zah­teva od srednje velikega podjetja glede na malo podjetje (kar je bil cilj projekta). Da stopnja for­malizacije ni poslab.ala procesa kot celote, kaae razmerje .tevila menjav nosilcev informacij gle­de na .tevilo tranzicij funkcij v procesu, ki se je v kot bo zniaalo za 5 odstotkov. To pomeni, da je kljub poveËanju .tevila nosilcev informacij na po­samezni funkciji pri.lo do relativnega zmanj.anja .tevila nosilcev, ki se pretakajo skozi proces in tako ne motijo izvajanja toka celotnega procesa. Poleg tega je v procesu kot bo zasnova polnjenja nosilcev informacij (sporoËil) urejena tako, da se podatek zapi.e na mestu nastanka, se aaurira na enem mestu in se .uporabi« na razliËnih nosilcih informacij, kar bistveno olaj.a elektronsko obvla­dovanje dokumentacije. • Iz tabele 3 je razvidno, da se je v procesu kot bo zelo poenotila informacijska tehnologija. ©tevilo uporabljenih razliËnih informacijskih sistemov ali modulov se je zmanj.alo za 61,5 odstotka (na 17 v kot je; pojasniti je treba, da se po konvenciji zapi­sa npr. vsak Excel vrednoti kot svoj element, zato tako izrazit upad s 44 na 17 elementov). Pri tem pa se je poveËala stopnja avtomatizacije procesa, saj je v novem procesu informacijsko podprtih cca. 17 odstotkov veË funkcij glede na .tevilo funkcij v celotnem procesu. Pri tem se je tudi sistemsko poenotila uporaba doloËene programske opreme, kar kaae zniaano razmerje menjav informacijskih sistemov glede na .tevilo funkcij v procesu. Pri tem moramo dodati, da je v Ëasu pisanja prispev­ka cca. polovica procesa razvoja novega izdelka .e neoptimizirana z vidika informacijske podpore in da po optimizaciji priËakujemo .e bolj.e rezultate. • IzraËuni kot bo niso rezultati simulacije prenove, temveË podatki modela aivega novega procesa. Na podlagi doseaenih vrednosti navedenih struk­turnih kazalnikov lahko potrdimo, da nam je z omenjenim pristopom in metodologijo prenove uspelo doseËi, da smo dovolj dobro formalizirali proces razvoja novega izdelka v obravnavanem srednje velikem podjetju (kot priporoËa Robbins, 2014) ter zagotovili, da se veËina pomembnega implicitnega znanja zapisuje in je na voljo kot eksplicitno znanje oz. kot baza znanja za hitrej.e in kakovostnej.e kasnej.e ponovitve razvoja no­vih izdelkov. S tem ko smo del procesa razvoja novega izdelka pustili v nestrukturirani obliki, smo hkrati omogoËili, da se ohrani fleksibilnost in agilnost razvoja, kot priporoËajo Leithold idr. (2016). 6 SKLEP V prispevku predstavljeni pristop smo oblikovali, ker je kljub prisotnosti velikega .tevila dobrih praks za velika podjetja zelo malo primerov najbolj.e pra­kse organizacijskega spreminjanja procesa razvoja novega izdelka pri tranziciji iz majhnega podjetja (t. i. obrtni.ke organiziranosti) v industrijsko obliko or­ganiziranosti v srednje velikem podjetju. V tovrstni transformaciji je trenutno v Sloveniji relativno veliko podjetij. Poudariti aelimo, da je v prispevku prikazani primer uporabe pristopa na specifiËnem podroËju, na katerem deluje konkretno podjetje. Primer nam je sluail predvsem za specifikacijo razlik in novitet novega pristopa v primerjavi z ae znanimi. Hkrati je treba poudariti, da je bil razvoj pristopa postopen in je bil doslej v razliËnih evolutivnih fazah veËkrat preizku.en v podobnih podjetjih. Ob upo.tevanju nadgradnje in postopne izbolj.ave ter rezultatov posameznih prenov lahko ovrednotimo predstav­ljeni pristop kot uËinkovit in zato kot pomembno metodolo.ko noviteto na tem podroËju. Ocenjujemo, da je pristop dovolj posplo.en, da ga je ob prilago­ditvah posebnostim konkretnega projekta mogoËe koristno uporabiti za prenavljanje in pomoË pri prilagajanju informacijske podpore razvojnih proce­sov v poljubnem srednje velikem podjetju. Z objavo prispevka aelimo spodbuditi nadaljnje raziskave in testiranja opisanega pristopa v drugih okoljih, kar bi lahko koristilo strokovnjakom v sred­nje velikih podjetjih pri re.evanju podobnih teaav. 7LITERATURA [1] APICS, (2014). PLCOR Product Lifecycle Operations Refe­rence Model, APICS Supply Chain Council. [2] Basu, S., Palvia P., Chen, L. (2003). Encyclopedia of Library and Information Science, Second Edition. [3] Drakos, N. (2014). How to Choose the Right Technology for a Knowledge Management Program. Gradivo dostopno na http://www.gartner.com. [4] FactBook.org (2015). Newness To Market. Gradivo dostopno na http://www.factbook.org. [5] Harmon, P. (2015). Once More on Business Process Metho­dologies. BPR Trends. Gradivo dostopno na http://www.bp­trends.com/bpt/wp-content/uploads. [6] Horie, N., in Ikawa, Y. (2014). Knowledge integration in a pro­duct development organization for new businesses: A case study of a precision device manufacturer. Management of En­gineering & Technology (PICMET), Portland International Confe­rence. [7] Kennet, K. (2013). The PDMA handbook of new product de­velopment (3. izd.). Hoboken, New Jersey: John Wiley & Sons Inc., 34. [8] Kern, T. (2003). The model of dynamic adaptation of business structures to changing processes. V: Palvia, Prashant (ur.). Proceedings of the Fourth Annual Global Information Techno­logy Management World Conference, Calgary, Alberta, Cana­da, June 8, 9, 10, 2003. Greensboro (NC): Global Information Technology Management Association, 278‡281. [9] Kern, T. (1998). Procesna organizacija: oblikovanje organizaci­je poslovnih sistemov na osnovi modela strukturiranih organi­zacijskih procesov. Doktorska disertacija. Univerza v Maribo­ru, Fakulteta za organizacijske vede Kranj, 202. [10] Kokalj, ©. (2012). Mehanizem za ocenjevanje strukturne uËin­kovitosti procesov. Magistrsko delo, Univerza v Mariboru, Fa­kulteta za organizacijske vede Kranj. [11] Leithold, N., Woschke, T., Haase, H., Kratzer, J. (2016). Opti­mising NPD in SMEs: a best practice approach. Benchmar­king: An International Journal, 23, 262‡284. [12] McAfee, A. (2002). The impact of enterprise information te­chnology adoption on operational performance: An empirical investigation. Production and Operations Management, 11, 33‡53. [13] Morris, M. (2012). Advanced Product Quality Planning and Control Plans based on APQP. 2nd Edition. ASQ Automotive Division. [14] PetroviE, D., JovanoviE, P., RakoviE, R. (2010). Upravljanje projektnim rizicima. Udruaenje za upravljanje projektima Sr­bije. Beograd, 239. [15] Poetz, M. K., in Schreier, M. (2012). The Value of Crowdsour­cing: Can Users Really Compete with Professionals in Gene­rating New Product Ideas?. The Journal of Product Innovati­on Management. [16] PoliËar, M. (2008). Organizacijska kultura v druainskih podje­tjih. Diplomsko delo. Univerza v Mariboru, Fakulteta za orga­nizacijske vede Kranj. [17] Rajasekaran, K. G., Bhaskar, G. B., Murali, S., Chandrasekaran, [22] Sosa, E. M., Gargiulo, M., Rowles, C. (2015). Can Informal Com- M. (2016). Identification and Prioritisation of Supplier, Customer munication Networks Disrupt Coordination in New Product De- and Organization Collaborating Factors Influencing New Pro­ velopment Projects?. Organization Science, 4, 1059-1078. duct Development. Indian Journal of Applied Research, 7. [23] Stevenson, W. J. (2015). Operations Management. 12th Editi­ [18] Robbins, P. (2014). How having an innovation strategy and on. McGraw-Hill, New York, 236‡262. process can improve NPD outcomes for Irish SME’s. The XXV [24] Urh, B. (2011). Predvidevanje uspe.nosti poslovnega sistema ISPIM Conference ‡ Innovation for Sustainable Economy & z vidika obvladovanja uËinkovitosti poslovnih procesov. Dok- Society, Dublin. torska disertacija. Univerza v Mariboru, Fakulteta za organi­ [19] Roblek, M., Kern, T., Zajec, M. (2012). Knowledge manage­ zacijske vede Kranj. ment of the new product development process with process­ [25] Urh, B., in Kern, T. (2015). Is the structural efficiency of bu­ -knowledge allocation model. V: The 6th IEEE International siness processes connected to the effectiveness. Internati- Conference on Management of Innovation and Technology, onalization and cooperation: proceedings of the 34th Inter- Sanur Bali, Indonesia. ICMIT 2012, 214‡219. national Conference on Organizational Science Development. [20] Roblek, M., in Kern, T. (1998‡2016). ARIS procesni repozitoriji Moderna organizacija. Kranj, 1221‡1230. podjetij. LIPPS ‡ Laboratorij za inaeniring poslovnih in pro­ [26] ZGD (2016). Zakon o gospodarskih druabah. Gradivo dostop­ dukcijskih sistemov, Univerza v Mariboru, Fakulteta za orga­ no na https://zakonodaja.com/zakon/zgd-1/55-clen-mikro­ nizacijske vede. Interno gradivo. -majhne-srednje-in-velike-druzbe. [21] Sinderman, B. (2012). Three Things Mid-Sized Companies Do [27] Woschke, T., Haase, H., Lautenschläger, A. (2016). Waste in Better. Forbes. Gradivo dostopno na http://www.forbes.com/ NPD processes of German SMEs. International Journal of sites/forbesinsights/2012/04/20/three-things-mid-size-com- Productivity and Performance Management, 4, 532‡553. panies-do-better. • Matjaa Roblekje zaposlen naFakulteti za organizacijske vede Univerzev Mariboru kot visoko.olski uËitelj. Habilitiranjev naziv docent za podroËje inaeniring poslovnih in delovnih sistemov. Pedago.ko delo opravlja pri predmetih Poslovni in proizvodni informacijski sistemi, Menedament oskrbovalne verige ter Planiranjein vodenjeproizvodnje.Vsodelovanjuz gospodarstvomima konËanihveËkot .estdeset raziskovalnihin aplikativnihprojektovspodroËjaprenovein informatiziranosti poslovnihprocesov.Je avtorali soavtorveËkotsto znanstvenih,strokovnihindrugih publikacij.Trenutnojepredsednik akademskega zbora Fakultete za organizacijske vede. • TomaaKernje zaposlennaFakultetizaorganizacijskevede Univerzev Mariborukot visoko.olski uËitelj. Habilitiranjev nazivredniprofesorzapodroËjeorgani­zacijskih in informacijskih sistemov. Pedago.ko delo opravlja pri predmetih na dodiplomski in podiplomski stopnji. Je avtor ali soavtor veË kot .tiristo petdeset znanstvenihin strokovnih Ëlankovindrugih publikacij.Je vodjaveË raziskovalnihprojektovinËlan raziskovalnihskupinvraziskovalnihprojektih. Aktivno sodeluje priprenosu raziskovalnega znanjavprakso.Meddrugimjebilprodekanza raziskovalne zadeve,predstojnik in.tituta,Ëlan upravnega odbora univerze,prorektor za informatiko.Trenutnoje Ëlan senata univerze. Znanja in sposobnosti podatkovnih znanstvenikov:pregled in analiza stanjav Sloveniji 1MatejaGrobelnik, 2Jurij JakliË 1Petrol, d. d., Dunajska cesta 50, 1000 Ljubljana 2Univerzav Ljubljani, Ekonomska fakulteta, Kardeljeva plo.Ëad 17, 1000 Ljubljana mateja.grobelnik@gmail.com; jurij.jaklic@ef-uni-lj.si IzvleËek Masovne podatkein znanosto podatkih so organizacijeprepoznale kot vira novih konkurenËnihprednosti.Znamenom izkori.Ëanja tega potenci­ala se je poveËalo povpra.evanje po posameznikih s specifiËnimi znanji in sposobnostmi, ki so sposobni iz mnoaice raznolikih podatkov pridobiti koristne informacijeinjihna razumljiv naËin implementirativ obstojeËeprocesein aktivnostivorganizaciji,pot.i. podatkovnih znanstvenikih.Z neprestanim razvojempodroËja znanostio podatkihinob raznolikihpotrebahpo analitiËnih znanjih prihajado razliËnega razumevanjavlogepodat­kovnih znanstvenikov, hkratipa se veËa vrzel med ponudboin povpra.evanjempo tak.nih posameznikih. Namen prispevkaje zato prispevatik bolj.emu razumevanju ter opredelitvi znanja in sposobnosti podatkovnih znanstvenikov, s pomoËjo raziskave v Sloveniji pa ugotoviti trenutna znanja in sposobnosti ter identificirati segmente podatkovnih znanstvenikov v Sloveniji. Na podlagi razvr.Ëanja v skupine samoocene znanj je bilo identificiranih in opisanih pet skupin:traenjski raziskovalci analitiki, podatkovni analitiki, raziskovalci, programerji in podatkovni znanstveniki, skupaj s priporoËili za njihov nadaljnji razvoj. KljuËne besede: masovni podatki, znanost o podatkih, podatkovni znanstvenik, sposobnosti, znanja, razvr.Ëanje v skupine, empiriËna raziskava. Abstract Knowledge and Skills of Data Scientists: Overview and Analysis of Current Situation in Slovenia Bigdataanddata sciencehavebeenrecognizedbyorganizationsassourcesofanew competitive advantage.Inordertoexploittheis potential, therehasbeenanincreaseindemandfor individualswithspecificknowledgeandskillswhtarecapableofobtainingusefulinformationfromaset of diversedataand implementitinto existingprocessesand activitiesinanorganization,thatieso-calleddata scientists.Duetothe continuous development of the data science field and the diverse needs for analytical knowledge, the understanding of the role of data scientists deviates greatly, while the gap between supply and demand for such individuals is also increasing. Therefore, the objective of this paper is to contribute to a better understanding and definition of the knowledge and skills of data scientists, and to identify the current knowledge and skills together with the segmentsof data scientists through empiricalresearchin Slovenia. Five segments were identified and described: “Marketingresearchers‡ analysts”, “Data analysts”, “Researchers”, “Developers«and “Data Scientists”, together withrecommendationsfor their future development. Keywords: big data, data science, data scientist, skills, knowledge, clustering, empiricalresearch. UVOD Stro.kovno uËinkovito shranjevanje podatkov, konvergenca pametnih naprav, druabenih omreaij, .irokopasovnih komuni­kacij in analitike so na novo definirali odnose med proizvajal­ci, distributerji ter potro.niki izdelkov in storitev, hkrati pa ustvarili nove izzive in priloanosti. Olofson in Vesset (2012) to konvergenco imenujeta inteligentna ekonomija. Sama zmoanost shranjevanja in dostop do podatkov namreË nista dovolj, .ele ko imamo moanost podatke analizirati in na pod­lagi rezultatov sprejemati bolj.e odloËitve, ustvarjamo kon­kurenËno prednost (Olofson in Vesset, 2012).PoveËali smo si moanosti zajema veliko veËje koliËine podatkov razliËnih tipov,ki nastajajoz veliko hitrostjo. Ti podatki prihajajo iz razliËnih (ne)zaupanja vrednih virov, ki lahko organizaciji prinesejo dodano vrednost. Navedeni koncepti se povezujejo s pojmo­ma masovni podatki (angl. big data) in znanost o po­datkih (angl. data science). »e so se na eni strani po­veËale moanosti zbiranja in shranjevanja podatkov, so se po drugi strani razvile tudi nove tehnologije na podroËju strojne in programske opreme za analizo in obdelavo veËje koliËine podatkov. Skupaj z razvojem tega podroËja se je pojavila potreba po specifiËnih znanjih, s pomoËjo katerih je mogoËe iz velike koliËine razliËnih podatkov prido­biti uporabne informacije za izbolj.anje poslovnih odloËitev. Kot enega glavnih izzivov pri uvajanju strategije masovnih podatkov in znanosti o podatkih navajajo pomanjkanje posameznikov s specifiËnimi znanji in sposobnostmi ustvarjanja dodane vrednosti s pomoËjo manipulacije s podatki (Big Data Execu­tive Survey, 2012). Na podlagi te potrebe po novih znanjih s podroËja analitike masovnih podatkov se poveËuje povpra.evanje po podatkovnih znanstve­nikih (angl. data scientists). Raziskava MGI in McKinsey’s Business Technolo­gy Office (Manyika idr., 2011) napoveduje, da bo do leta 2018 samo v ZDA nastala od 50­do 60­odstotna vrzel med ponudbo in povpra.evanjem po poglob­ljenem analitiËnem znanju, torej pomanjkanje od 140.000 do 190.000 posameznikov z naprednimi zna­nji na podroËju statistike ali strojnega uËenja in 1,5 milijona menedaerjev in analitikov s sposobnostmi uporabe analitike masovnih podatkov za sprejema­nje uËinkovitih odloËitev. »eprav so analizo opravili v ZDA, menijo, da bo pomanjkanje poglobljenega analitiËnega talenta svetovni trend. Draave z vi.jim .tevilom posameznikov s poglobljenim analitiËnim znanjem na prebivalca bodo v prihodnosti privlaËen vir teh sposobnosti za druga geografska podroËja prek migracije ali prek zaposlitev v organizacijah. Po Gartnerju so napovedali, da bo do leta 2015 4,4 milijona delovnih mest na podroËju informatike po svetu namenjenih podpori delu z masovnimi podat­ki (Chordas, 2014, str. 23). Povpra.evanje zajema vse od inaenirjev masovnih podatkov (angl. big data en­gineer), podatkovnih analitikov (angl. data analyst) do poslovnih analitikov (angl. business analyst). Naj­veËji izziv pa naj bi bilo najti podatkovne znanstveni­ke, saj gre za posameznike, ki imajo kljuËno vlogo pri uporabi masovnih podatkov: podatke priskrbijo in jih uporabijo za poslovne odloËitve (Chordas, 2014, str. 23). V sklopu raziskave New Vantage Partners Big Data Executive Survey (2012, str. 8) so ugotovili, da ima kar 70 odstotkov vpra.anih odloËevalcev v organizacijah na podroËju masovnih podatkov na­men zaposliti podatkovne znanstvenike, vendar jih 80 odstotkov meni, da je to zanje velik izziv. Namen prispevka je zato prispevati k razumeva­nju ter opredelitvi znanja in sposobnosti podatkovnih znanstvenikov, s pomoËjo raziskave med podatkov­nimi znanstveniki v Sloveniji pa ugotoviti trenutna znanja in sposobnosti ter z uporabo razvr.Ëanja v skupine identificirati segmente podatkovnih znan­stvenikov v Sloveniji. Z opredelitvijo masovnih po­datkov, prek procesa izvajanja znanosti o podatkih ter s pregledom literature in raziskav so bile identificira­ne razliËne sposobnosti in podroËja znanj podatkov­nih znanstvenikov. 92 posameznikov v Sloveniji, ki se veËino Ëasa ukvarjajo s podatki, je izpolnilo strukturi­ran spletni vpra.alnik, ki je vkljuËeval vpra.anja, po­vezana z dimenzijami masovnih podatkov, samooce­no znanj, pomembnostjo znanj in sposobnosti, njiho­vimi dosedanjimi izku.njami ter naËini izobraaevanja. Z uporabo razvr.Ëanja v skupine so bili identificirani segmenti podatkovnih znanstvenikov. V drugem razdelku je predstavljen koncept ma­sovnih podatkov in znanosti o podatkih. V nada­ljevanju so opredeljena znanja in sposobnosti po­datkovnih znanstvenikov, ki so bili uporabljeni pri oblikovanju vpra.alnika. Tretji razdelek vkljuËuje metodologijo empiriËne raziskave o znanjih in spo­sobnostih podatkovnih znanstvenikov v Sloveniji, znaËilnosti vzorca ter rezultate raziskave. Na koncu so podane sklepne ugotovitve. 2 MASOVNI PODATKIIN ZNANOSTOPODATKIH 2.1 Opredelitev masovnih podatkov Posamezniki in organizacije z vsakodnevnim delova­njem danes ustvarimo veË podatkov kot kadar koli do sedaj. Podatki nastajajo povsod: na druabenih me­dijih (angl. social media), kot so Twitter, Facebook, LinkedIn, Instagram itd., spletnih straneh, ob izvedbi nakupnih transakcij, ob aktivaciji GPS signalov mo­bilnih telefonov, z uporabo RFID znaËk, na mobilnih aplikacijah, in prav vse te podatke je mogoËe shraniti v digitalni obliki. Masovni podatki danes veljajo za popularen trend, ki se v bistvu nana.a predvsem na problem volumna/hitrosti/raznolikosti podatkov (angl. Volume/Velocety/Variety problem). Glavna prednost masovnih podatkov je, da lahko s pomoËjo analize le­teh pridobimo zanimive vzorce in informa­cije, ki so bili poprej skriti, saj jih zaradi velike koliËine dela in Ëasa ni bilo mogoËe pridobiti. Sedaj pa jih lah­ko uporabimo za analizo, sprejemanje odloËitev ter razvoj novih produktov, kar pomeni znatno konku­renËno prednost (Lorica, Howard in Dumbill, 2012). Zaradi dejstva, da pojem masovni podatki in vse, kar dojemamo pod strategijo vpeljave masovnih po­datkov, vpliva in zajema .irok nabor poslovnih pro­cesov, tehnologij in strokovnih znanj, lahko na izraz masovni podatki gledamo v oajem in .ir.em smislu. »e na izraz gledamo v oajem smislu, gre predvsem za opredelitev tega, kak.ne znaËilnosti morajo ime­ti podatki, da jih lahko opredelimo kot masovne. VeËina definicij masovnosti podatkov ne povezuje le s koliËino podatkov (volumen), temveË so enako pomembne tudi druge dimenzije podatkov: hitrost, s katero nastajajo podatki, raznolikost virov/struk­ture podatkov ter vrednost podatkov (najpogosteje omenjene). Volumen kot dimenzija masovnih podatkov se nana.a na velike koliËine podatkov, ki se dejansko tudi shranijo, saj so se stro.ki shranjevanja podatkov obËutno pocenili (npr. danes lahko shranimo celotno svetovno zalogo glasbe na napravo v vrednosti 500 dolarjev) (Dhar, 2013, str. 67). Glavna prednost je, da lahko s pomoËjo veËjih vzorcev, ki so bolj.i pribliaek populaciji, gradimo bolj natanËne napovedne mo­dele. VeËanje nabora podatkov pomeni izziv ob­stojeËim tradicionalnim strukturam informacijskih tehnologij, saj masovni podatki zahtevajo raz.irljivo skladi.Ëenje in porazdeljen pristop k poizvedovanju. Re.itve so na voljo v obliki podatkovnih skladi.Ë ali re.itev, ki izhajajo iz Apache Hadoop (Lorica, Ho­ward in Dumbill, 2012). Hitrost se nana.a na vedno veËjo stopnjo hitro­sti, s katero pridobivamo podatke. Pomembnost di­menzije hitrosti masovnih podatkov leai v hitrosti povratne zanke. To pomeni, da je treba delovati in ukrepati na podlagi podatkov v realnem Ëasu. Bolj tesna je zanka, veËja je konkurenËna prednost (Lori­ca, Howard in Dumbill, 2012). Tehnologija dimenzije hitrosti masovnih podatkov sega od paketne obde­lave (angl. batch processing) ob doloËenih interva­lih do konstantnega toka podatkov (angl. streaming data) v realnem Ëasu (Olofson in Vesset, 2012, str. 5). Raznolikost podatkov lahko opredelimo z vidika veË razliËnih dimenzij. Podatki so lahko opredelje­ni z vidika podatkovnega tipa (strukturirani, delno strukturirani in nestrukturirani ipd.), vira pridobitve (notranji, zunanji) ter izvora (generirajo jih naprave ali Ëlovek) (Hayes, 2014a). Bistvo tretje dimenzije ma­sovnih podatkov, tj. raznolikosti podatkov, je v tem, da lahko kljub razliËnim virom, razliËnemu izvo­ru in nestrukturiranosti podatkov iz njih izlu.Ëimo Slika 1: Ogrodje za opredelitev raznolikost podatkov Vir:B.E.Hayes,Thewhatandwhereofbigdata:Adata definition framework,2014a. urejeno znanje, ki ga lahko uporabi Ëlovek ali pa ga uporabimo kot vhodne podatke v aplikacijo (Lorica, Howard in Dumbill, 2012). Slika 1 prikazuje ogrod­je za opredelitev raznolikosti podatkov po Hayesu (2014a). Model razloËuje tip podatkov od vira pri­dobitve podatkov. Stolpca predstavljata tip podat­kov (strukturirani ali nestrukturirani), vrstice pa vir pridobitve podatkov (zunanji ali notranji). Podatki so tako lahko razporejeni v enega od .tirih kvadran­tov, pri Ëemer je nadaljnja razdelitev narejena .e na ravni izvora podatkov (ki jih generirajo naprave ali Ëlovek). Vrednost podatkov se nana.a na stro.ke tehnolo­gije in na vrednost, ki jo lahko pridobimo iz masov­nih podatkov. Stro.ki so pomembni predvsem zato, ker pomenijo kljuËni faktor novosti v masovnih podatkih. Kombinacija razpoloaljive programske opreme in niaanje cen strojne opreme je povzroËi­la, da so tehnologije laaje dostopne. Vrednost ma­sovnih podatkov lahko opredelimo z niajimi stro.ki kapitala (programske in strojne opreme ter infra­strukture), operativno uËinkovitostjo (niaji stro.ki dela zaradi uporabe bolj uËinkovitih metod za inte­gracijo, menedament, analizo in dostavo podatkov) in izbolj.anjem poslovnih procesov (poveËanje pri­hodkov ali dobiËka na raËun novih ali bolj.ih naËi­nov poslovanja, vkljuËujoË izbolj.ave v komercial­nih transakcijah, trajnem menedamentu skupnosti in primerni distribuciji socialnih, zdravstvenih in izobraaevalnih storitev) (Olofson in Vesset, 2012, str. 6). Kako kvantificirano opredeliti volumen, hitrost in raznolikost, povzema klasifikacija po IDC (Vesset idr., 2012, str. 2), prikazana v sliki 2. V sklop trga ma­sovnih podatkov se vkljuËuje podatkovne baze (ne glede na to, ali gre za relacijske ali ne), ki presegajo 100 TB, ki so implementirane na raz.irljivi arhitek­turi in ki vsebujejo podatke iz dveh ali veË virov/ podatkovnih tipov ali ko je stopnja hitrosti zbiranja podatkov zelo visoka. Podobno lahko za masov­ne opredelimo podatkovne baze, katerih koliËina je sicer manj.a kot 100 TB, vendar je letna stopnja ra­sti generiranih podatkov 60­odstotna ali veË, poleg tega so implementirane na raz.irljivi infrastrukturi in vkljuËujejo podatke dveh ali veË tipov/virov, ali ko je stopnja hitrosti zbiranja podatkov zelo visoka (Vesset idr., 2012, str. 2). Na podlagi opisanih dimen­zij lahko ugotovimo, da lahko podatke opredelimo kot masovne v oajem smislu takrat, ko ustrezajo vsaj dvema od treh dimenzij masovnih podatkov (vo­lumen, hitrost, raznolikost), vendar vedno z name­nom prina.anja vrednosti (Ëetrta dimenzija) organi­zaciji v obliki niajih stro.kov, veËje uËinkovitosti ali izbolj.anja poslovnih procesov. Iz opisanih znaËilnosti masovnih podatkov lah­ko ugotovimo tudi, da ni dovolj, da jih le opredeli­mo. Treba jih je shraniti, imeti moanost dostopa do njih ter znanja, sposobnosti in orodja, da jih lahko Slika 2: Kriteriji za opredelitev masovnih podatkov po IDC Vir:D.Vesset idr., WordlwideBig DataTechnology and Services 2012-2016Forecast., 2012, str.2, slika1. ustrezno obdelamo in rezultate obdelav uporabimo za sprejemanje bolj.ih odloËitev. Zaradi omenjene veËdimenzionalnosti podatkov in novega pristopa k obdelavi je oËitno, da masovni podatki potrebu­jejo nov pristop, novo strojno in programsko opre­mo ter druge spremembe, povezane z organizacijo, kulturo in sprejemanjem odloËitev. Masovni podatki tako v .ir.em smislu po IDC (Vesset idr., 2012, str. 1) .predstavljajo novo generacijo tehnologij in arhitek­turnih re.itev, katerih namen je pridobiti ekonomsko vrednost iz velike koliËine razliËnih tipov podatkov s pomoËjo visoko intenzivnega shranjevanja, raz­iskovanja in analize teh podatkov«. Tudi Boyd in Crawford (2012) v Ëlanku Critical questions for Big Data, objavljenem v Information, Communications and Society Journal, definirata masovne podatke kot kulturni, tehnolo.ki in znanstveni fenomen, ki temelji na prepletanju tehnologije (maksimiziranje raËunalni.ke moËi in natanËnosti algoritmov za zbi­ranje, povezovanje in primerjavo velikega nabora podatkov), analize (zmoanost iz velikega nabora po­datkov identificirati vzorce z namenom, da pridobi­mo ekonomsko, tehniËno, druabeno ali pravno pred­nost/odloËitev) in mitologije (splo.no raz.irjenega spoznanja, da veliki nabori podatkov zagotavljajo vi.jo stopnjo inteligence in znanja, ki lahko ustvarijo vpoglede, ki so bili prej nemogoËi, v duhu resnice, natanËnosti in objektivnosti). 2.2 Znanosto podatkih Ravno v .ir.em smislu razumevanja masovnih po­datkov so ti tesno povezani s podroËjem znanosti o podatkih. PodroËje znanosti o podatkih predstavlja re.itev, kako odkriti potencialne vpoglede, ki se skri­vajo v masovnih podatkih, in kako premostiti izziv volumna/hitrosti/raznolikosti/vrednosti masovnih podatkov (Voulgaris, 2014, str. 15). Masovni podatki predstavljajo gonilo sprememb na podroËjih zbiranja, shranjevanja, menedamenta, analiziranja in vizualiza­cije podatkov. Vendar pa masovni podatki potrebujejo znanost o podatkih z namenom, da (Somohano, 2013): • na podlagi podatkov odkrijemo, Ëesar ne vemo, • pridobimo napovedni vpogled v podatke, na pod­lagi katerega lahko sprejemamo bolj.e odloËitve, • ustvarimo nove izdelke in storitve na podlagi podatkov (angl. data products), ki imajo takoj.en vpliv na poslovanje, • komuniciramo uspe.ne poslovne zgodbe na pod­lagi podatkov, • gradimo zaupanje v sprejemanje odloËitev, ki prina.ajo poslovno vrednost. Definicije znanosti o podatkih danes veËinoma govorijo o interdisciplinarnem podroËju ‡ kombina­ciji znanj in sposobnosti z razliËnih podroËij za ob­delavo (masovnih) podatkov. Stanton (2013, str. ii) opredeli znanost o podatkih kot nastajajoËe podroËje delovanja, ki se ukvarja z zbiranjem, pripravo, ana­lizo, vizualizacijo, menedamentom in ohranitvijo ve­likega nabora informacij. »eprav znanost o podatkih najbolj tesno povezujemo s podroËjem baz podatkov in informatiko, je potrebnih .e veliko drugih znanj in sposobnosti. O’Reilly (Lorica, Howard in Dumbill, 2012) definira znanost o podatkih kot disciplino, ki kombinira znanja iz matematike, programiranja in znanosti. Raziskava Big data executive survey (2012, str. 8) pa je znanost o podatkih opredelila kot discipli­no, ki zdruauje uporabo razliËnih stopenj statistike, podatkovne vizualizacije, raËunalni.kega programi­ranja, podatkovnega rudarjenja, strojnega uËenja in arhitekture podatkovnih baz z namenom re.evanja kompleksnih podatkovnih problemov. 3 ZNANJA IN SPOSOBNOSTI PODATKOVNIH ZNANSTVENIKOV 3.1 Podatkovni znanstveniki Vedno veËja vloga informacijsko­komunikacijskih tehnologij in konvergenca razliËnih znanstvenih di­sciplin, kot so matematika in statistika ter tudi nara­voslovne in druabene vede z informatiko, pomenita po Organizaciji za ekonomsko sodelovanje in razvoj (v nadaljevanju OECD) (2015, str. 261) pomemben trend v poklicih, povezanih s podatki. Ta konvergen­ca je omogoËila tudi pojav novega razreda podatkov­nega strokovnjaka ‡ podatkovnega znanstvenika ‡, katerega naziv .e ni v celoti sprejet, vendar ga razliËni avtorji uporabljajo za opis .nove« discipline, katego­rije dela oziroma karierne poti, katere pomembnost raste skupaj z masovnimi podatki (OECD, 2015, str. 261). OECD (2015, str. 254) hkrati opozarja, da trenut­no tudi .e ne obstaja splo.no sprejeta definicija znanj in sposobnosti podatkovnih znanstvenikov. Rivera in Haverson (2014) prav tako omenjata, da trenutno .e ni standarda glede uporabe nazivov podatkovni znanstvenik in drugih nazivov, povezanih s podatki (podatkovni analitik, podatkovni rudar, podatkovni inaenir, statistik, analitik ipd.), ki bi jasno razloËeval med razliËnimi vlogami. Vzroki za slabo definicijo tega podroËja so povezani s tem, da gre za relativ­no nova podroËja, ki v literaturi niso .e dobila dovolj pozornosti v primerjavi z drugimi informacijsko­ko­munikacijskimi znanji in sposobnostmi, ter s tem, da se podroËje .e vedno razvija (OECD, 2015, str. 254). Thomas H. Davenport in D. J. Patil sta v Ëlanku Har­vard Business Review: Data Scientist: The Sexiest Job of the 21st Century definirala podatkovne znanstve­nike kot posameznike, ki uporabljajo tako podatke kot znanost, da ustvarijo nekaj novega (Davenport in Patil, 2012). Podobno definicijo je podal Voulga­ris (2014, str. 18): podatkovni znanstveniki so posa­mezniki, ki poi.Ëejo smisel v masovnih podatkih. S pomoËjo uporabe visoko naprednih tehnologij, znanj in sposobnosti izpeljejo uporabne informacije iz ma­sovnih podatkov, po navadi v obliki novega izdelka ali storitve na podlagi podatkov (angl. data product). Znanja in sposobnosti podatkovnih znanstveni­kov med drugim izhajajo iz osnovne smeri izobraz­be, delovnih nalog, znaËilnosti in odgovornosti de­lovnega mesta, na katerem dela posameznik, ter dru­gih dejavnikov. Zavedati se je treba, da posamezniki, ki se v veËji meri ukvarjajo z znanostjo o podatkih, lahko opravljajo delo analitika, programerja, vodje, menedaerja, profesorja, svetovalca, podjetnika itd. Za ilustracijo obseanosti podroËja je Granville (2013) zbral 115 razliËnih nazivov delovnih mest, neposre­dno povezanih z masovnimi podatki ali znanostjo o podatkih na podlagi 7500 kontaktov na LinkedInu. Posamezniki z omenjenimi nazivi se lahko v razliËni meri ukvarjajo z znanostjo o podatkih: od popolno­ma operativnih nalog v procesu znanosti o podat­kih do vodstvenih poloaajev, ki zahtevajo dodatna znanja in sposobnosti. Vsem navedenim nazivom strokovnjakov na podroËju podatkov je skupno to, da delo s podatki zavzema veËinski delea njihovega dela (OECD, 2015, str. 255). Slika 3 prikazuje, kako lahko naziv podatkovni znanstvenik zajema .irok spekter nazivov in vlog v procesu znanosti o podatkih prek aivljenjskega cikla vrednosti podatkov (angl. data value cycle) (OECD, 2015, str. 255). Nazivi vkljuËujejo vloge, ki zbirajo podatke (skrbniki baz podatkov, skrbniki podatkov, vnosni referenti ali naËrtovalci baz podatkov), ana­lizirajo podatke s pomoËjo analitike (statistiki, ak­tuarji, znanstveniki, analitiki), ter do doloËene mere tak.ni, ki sprejemajo odloËitve na podlagi podatkov (menedaerji, inaenirji) (OECD, 2015, str. 254). Zbiranje podatkov Analiza podatkov in OdloËanje programska oprema Skrbniki in vloge, povezane z zbiranjem podatkov Podatkovni analitiki OdloËevalci Skrbniki baz podatkov Skrbniki podatkov Vnosni referenti NaËrtovalci baz podatkov Statistiki Aktuarji Znanstveniki Analitiki Menedaerji Inaenirji Slika 3: Fazev aivljenjskem ciklu vrednosti podatkovv povezavis kljuËnimi tipi podatkovnih znanstvenikov Vir:OECD, Data-driven innovation:Big Data forGrowth andWell-Being, 2015, str. 255, slika 6.5. Podatkovni znanstvenik je zato v tem prispev­ku opredeljen kot strokovnjak, ki se veËino svojega Ëasa ukvarja s podatki, pri Ëemer uporablja razno­lika znanja in sposobnosti z veË razliËnih znanstve­nih podroËij z namenom, da iz surovih (masovnih) podatkov prek znanosti o podatkih pridobi dodano vrednost. Na podlagi napisanega je kljuËno, da ima podatkovni znanstvenik ustrezna znanja in sposob­nosti, da lahko izpelje vse faze procesa znanosti o podatkih: od pridobivanja podatkov do konËne vi­zualizacije ali novega izdelka/storitve na podlagi podatkov. Za bolj podroben pregled in razumevanje pod­roËja dela, ki ga opravlja podatkovni znanstvenik, je v nadaljevanju predstavljen osnovni okvir za proces izvajanja znanosti o podatkih (prirejeno po O’Neill in Schutt, 2013, str. 36‡41; Voulgaris, 2014, str. 133‡149; Somohano, 2013; The field guide to data science, 2015, str. 29‡33), ki je prikazan na sliki 4. Kot je razvidno iz prikaza (slika 4), so faze med seboj cikliËno prepletene. To pomeni, da si osnovne faze sicer sosledno sledijo, hkrati pa nekatere pred­stavljajo tudi korak, v katerem podatkovni znanstve­nik sprejme odloËitev, ali naj ponovi kak.no prej.njo fazo ali nadaljuje z naslednjo. Faza priprave podatkov je verjetno najbolj Ëa­sovno zahtevna in najmanj zanimiva faza v procesu znanosti o podatkih. Vendar gre za zelo pomemben korak, saj ta faza predstavlja temelj za vse nadaljnje korake v procesu. Faza priprave podatkov vkljuËuje zbiranje, procesiranje in Ëi.Ëenje podatkov. Podatki v osnovi izhajajo iz realnega sveta, v katerem po­samezniki in organizacije izvajamo svoje aktivnosti (uporabljamo Facebook, Twitter, opravljamo spletne nakupe, po.iljamo elektronsko po.to, pregledujemo spletne strani, opravljamo telefonske pogovore ipd.). S pomoËjo shranjevanja teh aktivnosti v obliki podat­kov podatkovni znanstvenik pridobi doloËen nabor surovih podatkov (transakcije, kliki na spletne po­vezave in dnevni.ke datoteke, podatki iz senzorjev, mobilnih telefonov, dokumenti, elektronska po.ta, zapisi na druabenih medijih). Te podatke je treba naj­prej pregledati in preËistiti, da bodo primerni za ana­lizo. Podatkovni znanstvenik lahko pri pripravi po­datkov uporabi razliËne naËine procesiranja podat­kov: Hadoop Definition File System (v nadaljevanju HDFS) za shranjevanje podatkov za nadaljnje anali­ze, Extract Transform Load (v nadaljevanju ETL) in MapReduce za branje podatkov, redukcijo dimenzij, vzorËenje, zdruaevanje (angl. joining), strganje (angl. Slika 4: Proces izvajanja znanostio podatkih Vir:C.O’NeillinR.Schutt,DoingData Science,2013,str.41,slika2-2. scraping) ali me.etarjenje (angl. wrangling). Za pro­cesiranje podatkov ae obstajajo razliËna programska orodja, kljub temu pa mora podatkovni znanstvenik podatke pripraviti v .JSON ali v katerem drugem po­dobnem tipu podatkov. »e so podatki v popolnoma unikatnem tipu, mora podatkovni znanstvenik na­pisati lastni program za dostop in prestrukturiranje podatkov v obliko, ki bo razumljiva sistemom za bra­nje podatkov. Pri branju velike koliËine podatkov je priporoËljivo, da najprej pripravimo poskusno branje na relativno majhnem naboru podatkov. S tem po­datkovni znanstvenik zagotovi, da bo konËni nabor podatkov lahko uporaben za naËrtovane analize. V sklopu priprave podatkov podatkovni znanstvenik izvede tudi Ëi.Ëenje podatkov, ki zahteva doloËeno raven razumevanja podatkov. Pri Ëi.Ëenju podatkov zapolni manjkajoËe vrednosti, preveri relevantnost podatkov in izloËi podatke, ki vkljuËujejo napaËne ali problematiËne podatke, izvede normalizacijo po­datkov ter preveri neodvisnost podatkov. »i.Ëenje podatkov vkljuËuje tudi obdelavo osamelcev (angl. outliers). Te lahko iz nabora podatkov odstranimo ali pa prilagodimo model, da ustreza obstoju osamel­cev. OdloËitev temelji na podlagi razliËnih faktorjev, kot so .tevilo osamelcev, podatkovni tip podatkov in obËutljivost modela na njihov obstoj. Za Ëi.Ëenje in transformacijo podatkov podatkovni znanstvenik uporablja razliËna orodja ali programske jezike, kot so Python, R skripte, poizvedbeni jezik SQL ali vse na.tete. PriporoËljivo je, da si podatkovni znanstve­nik posamezne korake te faze shrani za primer, Ëe jih bo treba ponoviti ali jih opisati v poroËilu. Rezultat faze priprave podatkov je strukturirana oblika po­datkov, pripravljena za nadaljnje analize. Preden se podatkovni znanstvenik loti modeli­ranja, je potrebna izvedba t. i. raziskovalne analize podatkov (angl. Exploratory Data Analysis ‡ v na­daljevanju EDA). Raziskovalna analiza podatkov je kljuËni del procesa izvajanja znanosti o podatkih in je primarno namenjena predvsem samemu podat­kovnemu znanstveniku. Gre za sistematiËen pre­gled podatkov s prikazom distribucij spremenljivk, transformacijo podatkov, iskanjem potencialnih po­vezav med spremenljivkami z uporabo razsevnih grafikonov in z generiranjem opisnih statistik za te spremenljivke (srednje vrednosti, mere razpr.enosti, identifikacija osamelcev). Pri raziskovalni analizi ne gre le za uporabo orodij, temveË tudi za razumevanje odnosa podatkovnega znanstvenika do podatkov, ki jih analizira. »e aeli podatke razumeti, mora pridobi­ti intuicijo, razumeti oblike in povezati razumevanje procesa, kako so bili podatki pridobljeni, s samimi podatki. Na podlagi rezultatov raziskovalne analize podatkov lahko podatkovni znanstvenik ugotovi, da podatki dejansko niso ustrezni zaradi podvojenih, manjkajoËih, neustreznih vrednosti, ali da podatki sploh niso bili zajeti ali pa so bili zajeti napaËno. V tem primeru se mora podatkovni znanstvenik po­novno vrniti k viru podatkov in zbrati veËjo koliËino podatkov ali veË Ëasa nameniti Ëi.Ëenju podatkov. To je lahko iterativen proces, dokler podatki niso ustrez­ni in primerni za modeliranje. V fazi uËenja iz podatkov podatkovni znanstve­nik pripravi model, ki predstavlja poskus razume­vanja in predstavitve narave realnosti z doloËenega (matematiËnega) vidika. Gre za umetno ustvarjen konstrukt, v katerem so odstranjene vse odveËne podrobnosti. Podatkovni znanstvenik oblikuje mo­del z uporabo razliËnih orodij s podroËij statistike in strojnega uËenja: opisne statistike in statistiËnega sklepanja, klasifikacije in segmentacije, regresijske analize in napovedovanja. Izbira modela je odvisna od vsebine problema, ki ga obravnava podatkovni znanstvenik. Lahko gre za klasifikacijski problem, napovedni problem ali osnovni opisni problem. Podatkovni znanstvenik v zadnji fazi ugotovitve interpretira, pripravi vizualizacije in poroËila ter re­zultate na ustrezen naËin predstavi nadrejenim in so­delavcem ali jih objavi v publikaciji. Namen znanosti o podatkih je namreË doloËiti in razumeti, kaj vse se skriva pod povr.jem in kak.no uporabno vrednost lahko prinese do konËnih uporabnikov. Proces zna­nosti o podatkih je ponavljajoË se razvojni proces, ki vkljuËuje odkrivanje in uËenje na podlagi podatkov. Vizualizacija vkljuËuje grafiËno predstavo pomena analiziranih podatkov na intuitiven, zanimiv in re­levanten naËin do konËnega uporabnika, ki je lah­ko tudi interaktiven. S pomoËjo vizualizacije lahko podatkovni znanstvenik pridobi bolj.o predstavo, Ëesa .e ne ve, in lahko tako bolje razume omejitve modelov, vrednost podatkov in bolje obvladuje ne­gotovost v podatkih. Cilj analize je alternativno lahko tudi izgradnja prototipa na podlagi analizi­ranih podatkov (angl. data product). Novi izdelek ali storitev, ki temelji na kombinaciji podatkov in algoritmov, je dodana vrednost organizaciji. Primeri tak.nih izdelkov ali storitev na podlagi podatkov so klasifikator nezaaelene elektronske po.te, algoritem za rangiranje spletnih strani v spletnih iskalnikih z relevantnimi rezultati na podlagi spletnega iskanja, sistem za priporoËanje (angl. recommendation sy­stem), mreana statistika in grafikoni, ki jih LinkedIn prikazuje svojim uporabnikom, ali geografski infor­macijski sistem, kot je MapQuest, ki potro.nikom daje uporabne geografske informacije o doloËeni lo­kaciji. Tisto, kar razlikuje znanost o podatkih od sta­tistike, je, da se tak.en .podatkovni produkt« vgradi nazaj v realni svet, v katerem potro.niki interaktivno uporabljajo produkt, kar poslediËno generira veË po­datkov, ki podatkovnemu znanstveniku omogoËajo izbolj.ave tega produkta. 3.2 Znanja in sposobnosti podatkovnih znanstvenikov 3.2.1 Znanja podatkovnih znanstvenikov Veliko razliËnih tehnologij in tehnik je bilo razvitih in prilagojenih z namenom zdruaevanja, manipulira­nja, analiziranja in vizualizacije masovnih podatkov (Manyika idr., 2011, str. 27). Seznam znanj trenutno ne daje celostnega pogleda na znanja podatkovnih znanstvenikov, saj se metode in orodja neprestano razvijajo z namenom re.evanja vedno novih proble­mov (Manyika idr., 2011, str. 27). Prav tako razliËni problemi zahtevajo uporabo razliËnih tehnik in teh­nologij z razliËnih podroËij glede na naravo problema in cilje projekta. Pri opredelitvi znanj podatkovnih znanstvenikov so bila ta na podlagi literature, raz­iskav in izku.enj razporejena v skupine po nasled­njih podroËjih: znanstvena metoda, programiranje, menedament podatkov, baze podatkov, statistika, ma­tematika, strojno uËenje ter domenska znanja s pripa­dajoËimi tehnikami. Iz nabora znanj so bile izkljuËene opredelitev znanj, vezane na specifiËne programske re.itve (SPSS, SAS, Orange, RapidMiner, Weka, Table­au, Excel itd.), saj so te bolj tehnolo.ko orodje, s kate­rim podatkovni znanstvenik izvede doloËeno fazo v znanosti o podatkih. Poleg tega bi to lahko pristran­sko vplivalo na rezultate, saj bi bili ti vezani na popu­larnost in dostopnost posameznega orodja. Znanstvena metoda v naj.ir.em smislu vkljuËuje vse postopke in tehnike za objektivno raziskovanje pojavov (To. in Hafner­Fink, 1998). Hayes (2014b) verjame, da znanstvena metoda predstavlja kljuËno vlogo v razumevanju katerih koli podatkov, ne glede na njihovo velikost, hitrost ali raznolikost. Podatki namreË ne .govorijo« sami zase, temveË jim pomen dajo ljudje prek ustvarjanja, zbiranja in interpretacije podatkov. Ljudje pa so na aalost tudi vir (namerne ali nenamerne) pristranskosti, ki lahko poslab.a ka­kovost podatkov (Hayes, 2014b). NaËrtovanje po­skusov/eksperimentov (angl. experimental design) je raziskovalna tehnika, ki se uporablja v vzroËnem raziskovanju (angl. causal research) za vzposta­vljanje vzroËno­poslediËnega odnosa med spre­menljivkami (Malhotra, 2012, str. 221). Podatkovni znanstvenik naj bi v sklopu naËrtovanja poskusov poznal koncepte neodvisnih, odvisnih in zunanjih spremenljivk, testnih enot in nakljuËne razdelitve na poskusno in kontrolno skupino. Pri izvedbi poskusa podatkovni znanstvenik namreË doloËi testne enote in naËin, kako so te enote razdeljene na homogene podskupine, doloËi, katere neodvisne spremenljiv­ke bo spreminjal, manipulira eno ali veË neodvisnih spremenljivk in nato opazuje in meri uËinke teh spre­memb na odvisne spremenljivke, ob tem pa preverja vpliv zunanjih ali tujih spremenljivk (Malhotra, 2012, str. 222‡223). Zagotavljanje ponovljivosti raziskav (angl. reproducible resarch) pomeni kljuËni koncept znanstvene metode. VkljuËuje koncepte in orodja, ki jih uporablja podatkovni znanstvenik, da lahko znanstvene ugotovitve objavi skupaj s podatki, viri podatkov, programsko kodo ter podrobnimi navodili za izvedbo analize podatkov z namenom, da je raz­iskavo mogoËe ponoviti, bolje razumeti ali preveriti njeno veljavnost (Kuhn, 2015). Z znanjem programiranja lahko podatkovni znanstvenik pokrije celotni proces izvajanja znano­sti o podatkih ‡ kadar koli lahko napi.e program, ki pridobi podatke iz baze podatkov, zaaene algoritme strojnega uËenja na naboru podatkov (Ultimate skills checklist for your first data analyst job, 2015, str. 5), razvije produkt/storitev na podlagi podatkov ali pri­pravi vizualizacijo podatkov. PriporoËljivo je znanje vsaj enega ali veË programskih jezikov, ki so robustni, popularni in raz.irljivi ‡ sploh pri velikem naboru podatkov (Voulgaris, 2014, str. 53). PriporoËljivo je tudi, da ima podatkovni znanstvenik dober pregled nad podroËjem knjianic in paketov, povezanih s pro­gramskimi jeziki, ki se najpogosteje uporabljajo za izvajanje znanosti o podatkih (Ultimate skills check­list for your first data analyst job, 2015, str. 5). Med programske jezike, ki jih najbolj pogosto uporablja veË kot 90 odstotkov podatkovnih znanstvenikov, uvr.Ëamo R, SAS in Python (Piatetsky, 2014). Voul­garis (2014, str. 54) omenja tudi Java, C+, C# in Perl, ki so objektno orientirani jeziki (angl. object­oriented languages), katerih prednost je v tem, da omogoËa­jo enostavno ustvarjanje kompleksne programske kode. Proces znanosti o podatkih je mogoËe izva­jati tudi v drugih programskih jezikih: Julia, Scala, Stata, Hadoop programski jeziki (Pig Latin, HiveQL idr.), Java, Unix shell/awk/sed, MATLAB, C/C++, Perl, Octave, Ruby, Lisp/Clojure, F# itd. (Piatetsky, 2014). Znanja iz zalednega in Ëelnega programiranja se izkaaejo za koristna predvsem pri implementaciji produkta/storitve na podlagi podatkov v produk­cijsko okolje ‡ uporabni.ko aplikacijo. Podatkovni znanstvenik naj bi predvsem imel osnovna znanja kot podlago za komunikacijo in usklajevanje anali­tiËne re.itve z zalednim in Ëelnim razvijalcem. Podatkovni znanstvenik ima s svojim delovanjem in izvajanjem procesa znanosti o podatkih pregled, moanost in vpliv na obvladovanje podatkov, arhitek­turo, varnost, povezovanje, shranjevanje in kakovost podatkov ter druge vidike t. i. menedamenta podat­kov. Z ustreznimi znanji s podroËja menedamenta podatkov lahko podatkovni znanstvenik poveËa uËinkovitost in uspe.nost izvajanja procesa znanosti o podatkih. Menedament podatkov (angl. data ma­nagement) vkljuËuje in opisuje procese za naËrtova­nje, definiranje, kreiranje, pridobivanje, vzdraevanje, uporabo, arhiviranje, nadzor in integracijo podatkov (DAMA, 2014, str. 5). Po definiciji DAMA (2014, str. 10) se menedament podatkov deli na veË podroËij: obvladovanje podatkov (angl. data governance), menedament podatkovne arhitekture (angl. data arhitecture management), razvoj in oblikovanje po­datkov (angl. data modeling and design), shranje­vanje podatkov (angl. data storage and operations), menedament varnosti podatkov (angl. data security management), integracija in interoperabilnost po­datkov (angl. data integration and interoperability), menedament dokumentov in vsebine (angl. docu­ment and content management), menedament ma­tiËnih in referenËnih podatkov (angl. reference and master data management), menedament podatkov­nih skladi.Ë in poslovne inteligence (angl. data wa­rehousing and business intelligence management), menedament metapodatkov (angl. metadata mana­gement) ter menedament kakovosti podatkov (angl. data quality management). Oblikovanje informacij (vizualizacija) ‡ v sklopu znanj podatkovnega znan­stvenika govorimo o podpodroËju vizualizacije po­datkov, in sicer o podroËju vizualizacije/oblikovanja informacij (angl. information vizualization/design). Znanja iz oblikovanja informacij lahko podatkovni znanstvenik uporablja v veË razliËnih fazah izvajanja procesa znanosti o podatkih. V sklopu raziskovalne analize podatkov uporablja razliËne vizualizacijske tehnike z namenom razumevanja podatkov in njiho­vih zakonitosti ter identifikacije negotovosti v podat­kih (npr. gruËe primerov, osamelce, trende in relacije med spremenljivkami) (Leban, 2007, str. 2). Informa­cije oblikuje tudi z namenom razumevanja re.itev analize, domnev in algoritmov podatkovnega rudar­jenja (kjer je to mogoËe) ter za predstavitev rezultatov procesa znanosti o podatkih ali za kreiranje izdelka/ storitve, ki temelji na podatkih. .Glavna prednost uporabe vizualizacije je njena interpretabilnost ‡ od­krite zakonitosti lahko dejansko vidimo, zaradi Ëesar je njihovo razumevanje neprimerno bolj.e.« (Leban, 2007, str. 2) Podatkovni znanstvenik naj bi zato imel znanja iz celostnega pristopa k oblikovanju informa­cij, poznavanja posameznih vizualizacijskih metod in njihovih zakonitosti, izbire ustrezne vizualizacijske metode in znanja iz oblikovanja interaktivnosti (raz­voj interaktivnih re.itev, produktov in vmesnikov). Prva faza v procesu znanosti o podatkih je roËno pridobivanje, shranjevanje in Ëi.Ëenje podatkov v obliko, ki bo primerna za izvoz ali nadaljnje analize (Ultimate skills checklist for your first data analyst job, 2015, str. 12). Ta proces je v sklopu znanosti o podatkih znan kot me.etarjenje podatkov (angl. data wrangling, data munging, data scraping) (Ultimate skills checklist for your first data analyst job, 2015, str. 12). Gre za nalogo, ki podatkovnemu znanstve­niku lahko zavzame od 50 do 80 odstotkov njegove­ga Ëasa (Ultimate skills checklist for your first data analyst job, 2015, str. 12). Zaradi tega je pomembno, da ima podatkovni znanstvenik znanja, kako dosto­pati do podatkov, jih pridobiti, shraniti ter odpraviti nepopolnosti, za kar potrebuje znanja s podroËja baz podatkov. Med znanja s podroËja baz podatkov spa­dajo poznavanje sistemov baz podatkov, ki temeljijo na strukturiranih ali delno strukturiranih podatkih (centralni repozitorij za shranjevanje podatkov, kate­rih osnova je SQL), nestrukturiranih podatkih (baze podatkov, katerih osnova je NoSQL), masovnih in distribuiranih podatkih (Hadoop, MapReduce), po­izvedbenih programskih jezikov SQL, HiveQL ter osnovna znanja iz sistemske administracije. Podatkovni znanstvenik naj bi imel osnovno znanje iz statistike ter poznavanje doloËenih kon­ceptov in terminologije, ki jo uporabljajo statisti­ki (Granville, 2014, str. 4): metod vzorËenja, opisne statistike, verjetnostnih porazdelitev, statistiËnega preizku.anja domnev, redukcije dimenzij, analize Ëa­sovnih vrst, prostorske statistike ipd. Pri tem je pred­vsem pomemben vidik znanja in razumevanja, kdaj je doloËena tehnika primeren ali neprimeren pristop k problemu (Ultimate skills checklist for your first data analyst job, 2015, str. 7). Podatkovni znanstvenik naj bi bil sposoben prevesti besedne probleme v matematiËne izraze, re.evati enaËbe, manipulirati algebriËne izraze in imel naj bi osnovno znanje iz teorije matrik (Ultimate skills checklist for your first data analyst job, 2015, str. 9; Granville 2014, str. 4). Prav tako naj bi imel zna­nja, kako narisati grafikone za razliËne tipe funkcij z razumevanjem odnosa med grafiËno funkcijo in nje­no enaËbo. PriporoËljiva so tudi znanja odvodov in integralov, optimizacije in linearne algebre. Ta pod­roËja matematike so osnova za razumevanje strojne­ga uËenja in efektivnega manipuliranja podatkov v podatkovnih modelih (Ultimate skills checklist for your first data analyst job, 2015, str. 9). Strojno uËenje je poddomena raËunalni.tva (pod­roËja umetne inteligence), ki se ukvarja z zasnovo in razvojem algoritmov, ki omogoËajo raËunalnikom razvoj akcij na podlagi empiriËnih podatkov (Manyi­ka idr., 2011, str. 29). Poudarek strojnega uËenja je na avtomatiziranem uËenju in prepoznavi komple­ksnih vzorcev z namenom sprejemanja inteligentnih odloËitev na podlagi podatkov (Manyika idr., 2011, str. 29). Strojno uËenje je torej podatkovno intenzivni razvoj algoritmov (kot podatkovno rudarjenje) s po­udarkom na prototipiranju algoritmov za produkcij­sko okolje, za obdelavo velikih koliËin podatkov, na podlagi katerih je mogoËe narediti napovedi (angl. predict), klasifikacijo (angl. classify), segmentacijo (angl. cluster) in/ali izraËunati predloge za ukrepa­nje na podlagi obdelanih podatkov (Ultimate skills checklist for your first data analyst job, 2015, str. 10; O’Neill in Schutt, 2013, str. 52). Strojno uËenje se ukvarja tudi z razvojem avtomatiziranih sistemov (prepoznavanje slik, govora, algoritmi za generiranje ponudb, angl. bidding algorithms, algoritmi za tar­getirano ogla.evanje, angl. ad targeting algorithms), ki se samodejno osveaijo, neprestano preizku.ajo, ponovno uËijo in osveaujejo nabore podatkov za uËe­nje, preverjajo veljavnost in izbolj.ujejo ali odkrivajo nova pravila. Poddomena strojnega uËenja, zelo bli­zu umetni inteligenci (angl. artificial intelligence), je poglobljeno uËenje (angl. deep learning) (Granvil­le, 2014). Za podatkovnega znanstvenika ni nujno, da ustvarja popolnoma nove algoritme za strojno uËenje, vendar pa mora poznati najbolj pogoste al­goritme in tehnike za strojno uËenje, od zmanj.anja dimenzij (metoda glavnih komponent) do nadzo­rovanega (klasifikacija) in nenadzorovanega uËenja (razvr.Ëanje v skupine). Ni v celoti potrebno pozna­vanje teorije in podrobnosti implementacij v ozadju teh algoritmov. Je pa potrebno poznavanje prednosti in slabosti teh algoritmov, kot tudi, kdaj jih je smisel­no uporabiti glede na kontekst problema ter kdaj ne (O’Neill in Schutt, 2013, str. 54; Ultimate skills check­list for your first data analyst job, 2015, str. 10). Znanja poslovnega podroËja, dejavnosti ali dome­ne, iz katere izhaja problem, so izjemne vrednosti in zelo nenadomestljiva (The field guide to data scien­ce, 2015, str. 96). Poslovna oziroma domenska znanja vkljuËujejo poznavanje metod agilnega pristopa, pri­stopa Waterfall, razvoja izdelkov/storitev, razume­vanje delovanja organizacije, poznavanje dejavnosti, poznavanje dobrih praks metodologij podatkovnega rudarjenja (CRISP­DM, SEMMA, DMAIC) ter vsa druga poslovna znanja (finance, traenje, traenjsko raziskovanje, logistika, razvoj izdelka itd.), ki so re­levantna za organizacijo ali dejavnost (Voulgaris, 2014, str. 150). OmogoËajo poglobljeno razumevanje podatkov in dejavnikov, ki vplivajo na analitiËni cilj, velikokrat pa so kljuËni diferenciator uspeha celotne ekipe, ki se ukvarja z znanostjo o podatkih (The fi­eld guide to data science, 2015, str. 96). Domenska znanja vplivajo na to, kako podatkovni znanstvenik izbira lastnosti, pripisuje podatke, izbira algoritme, in posredno vplivajo tudi na uspe.nost projektov. Posameznik aal ne more biti domenski strokovnjak na vsakem podroËju. Zato se podatkovni znanstve­niki pogosto obraËajo na druge analitike, domenske strokovnjake ter druge sekundarne vire z namenom izgradnje razumevanja domenskega podroËja pro­blema (The field guide to data science, 2015, str. 96). 3.2.2 Sposobnosti podatkovnih znanstvenikov Znanja z razliËnih podroËij so pomembna, vendar niso dovolj. Znanost o podatkih zahteva bolj siste­matiËno razmi.ljanje ter kombiniranje kreativnega pristopa k definiranju in re.evanju problemov sku­paj z obvladovanjem Ëasa. Podatkovni znanstve­nik je posameznik, ki ga oznaËuje nabor specifiËnih znaËilnosti, sposobnosti in naËina razmi.ljanja, ne samo nabor znanj (Voulgaris, 2014, str. 37). Podatkovni zanstvenik naj bi bil predvsem rado­veden glede stvari, ki jih opazuje, kot so vzorci in od­nosi ter razmerja med razliËnimi znaËilnostmi (Voul­garis, 2014, str. 38). Radovednost je kljuËna, da lahko podatkovni znanstvenik razstavi problem in razi.Ëe odnose med podatki, ki na prvi pogled delujejo ne­povezani (The field guide to data science, 2015, str. 42). Radovednost dopolnjujejo disciplina, analitiËne sposobnosti in sposobnosti re.evanja problemov. To vkljuËuje vse ‡ od aelje po raziskovanju in razËlenitvi problema do zelo jasno definiranega nabora domnev, ki jih je mogoËe preveriti (Lorica, Howard in Dum­bill, 2012). Podatkovni znanstveniki re.ujejo pro­bleme uporabnikov podatkov. Vendar preden lahko re.ijo problem, ga je treba ustrezno identificirati, kar pa ni vedno lahko (Stanton, 2013, str. 14). Za pristop k problemu in re.evanju problemov sta kljuËni tudi eksperimentiranje in kreativnost ‡ sposobnost pogle­da na problem na razliËne, kreativne naËine, ki v pre­teklosti niso .e bili uporabljeni v tak.nem kontekstu (angl. thinking outside the box) (Chordas, 2014, str. 24; Lorica, Howard in Dumbill, 2012; The field guide to data science, 2015, str. 42). Pomembna sposobnost sta tudi fleksibilnost in osredotoËenost na cilj, ko je podatkovni znanstvenik sposoben premagati napa­ke, opustiti idejo, ki ne deluje, se iz tega nekaj nauËiti in poskusiti z novim pristopom. Znanost o podatkih je namreË serija .slepih ulic«, dokler prava pot ni identificirana. To zahteva unikaten set osebnostnih lastnosti ‡ potrpealjivost in vztrajnost (The field gui­de to data science, 2015, str. 42). Da podatkovni znanstvenik razume svojo vlogo in pomen, so pomembne tudi sposobnosti, poveza­ne z njegovo podjetno naravnanostjo, ki vkljuËuje­jo poslovni Ëut, prebrisanost (angl. cleverness) in vztrajnost (Granville, 2014, str. 3; Chordas, 2014, str. 23; Lorica, Howard in Dumbill, 2012). KljuËna sta tudi sposobnost sprejemanja odloËitev in pogum ‡ sposobnost podatkovnega znanstvenika, da izrazi svoje mnenje, poi.Ëe re.itev ter prepriËa in motivira menedaerje v smeri prave re.itve, vËasih tudi v na­sprotju z njihovo voljo, v dobro organizacije, uporab­nikov ali deleanikov (Granville, 2014, str. 4). Granvil­le (2014, str. 4) omenja, da bi podatkovni znanstvenik moral biti tudi strateg, tako v poslovnem smislu kot v tem, da je sposoben razviti strategijo zbiranja po­datkov z namenom pridobiti podlago za odloËitve, ki omogoËajo poslovni uËinek. Ko podatkovni znan­stvenik razvije razumevanje domenskega znanja, mora imeti sposobnost predstave, kako se podatki prena.ajo preko razliËnih sistemov in uporabnikov. Pri tem, opozarja Stanton (2013, str. 6), je potrebno, da podatkovni znanstvenik dovolj pozornosti name­ni kakovosti. Ne glede na nabor podatkov, ki jih ima­mo, ti ne bodo nikoli popolni. Podatkovni znanstve­niki morajo poznati omejitve podatkov, s katerimi delajo, znati morajo kvantificirati njihovo natanËnost in na podlagi analize podati predloge za izbolj.anje kakovosti podatkov v prihodnje (Stanton, 2013, str. 6). Zato je sposobnost naËrtovanja kljuËni vidik zna­nosti o podatkih, saj obstajajo razliËni naËini, kako se lotiti iste naloge, ki pa lahko imajo obËutno drugaËno porabo virov (Voulgaris, 2014, str. 27). Sposobnosti v povezavi s podroËjem vodenja pro­jektov in vodenja na splo.no so sposobnosti, ki bi jih posameznik moral imeti zaradi narave dela (predla­ganje izbolj.av, razvijanje strategij, komuniciranje z naroËniki, vodenje projektov ipd.) in dejstva, da po­datkovni znanstvenik ni le operativni izvajalec, tem­veË se pojavlja tudi na razliËnih vodstvenih poloaajih ali pa kot vodja oddelka, tima (OECD, 2015, str. 255). Podatkovni znanstvenik po navadi deluje v sklopu raznolike ekipe strokovnjakov z razliËnih podroËij (odvisno od dejavnosti). Zelo redko podatkovni znanstvenik dela popolnoma loËeno in samostoj­no v dalj.em Ëasovnem obdobju, saj se za re.evanje problema poveae s strokovnjaki, ki so na podroËju, s katerega izhaja problem, bolj izku.eni oziroma imajo veË znanja. Zato je pomembno, da ima podatkovni znanstvenik sposobnost dela v timu. Podatkovni znanstvenik mora biti fleksibilen in imeti sposobnost hitrega prilagajanja novemu poslovnemu podroËju, novim Ëlanov ekipe ali novim programskim orodjem (Voulgaris, 2014, str. 27). Ker imajo podatkovni znanstveniki po navadi po­globljena znanja iz vsaj enega znanstvenega podroËja (Lorica, Howard in Dumbill, 2012), kritiËno sposob­nost podatkovnega znanstvenika predstavlja preva­janje med tehniËnimi izrazi raËunalni.tva in statisti­ke ter slovarjem domenskega znanja menedamenta. Podatkovni znanstvenik mora zato imeti dobre komunikacijske sposobnosti. Pri tem pride do iz­raza predvsem sposobnost pripovedovanja zgodb (angl. storytelling), tj. sposobnost z uporabo podat­kov predstaviti zgodbo in jo uËinkovito prenesti razliËnim deleanikom (Lorica, Howard in Dumbill, 2012; Stanton, 2013, str. 5). Prednost za podatkovnega znanstvenika je, Ëe ima poleg odliËnih komunikacij­skih sposobnosti tudi obËutek za umetnost in prakso vizualizacije, kar pomeni, da je sposoben smiselno premostiti prepad med Ëlovekom in raËunalnikom s posredovanjem analitiËnih dognanj (Lorica, Howard in Dumbill, 2012; Stanton, 2013, str. 6). Stanton (2013, str. 6) kot pomembno sposobnost podatkovnega znanstvenika omenja tudi sposobnost biti etiËen oziroma razmi.ljati etiËno. »e so podat­ki dovolj pomembni, da se jih odloËimo zbirati, so po navadi dovolj pomembni, da lahko vplivajo na Ëlove.ka aivljenja. Podatkovni znanstveniki mora­jo razumeti etiËno odgovornost, povezano z zaseb­nostjo, in morajo biti sposobni ustrezno predstaviti omejitve z namenom prepreËiti zlorabo podatkov ali rezultatov analiz. Za podatkovnega znanstvenika je ne nazadnje pomembno tudi, da goji strast uËenja novih stva­ri in do dela, ki ga opravlja, ter da ima sposobnost .zaznavanja« podatkov (Granville, 2014, str. 4). Za­radi hitrega napredka tehnologij na podroËju ma­sovnih podatkov in znanosti o podatkih mora biti podatkovni znanstvenik sposoben hitrega uËenja ter hitrega sprejetja novih metod in orodij (Voulgaris, 2014, str. 27). Radovednost, aelja po raziskovanju, uËenju, strast in vztrajnost se zrcalijo na vseh vidi­kih aivljenja podatkovnega znanstvenika (Granville, 2014, str. 4; Lorica, Howard in Dumbill, 2012). RAZISKAVAOZNANJIHIN SPOSOBNOSTIH PODATKOVNIH ZNANSTVENIKOVVSLOVENIJI 4.1 Metodologija V raziskavi je sodelovalo 92 posameznikov iz Slo­venije, ki se veËino svojega Ëasa ukvarjajo s podat­ki. Vpra.alnik, pripravljen na podlagi pregleda teo­retiËnih izhodi.Ë ter ae izvedenih raziskav (Harris, Murphy in Vaisman, 2013; Hayes, 2015a; Swan, 2008), je bil sestavljen iz treh skupin vpra.anj, ki se nana.ajo na ugotovitve iz prej.njih razdelkov. Prva skupina vpra.anj se je nana.ala na posamezne dimenzije ma­sovnih podatkov: volumen, raznolikost, hitrost in vrednost (Piatetsky, 2015; The Emerging Big Returns on Big Data, 2013; Russom, 2011; Big Data Executive Survey, 2012). Druga skupina vpra.anj se je nana.ala na samooceno znanj ter oceno pomembnosti znanj in sposobnosti, predstavljenih v prej.njem razdel­ku, tretja skupina vpra.anj pa na pretekle izku.nje in pridobivanje znanj in sposobnosti prek razliËnih naËinov izobraaevanja (Harris, Murphy in Vaisman, 2013). Zadnji sklop vpra.anj je vkljuËeval demo­grafska vpra.anja ‡ spol, starost, stopnja in smer izobrazbe. Za zbiranje podatkov je bila uporabljena metoda spletnega anketiranja s pomoËjo strukturira­nega vpra.alnika. V vpra.alniku so bile uporabljene razliËne merske lestvice: nominalna, ordinalna in in­tervalna. Pri vpra.anjih v drugem sklopu je bila upo­rabljena petstopenjska Likertova lestvica. Pri doloËe­nih vpra.anjih je bila dodatno omogoËena moanost .ne vem«. VzorËni okvir v tem primeru ne obstaja, saj ni popolnega seznama posameznikov, ki se v Sloveni­ji veËino svojega Ëasa ukvarjajo s podatki oziroma s katerim od naslednjih podroËij: analitika, statistika, matematika, programiranje, menedament podat­kov, raziskovanje ali pa so vodje tak.nih ekip. K iz­polnitvi vpra.alnika so na podlagi dostopnih infor­macij, preteklih izku.enj, sodelovanj in poznanstev bili povabljeni posamezniki iz razliËnih organizacij: In516ht, d. o. o., Petrol, d. d., Institut Joaef Stefan, Stu­dio Moderna, d. o. o., Spar Slovenija, d. o. o., Si.Mobil, d.d., Zavarovalnica Triglav, d.d., ADD, d.o.o., Zavaro­valnica Maribor, d. d., Mercator, d. d., Kendu, d. o. o., Ekipa2, d. o. o., Javni holding Ljubljana, d. o. o., D.Labs, d. o. o., Adriatic Slovenica, d. d., Nova lju­bljanska banka, d. d., Zavod za pokojninsko in inva­lidsko zavarovanje Slovenije, IBM Slovenija, d. o. o., Ektimo, d. o. o., Revelo, d. o. o., Hekovnik, Arhea Solutio, d. o. o., Valicon, d. o. o., In.titut za razis­kovanje trga in medijev Mediana, d. o. o., Droga Kolinska, d. d., itd. Vpra.alnik je bil objavljen tudi na skupini Big Data Developers in Data Science Slo­venia ter na Facebook strani UdomaËena Statistika. Povabilu k raziskavi je bila dodana tudi pro.nja za posredovanje vpra.alnika drugim primernim po­sameznikom. Metoda vzorËenja je bilo namensko priloanostno vzorËenje, saj so bili k izpolnjevanju vpra.alnika povabljeni le posamezniki iz Slovenije, ki so ustrezali predhodno doloËenim kriterijem (ukvar­janje s podatki oziroma ukvarjanje z vnaprej doloËe­nim podroËjem dela). Izpolnjevanje vpra.alnika je potekalo od 26. 4. do 21. 5. 2016. Vpra.alnik je v celoti izpolnilo 94 oseb; 47 oseb pa je vpra.alnik izpolnilo le delno, zato so bili izloËeni iz analize. Rezultati an­kete so bili ustrezno zakodirani v podatkovno bazo s 94 enotami in 126 spremenljivkami. Pri pregledu po­datkov se je izkazalo, da dve enoti nista bili primerni za analizo, saj sta vsebovali preveliko .tevilo neod­govorjenih vpra.anj. KonËni nabor enot za analizo je zajemal 92 enot. Podatki so bili zbrani s pomoËjo spletnega orodja 1ka.si. Za analizo podatkov in vizu­alizacijo rezultatov sta bila uporabljena SPSS Statisti­cs, verzija 21, in MS Excel 2010. Pri analizi podatkov so bile uporabljene metode opisnih statistik za prikaz rezultatov in znaËilnosti vzorca, parametriËni in ne­parametriËni testi za preverjanje domnev ter metode multivariatne analize (razvr.Ëanje v skupine, algori­tem K­means) za identifikacijo skupin podatkovnih znanstvenikov glede na samooceno znanj. V raziskavi je sodelovalo 92 anketirancev; 59,8 od­stotka jih je bilo mo.kega, 40,2 odstotka pa aenskega spola. Prevladovali so anketiranci mo.kega spola. NajveËji delea anketirancev je pripadalo starostni skupini od 26 do 35 let (51,1 odstotka). Mlaj.i od 18 let ni bil nihËe, 1,1 odstotka anketirancev je bilo v starostni skupini od 18 do 25 let, 51,1 odstotka v sta­rostni skupini od 26 do 35 let, 35,9 odstotka v staro­stni skupin od 36 do 45 let, 10,9 odstotka v starostni skupini od 46 do 55 let in 1,1 odstotka v starostni skupini 56 let in veË. NajveËji delea anketirancev je imel univerzitetno izobrazbo (50 odstotkov). Sledili so anketiranci z magisterijem, doktoratom ali speci­alizacijo (28,3 odstotka) ter anketiranci s poklicno ali .tiriletno srednjo .olo (13 odstotkov). Najmanj je bilo anketirancev z vi.jo ali visoko .olo (8,7 odstotka). V vzorec niso bili zajeti anketiranci s stopnjo izobrazbe osnovna .ola ali manj. NajveËji delea anketirancev je kot svojo prevladujoËo smer izobrazbe navedlo raËunalni.tvo (26,1 odstotka), sledita ekonomija in poslovne vede (19,6 odstotka), splo.no druaboslovje (15,2 odstotka), druge naravoslovne ali tehniËne vede (14,1 odstotka), statistika (9,8 odstotka) in ma­tematika (8,7 odstotka). En anketiranec je kot smer izobrazbe navedel fiziko (1,1 odstotka). Pri razvr.Ëanju v skupine so bile kot relevantne spremenljivke vzeti odgovori na vpra.anja, pove­zana s samooceno znanj. Udeleaenci so pri petem vpra.anju ocenjevali svojo stopnjo znanja z razliËnih podroËij znanj. Pri tem je bila uporabljena interval­na lestvica od 1 ‡ Ne poznam (ne uporabljam/ne ustreza mojemu podroËju dela), 2 ‡ Osnovno pozna­vanje (osnovno znanje, fokus je na izobraaevanju), 3 ‡ ZaËetnik (znanje pripravnika, fokus je na pridobi­vanju izku.enj na praktiËnih primerih), 4 ‡ Srednji nivo (samostojna kompetentna uporaba, fokus je na izbolj.anju znanja) do 5 ‡ Napredni nivo (poglobljena znanja in kompetence, fokus je na re.evanju strokov­nih problemov). Pri preverjanju korelacij med spre­menljivkami je bilo ugotovljeno, da sta edini spre­menljivki, ki visoko korelirata med seboj, nadzoro­vano strojno uËenje in nenadzorovano strojno uËenje (Pearsonov korelacijski koeficient = 0,924). Korelacija med vsemi ostalimi spremenljivkami je bila manj.a kot 0,9. Zaradi navedenega je bila iz nadaljnje anali­ze izpu.Ëena spremenljivka nenadzorovano uËenje. Preostale spremenljivke (30) so bile .e vedno dobra podlaga za razvr.Ëanje v skupine. Cronbach alpha za preverbo notranje konsistentnosti za 30 spremen­ljivk in velikost vzorca n = 83 (toliko udeleaencev je v celoti odgovorilo na vsa vpra.anja, povezana s sa­mooceno znanj) je zna.al 0,931, kar pomeni visoko stopnjo notranje konsistentnosti za spremenljivke, merjene na tej lestvici, in za ta specifiËni vzorec. Ker je .lo za majhen vzorec in ker konËno .tevilo skupin ni bilo poznano vnaprej, je bilo najprej izve­deno hierarhiËno razvr.Ëanje v skupine. Kot mero podobnosti oziroma razliËnosti med skupinami je bila uporabljena kvadratna evklidska razdalja s standardiziranimi spremenljivkami. Za metodo razvr.Ëanja v skupine je bila izbrana Wardova meto­da. Na podlagi hierarhiËnega razvr.Ëanja v skupine, pregleda dendograma in izraËuna VRC Calinski in Harabasz sta bili za nadaljevanje analize upo.tevani razvrstitvi v .tiri ali pet skupin. V naslednjem ko­raku je bilo izvedeno nehierarhiËno razvr.Ëanje v .tiri in pet skupin s K­means algoritmom. Pri upo­rabi K­means algoritma so bile kot izhodi.Ëne vred­nosti upo.tevane povpreËne ocene, pridobljene iz hierarhiËnega razvr.Ëanja v .tiri in pet skupin. Na podlagi kvalitativne primerjave razvr.Ëanja v .tiri in pet skupin je bilo ugotovljeno, da je razvr.Ëanje v pet skupin identificiralo doloËeno podmnoaico enot znotraj skupine C1 pri razvr.Ëanju v .tiri skupine, ki predstavlja drugaËen in zanimiv nabor znanj, kot skupina C2 pri razvr.Ëanju v pet skupin. Z razvrstit­vijo v pet skupin se je tudi zmanj.ala variabilnost znotraj skupin, vendar se je na ta raËun poveËalo .tevilo osamelcev v skupini C2. Zaradi vsega nave­denega je bila kot najbolj primerna izbrana razvrsti­tev v pet skupin. 4.2 Diskusija Na podlagi vzorËnih podatkov in rezultatov analize podatkov v nadaljevanju predstavljamo ugotovitve po posameznih raziskovalnih vpra.anjih. Analiza rezultatov v Sloveniji je interpretirana in analizirana prek primerjave z rezultati veË raziskav, ki so se nana.ale na razliËne dimenzije masovnih podatkov. Dimenzija koliËine/volumna podatkov je primerjana z rezultati raziskave Kdnuggets.com (Pi­atetsky, 2015), dimenzija raznolikosti z rezultati razi­skave The Emerging Big Returns on Big Data (2013), dimenzija hitrosti z rezultati raziskave TDWI Big Data Analytics (Russom, 2011, str. 19) ter dimenzija vrednosti z rezultati raziskave Big Data Executive Survey (2012, str. 5). Na podlagi rezultatov raziskave KDnuggets. com (Piatetsky, 2015) glede najveËjega obdelanega nabora podatkov po geografskih podroËjih najveËji delea posameznikov, ki obdeluje podatke v TB ali PB, prihaja iz Zdruaenih draav Amerike in Kanade (26,6 odstotka). Evropa je na Ëetrtem mestu z 20,7 od­stotka posameznikov, ki so obdelali TB podatkov ali veË. V Evropi so drugaËe kot najveËji obdelan nabor podatkov najveËkrat (60 odstotkov) izbrali podatke v velikosti GB, manj kot 20 odstotkov pa jih obdeluje podatke velikosti MB. Rezultati iz raziskave v Sloveniji (slika 5) so po­kazali, da je pribliano 25 odstotkov udeleaencev kot najveËji volumen podatkov, s katerim so se ukvar­jali, izbralo TB ali PB, kar je v primerjavi z raziska­vo KDnuggets.com (Pieatetsky, 2015) bolj na ravni Zdruaenih draav Amerike in Kanade. Udeleaenci raziskave v Sloveniji so kot najveËji volumen podat­kov najveËkrat (44,6 odstotka) izbrali podatke od 1 do 2023 GB. Rezultat je sicer niaji kot delea v razi­skavi Kdnuggets.com, vendar .e vedno lahko sprej­memo sklep, da se udeleaenci raziskave v Sloveniji najveË ukvarjajo z obdelavo podatkov velikosti GB. Prosim, oznaËite, kak.na je bila najveËja koliËina/volumen podatkov, s katero ste se vi osebno do sedaj ukvarjali (pridobivanje, obdelava, analiza, odloËanje). (n = 92) Do 1923 KB ali manj Od 1 MB do 1023 MB Od 1 GB do 1023 GB Od 1 TB do 1023 TB Od 1 PB ali veË Ne vem V raziskavi The Emerging Big Returns on Big Data (2013, str. 19) so ugotovili, da je v organizaci­jah v Evropi povpreËno ocenjeni delea strukturira­nih podatkov 50 odstotkov, delno strukturiranih je 25 odstotkov, 25 odstotkov pa je nestrukturiranih podatkov. PovpreËno ocenjeni delea nestrukturira­nih podatkov je najvi.ji v azijsko­pacifi.ki regiji, kjer zna.a 34 odstotkov. PriËakovalo se je, da bo raziska­va v Sloveniji pokazala podobne rezultate, in sicer da se bo pribliano 25 odstotkov udeleaencev ae ukvarja­lo z nestrukturiranimi podatki. 44,6 % Rezultati raziskave v Sloveniji (tabela 1) so poka­zali, da se je 100 odstotkov udeleaencev ae ukvarjalo s strukturiranimi podatki, kar je priËakovano, saj so v raziskavi sodelovali posamezniki, ki se ukvarjajo s podatki. Bolj zanimiv je podatek, da se je 50 odstot­kov udeleaencev raziskave ae ukvarjalo z nestruk­turiranimi podatki, kar je vi.je kot priËakovano. Kot nestrukturirani podatki so se upo.tevali vsi nestruk­turirani podatki (besedilo, avdio, video, slike), gene­rirani s strani Ëloveka. Tabela 1:Raznolikost podatkov glede na dimenzijo (n = 92) Dimenzija Delea (v %) Podatki, generirani s strani naprav 96,7 Podatki, generirani s strani Ëloveka 79,3 Notranji viri 97,8 Zunanji viri 47,8 Strukturirani podatki 100,0 Nestrukturirani podatki 50,0 Na podlagi raziskave The Emerging Big Returns on Big Data (2013, str. 20) so ugotovili, da je v organi­zacijah v Evropi povpreËno ocenjeni delea podatkov, pridobljenih iz notranjih virov, 68 odstotkov, iz zuna­njih virov pa 32 odstotkov. PovpreËno ocenjeni delea podatkov, pridobljenih iz zunanjih virov, je najvi.ji v azijsko­pacifi.ki regiji, kjer zna.a 38 odstotkov. Re­zultati raziskave v Sloveniji so pokazali, da se je 97,8 odstotka udeleaencev ae ukvarjalo s podatki iz no­tranjih virov, kar je priËakovano, saj so v raziskavi sodelovali posamezniki, ki se ukvarjajo s podatki, ki veËinoma izvirajo iz notranjih virov organizacije. S podatki iz zunanjih virov pa se je sreËalo ae skoraj 48 odstotkov udeleaencev raziskave, kar je vi.je kot 32 odstotkov iz raziskave The Emerging Big Returns on Big Data (2013, str. 20). Zanimivo je, da obstaja doloËen delea posameznikov (2,2 odstotka), ki se ukvarja s podatki izkljuËno iz zunanjih virov. Kot podatke iz zunanjih virov smo upo.tevali vse struk­turirane in nestrukturirane podatke (besedilo, avdio, video, slike), generirane s strani Ëloveka ali naprave, ki so pridobljeni iz zunanjih virov organizacije. Rezultati obeh raziskav sicer niso v celoti primer­ljivi, saj so v raziskavi The Emerging Big Returns on Big Data (2013) spra.evali po stanju tipov/virov podatkov v organizacijah, v raziskavi v Sloveniji pa smo spra.eval posameznike o tem, ali so se ae sreËali z razliËnimi tipi, viri podatkov. Vseeno je bila razi­skava The Emerging Big Returns on Big Data (2013) uporabljena kot moana primerjava stanja uporabe razliËnih tipov/virov podatkov. Razlog za razliko v primerjavi z raziskavo, izvedeno v tujini, je lah­ko tudi izbor (namensko priloanostno vzorËenje) in velikost vzorca (92 enot), vkljuËenega v raziskavo v Sloveniji. Na podlagi raziskave TDWI Big Data Analytics (Russom, 2011, str. 19) .tiri odstotke analiz v orga­nizacijah opravljajo, izvajajo ali ponovno izvajajo v realnem Ëasu, .tiri odstotke na nivoju ure, pet odstot­kov vsakih nekaj ur, 24 odstotkov dnevno, 14 odstot­kov tedensko, 35 odstotkov meseËno in 15 odstotkov letno. Delea udeleaencev, ki so v raziskavi v Sloveniji oznaËili, da so se ae ukvarjali s podatki v realnem Ëasu, je bil 47,8 odstotka. Vseeno je pred primerjavo podatkov med raziskavama treba upo.tevati, da je .lo za drugaËen vzorec in da obstaja moanost, da so udeleaenci raziskave v Sloveniji neustrezno razumeli definicijo podatkov v realnem Ëasu, kar predstavlja tudi pomembno omejitev raziskave. Na podlagi raziskave Big Data Executive Survey (2012, str. 5) organizacije uporabljajo masovne po­datke za .irok nabor namenov. Kot dve najbolj izpo­stavljeni prednosti uporabe masovnih podatkov so najveËkrat izbrali bolj.e odloËanje na podlagi dejstev (22 odstotkov) in izbolj.anje izku.nje potro.nika/ uporabnika (22 odstotkov). Sledi poveËanje prodaje/ prihodkov (15 odstotkov), inovacije na podroËju iz­delkov in storitev (11 odstotkov), zmanj.anje tveganja (11 odstotkov), bolj.a kakovost izdelkov in storitev (10 odstotkov) ter bolj uËinkovito izvajanje procesov (10 odstotkov). Rezultati raziskave v Sloveniji so po­kazali (slika 6), da so udeleaenci raziskave kot glavno korist, ki jo dosegajo z delom s podatki, prav tako iz­brali bolj.e odloËanje na podlagi dejstev (82,6 odstot­ka). Sledi izbolj.anje izku.nje potro.nika/uporabnika oziroma bolj.e razumevanje potro.nika (72,2 odstot­ka), kar se ujema z rezultati iz zgornje raziskave. Razlike se pojavijo .ele pri drugih koristih, saj so udeleaenci v Sloveniji kot tretjo korist izbrali bolj uËinkovito izvajanje procesov, naËina dela, opera­cij (66,3 odstotka) in poveËanje prodaje/prihodkov (66,3 odstotka), medtem ko se je moanost bolj uËin­kovito izvajanje procesov v zgornji raziskavi pojavilo .ele na zadnjih mestih. V Sloveniji so najmanjkrat iz­brali inovacije na podroËju izdelkov in storitev (39,1 odstotka), medtem ko je ta opcija v zgornji raziskavi bila med prvimi .tirimi. Rezultati raziskave so pokazali, da se doloËeni posamezniki v Sloveniji z vidika dimenzije volumna (TB ali veË), raznolikosti (vse dimenzije podatkov) in vrednosti podatkov (bolj.e odloËitve na podlagi dejstev) dejansko ukvarjajo z masovnimi podatki v oajem smislu. Hkrati pa je bilo z analizo samoocen znanj (v nadaljevanju) ugotovljeno, da so ravno znanja s podroËja tehnologije masovnih podatkov (masovni in distribuirani podatki, sistemi baz podat­ Prosim, oznaËite, s kak.nimi nameni se vi osebno ukvarjate z obdelavo podatkov oziroma katere otipljive koristi menite, da dosegate preko dela s podatki. (n = 92) Boljše odloèanje na podlagi dejstev. 82,6 % Izboljšanje izkušnje potrošnika/uporabnika oziroma 72,8 % boljše razumevanje potrošnika. Bolj uèinkovito izvajanje procesov, naèina dela, 66,3 % operacij. Poveèanje prodaje/prihodkov. 66,3 % Boljša kakovost izdelkov ali storitev. 59,8 % Zmanjšanje tveganja. 51,1 % Inovacije na podroèju izdelkov in storitev. 39,1 % Drugo: zaznavanje trendov 2,2 % Slika 6: Vrednost podatkov (n = 92) kov ‡ baze podatkov NoSQL) v povpreËju najslab.e ocenjena (povpreËna ocena je bila okrog 2 ‡ osnove). Zanimivo je bilo, da so tudi z vidika pomembnosti znanj omenjena znanja iz tehnologije masovnih po­datkov slabo ocenjena (povpreËna ocena pomemb­nosti je bila okrog 2). Sklepamo lahko, da se v Slo­veniji posamezniki ukvarjajo z masovnimi podatki v oajem smislu, vendar pri tem ne uporabljajo tehnolo­gij masovnih podatkov oziroma teh tehnologij .e ne uporabljajo v tolik.ni meri, kot so ae sprejete v tujini. Sloveniji ter katera znanja in sposobnosti so pomembna pri njihovem delu? Analiza rezultatov v Sloveniji je delno interpretirana in analizirana preko primerjave z rezultati raziskave Hayesa (2015a). Raziskava Hayesa (Hayes, 2015a, str. 2‡4) o znanjih in sposobnostih podatkovnih znan­stvenikov ter delovanju v timih je pokazala, da so so­delujoËi v povpreËju izrazili vi.jo stopnjo samoocene na naslednjih podroËjih: komunikacija, strukturirani podatki, podatkovno rudarjenje, znanost/znanstve­na metoda, matematika, menedament projektov, menedament podatkov ter statistika in statistiËno modeliranje. V povpreËju pa so niajo stopnjo samo­ocene dodelili podroËjem: sistemska administracija, Ëelno in zaledno programiranje, procesiranje narav­nega jezika (NLP), masovni in distribuirani podatki ter menedament podatkov v oblaku (Hayes, 2015a, str. 2). Na podlagi podatkov iz raziskave v Sloveniji je bilo ugotovljeno, da so posamezniki v Sloveniji v povpreËju najvi.jo samooceno znanj (slika 7) dode­lili znanjem s podroËij baz podatkov (SQL, relacijske baze podatkov, menedament podatkov), statistike (opisna statistika in verjetnostne porazdelitve ter regresija), domenskih znanj (poslovna znanja, speci­fiËna znanja s podroËja, s katerega izhaja problem) ter oblikovanja informacij. Zanimivo je, da so v sklopu posameznikov, ki se veËino svojega Ëasa ukvarjajo s podatki, med najbolj pomembnimi (slika 8) poslovna znanja, oblikovanje informacij in specifiËna znanja s posameznega podroËja. PriËakovati bi bilo, da bodo pomembna predvsem znanja iz statistike, baz podat­kov ali druga znanja. Razlog verjetno leai v tem, da je rezultate analiz obdelave podatkov treba predsta­viti jasno, enostavno in vizualno privlaËno, da bodo razumljivi tudi ostalim deleanikom, in seveda z na­menom, da prina.ajo poslovno vrednost, za kar pa so potrebna poslovna znanja. V povpreËju pa slabo poznajo (slika 7) podroËja: metodologije strojnega uËenja, nagrajevalno in po­globljeno uËenje, obdelava naravnega jezika ter tehnologije masovnih podatkov. Razlog je verje­tno v tem, da ta znanja pri njihovem delu trenutno niso pomembna, saj so ta podroËja znanj dobila tudi najniajo povpreËno oceno pomembnosti (slika 8). Z namenom pribliaati tehnologijo masovnih podat­kov (Hadoop, MapReduce, baze podatkov NoSQL) ter napredna podroËja strojnega uËenja posamez­nikom in organizacijam v Sloveniji bi bilo pripo­tehnologij masovnih podatkov na odprtih podatkih roËljivo vkljuËiti veË primerov dobrih praks s tega (angl. open data) ali prek vzajemnega sodelovanja podroËja v sklopu predstavitev na konferencah, po­z organizacijami. Primeri dobre prakse in prikazani vabiti strokovnjake iz tujine, veË raz.irjanja znanja v dejanski uËinki uporabe tehnologij masovnih podat­sklopu druaabnih skupin in na sreËanjih ter v sklo­kov bi tako spodbudili organizacije, da bodo zaËele pu formalnega izobraaevanja spodbujati uporabo razmi.ljati o uvajanju teh tehnologij. 1 - Ne poznam 2 - Osnove 3 - ZaËetnik 4 - Srednji nivo 5 - Napredni nivo 1 1 2 3 4 Poizvedbeni jezik SQL nPoslovna znanja (finance, trženje, logistika, razvoj izdelka, poznavanje organizacije, trženjsko raziskovanje) 'Oblikovanje informacij (vizualizacija) hSpecifièna znanja iz posameznega podroèja, dejavnosti ali domene iz katere izhaja problem, ki ga rešujem aSistemi baz podatkov - relacijske baze podatkov (RDBMS): DB2, mySQL, SQL Server, PostgreSQL, idr. eOpisna statistika in verjetnostne porazdelitve (Descriptive Statistics and Probability Distributions) %Management podatkov (Data Management) Regresijska analiza (Regression) %Znanstvena metoda (Scientific method) 8Statistièno preizkušanje domnev (Inferential Statistics) fLinearna algebra in raèunstvo, odvodi in inegrali, funkcije in risanje grafikonov, manipulacija matrik @Redukcija dimenzij (Dimension Reduction): PCA, faktorska analiza J Znanje programskih jezikov npr. R, Python, SAS, Julia, Scala, Stata, idr. 0Delo z delno strukturiranimi podatki: XML, .JSON Optimizacija (Optimization) (Metodologije npr. AGILE, LEAN, WATERFALL .Statistika èasovnih vrst (Temporal Statistics) SÈelno programiranje (Front End Programming): JavaScript/HTML/CSS/jQuery/AJAX, idr. *Simulacije (Simulations), npr. Monte Carlo (Nadzorovano uèenje (Supervised Learning) TZaledno programiranje (Back End Programming): Java/Rails/.NET/PHP/Ruby/Go lang,idr. ,Nenadzorovano uèenje (Unsupervised Learning) Masovni in distribuirani podatki (Hadoop, MapReduce, Hive QL) WSistemi baz podatkov - NoSQL baze podatkov: Cassandra, Hbase, CouchBase, MongoDB, idr. "Poglobljeno uèenje (Deep Learning) ,Nagrajevalno uèenje (Reinforcement Learning) 3,7 3,7 3,6 3,5 3,5 3,5 3,3 3,3 3,1 3,1 3,1 2,9 2,9 2,8 2,7 2,6 2,6 2,4 2,4 2,4 2,3 2,2 2,2 2,0 2,0 1,8 1,8 1,8 1,7 1,7 1,7 Slika 7: PovpreËne ocene samoocene znanj (n= 87‡91) 1 - Sploh ni pomembno 2 3 4 5 - Zelo je pomembno 1 2 3 4 5 nPoslovna znanja (finance, trženje, logistika, razvoj izdelka, poznavanje organizacije, trženjsko raziskovanje) 'Oblikovanje informacij (vizualizacija) hSpecifièna znanja iz posameznega podroèja, dejavnosti ali domene iz katere izhaja problem, ki ga rešujem Poizvedbeni jezik SQL aSistemi baz podatkov - relacijske baze podatkov (RDBMS): DB2, mySQL, SQL Server, PostgreSQL, idr. %Management podatkov (Data Management) eOpisna statistika in verjetnostne porazdelitve (Descriptive Statistics and Probability Distributions) %Znanstvena metoda (Scientific method) 8Statistièno preizkušanje domnev (Inferential Statistics) Regresijska analiza (Regression) J Znanje programskih jezikov npr. R, Python, SAS, Julia, Scala, Stata, idr. @Redukcija dimenzij (Dimension Reduction): PCA, faktorska analiza 0Delo z delno strukturiranimi podatki: XML, .JSON .Statistika èasovnih vrst (Temporal Statistics) Optimizacija (Optimization) (Metodologije npr. AGILE, LEAN, WATERFALL fLinearna algebra in raèunstvo, odvodi in inegrali, funkcije in risanje grafikonov, manipulacija matrik (Nadzorovano uèenje (Supervised Learning) TZaledno programiranje (Back End Programming): Java/Rails/.NET/PHP/Ruby/Go lang,idr. *Simulacije (Simulations), npr. Monte Carlo SÈelno programiranje (Front End Programming): JavaScript/HTML/CSS/jQuery/AJAX, idr. Masovni in distribuirani podatki (Hadoop, MapReduce, Hive QL) WSistemi baz podatkov - NoSQL baze podatkov: Cassandra, Hbase, CouchBase, MongoDB, idr. "Poglobljeno uèenje (Deep Learning) ,Nagrajevalno uèenje (Reinforcement Learning) 3,8 3,7 3,6 3,6 3,5 3,5 3,3 3,1 3,0 3,0 2,9 2,8 2,7 2,6 2,6 2,6 2,5 2,3 2,3 2,3 2,3 2,2 2,1 2,1 2,1 1,9 1,9 1,9 1,8 1,7 1,7 Slika 8: PovpreËne ocene pomembnosti znanj (n= 84‡91) Da bi ugotovili, ali obstaja statistiËno znaËilna raz­in integrali, funkcije in risanje grafikonov, manipula­lika med samooceno znanj in pomembnostjo znanj, cija matrik (povpreËna samoocena = 3,1; povpreËna smo primerjali povpreËne samoocene znanja in oce­pomembnost: 2,5; P = 0,000). Pri navedenih znanjih ne pomembnosti znanja. Na podlagi statistiËnega lahko torej trdimo, da obstaja vrzel med obstojeËimi preizkusa je bila identificirana vrzel med povpreËno znanji (na podlagi samoocene) in pomembnostjo pri samooceno znanj in povpreËno oceno pomembnosti njihovem delu. Pri obeh se je izkazalo, da anketiran­le pri podroËjih znanj: regresijska analiza (povpreËna ci menijo, da imajo veË znanj, kot je pomembno pri samoocena = 3,3; povpreËna pomembnost: 3,0; njihovem delu. Rezultat verjetno izhaja iz tega, da P = 0,02) ter linearna algebra in raËunstvo, odvodi se matematike in delno statistike podrobno uËimo v sklopu formalne izobrazbe (osnovna .ola, srednja .ola itd.), v praksi pa s teh podroËij uporabljamo le znanja, ki so pri delu pomembna. Anketiranci na­mreË opravljajo razliËne funkcije, pri katerih uporab­ljajo razliËna znanja glede na njihovo podroËje dela, prav vsi pa imajo podobna osnovna izhodi.Ëa, npr. iz matematike. Pri primerjavi rezultatov med raziskavo v Slove­niji in raziskavo Hayesa (2015a) je razvidno, da so skupna podroËja vi.je samoocenjenih znanj: struk­turirani podatki/relacijske baze podatkov (SQL), menedament podatkov ter do doloËene mere stati­stika (v Sloveniji podroËje regresijske analize, opisne statistike in verjetnostne porazdelitve). V Sloveniji so visoko povpreËno samooceno dobila .e druga, zgoraj omenjena podroËja znanj, ki pa v raziskavi Hayesa niso bila zajeta v vpra.alnik v tak.ni obliki. V razi­skavi Hayesa so bila v povpreËju vi.je ocenjena zna­nja iz matematike in znanosti/znanstvene metode, ki sta v Sloveniji dobili v povpreËju oceno 3 ‡ ZaËetnik. Sklepamo lahko, da imajo posamezniki v tujini bolj moËno formalno izobrazbo na teh dveh podroËjih oziroma se veË posameznikov s teh dveh podroËij ukvarja z znanostjo o podatkih ali pa omenjena raz­lika izhaja le iz drugaËne sestave in velikosti vzorca. Pri pregledu rezultatov raziskave o pomembnosti sposobnosti (slika 9) lahko sklepamo, da so vse spo­sobnosti, razen .podjetni.ke naravnanosti«, anketi­ranci ocenili kot pomembne pri njihovem delu in da pomembno vplivajo na uspe.nost njihovega dela. V sklopu pomembnosti sposobnosti so bile kot najbolj pomembne ocenjene postavljanje pravih vpra.anj, sposobnost re.evanja problemov ter analitiËne spo­sobnosti. To dopolnjuje prej.njo ugotovitev, da v osno­vi podatkovni znanstveniki re.ujejo poslovne proble­me, za kar potrebujejo ustrezne sposobnosti, da znajo pravilno opredeliti problem, se ga lotiti na pravi naËin in pri tem ustrezno uporabiti vsa svoja znanja. 1 - Sploh ni pomembno 2 3 4 5 - Zelo je pomembno 1 2 3 4 5 0Postavljati prava vprašanja, definirati problem. Sposobnost reševanja problemov. Analitiène sposobnosti. Strast do uèenja novih stvari. ARadovednost glede opazovanih stvari (vzorcev, odnosov, razmerij). Strast do dela s podatki. Biti potrpežljiv in vztrajen. HImeti sposobnost kreativnega mišljenja (angl. thinking outside the box).