Tehnike za zagotavljanje veljavnosti in zanesljivosti podatkov v marketinških raziskavah in analiza podatkov v marketingu Avtor Borut Milfelner September 2023 Naslov Tehnike za zagotavljanje veljavnosti in zanesljivosti Title podatkov v marketinških raziskavah in analiza podatkov v marketingu Methods for Ensuring the Validity and Reliability of Data in Marketing Research and Marketing Data Analitics Avtor Borut Milfelner Author (Univerza v Mariboru, Ekonomsko-poslovna fakulteta) Recenzija Aleksandra Pisnik Review (Univerza v Mariboru, Ekonomsko-poslovna fakulteta) Jasmina Dlačić (Univerza v Reki, Ekonomska fakulteta) Lektoriranje Language editing Valerija Vegič Tehnični urednik Jan Perša Technical editor (Univerza v Mariboru, Univerzitetna založba) Oblikovanje ovitka Jan Perša Cover designer (Univerza v Mariboru, Univerzitetna založba) Grafika na ovitku Cover graphics Flume in Switzerland, photo: fabio, unsplash.com, CC0, 2018 Grafične priloge Graphic material Milfelner, 2023 Založnik Univerza v Mariboru Published by Univerzitetna založba Slomškov trg 15, 2000 Maribor, Slovenija https://press.um.si, zalozba@um.si Izdajatelj Univerza v Mariboru Issued by Ekonomsko-poslovna fakulteta Razlagova ulica 14, 2000 Maribor, Slovenija https://epf.um.si, epf@um.si Izdaja Edition Prva izdaja Vrsta publikacije Publication type E-knjiga Dostopno na Available at http://press.um.si/index.php/ump/catalog/book/810 Izdano Published at Maribor, september 2023 © Univerza v Mariboru, Univerzitetna založba / University of Maribor, University Press Besedilo / Text © Milfelner, 2023 To delo je objavljeno pod licenco Creative Commons Priznanje avtorstva-Nekomercialno-Deljenje pod enakimi pogoji 4.0 Mednarodna. / This work is licensed under the Creative Commons At ribution-NonCommercial-ShareAlike 4.0 International License. Uporabnikom se dovoli reproduciranje, distribuiranje, dajanje v najem, javno priobcitev in predelavo avtorskega dela, ce navedejo avtorja in širijo avtorsko delo/predelavo naprej pod istimi pogoji. Za nova dela, ki bodo nastala s predelavo, ni dovoljena komercialna uporaba. Vsa gradiva tretjih oseb v tej knjigi so objavljena pod licenco Creative Commons, razen če to ni navedeno drugače. Če želite ponovno uporabiti gradivo tretjih oseb, ki ni zajeto v licenci Creative Commons, boste morali pridobiti dovoljenje neposredno od imetnika avtorskih pravic. https://creativecommons.org/licenses/by-nc-sa/4.0/ CIP - Kataložni zapis o publikaciji Univerzitetna knjižnica Maribor 339.138:303(0.034.2) MILFELNER, Borut Tehnike za zagotavljanje veljavnosti in zanesljivosti podatkov v marketinških raziskavah in analiza podatkov v marketingu [Elektronski vir] / avtor Borut Milfelner. - 1. izd. - E-knjiga. - Maribor : Univerza v Mariboru, Univerzitetna založba, 2023 Način dostopa (URL): https://press.um.si/index.php/ump/catalog/book/810 ISBN 978-961-286-785-0 (PDF) doi: 10.18690/um.epf.9.2023 COBISS.SI-ID 164175107 ISBN 978-961-286-785-0 (pdf) DOI https://doi.org/10.18690/um.epf.9.2023 Cena Price Brezplačni izvod Odgovorna oseba založnika prof. dr. Zdravko Kačič, For publisher rektor Univerze v Mariboru Citiranje Milfelner, B. (2023). Tehnike za zagotavljanje veljavnosti in Attribution zanesljivosti podatkov v marketinških raziskavah in analiza podatkov v marketingu. Univerza v Mariboru, Univerzitetna založba. doi: 10.18690/um.epf.9.2023 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU B. Milfelner Kazalo Predgovor ............................................................................................................................................ 1 1 Marketinški informacijski sistem ................................................................................... 3 1.1 Informacije ............................................................................................................................... 3 1.2 Sestavine marketinškega informacijskega sistema ............................................................. 5 1.2.1 Notranje informacije ............................................................................................................... 6 1.2.2 Marketinško obveščanje ......................................................................................................... 8 1.2.3 Raziskovanje v marketingu ................................................................................................. 10 1.2.4 Pridobljene baze podatkov ................................................................................................. 12 2 Tržna naravnanost ............................................................................................................ 15 2.1 Pomen tržne naravnanosti za pridobivanje podatkov v marketingu........................... 15 2.2 Koncept marketinga ............................................................................................................ 16 2.3 Opredelitev tržne naravnanosti.......................................................................................... 17 2.3.1 Tržna naravnanost kot aktivnost oziroma proces .......................................................... 18 2.3.2 Tržna naravnanost kot sestavina organizacijske kulture ............................................... 19 2.4 Podobnosti in razlike med opredelitvami tržne naravnanosti ...................................... 23 3 Teorija merjenja v marketingu ...................................................................................... 25 3.1 Koncepti ................................................................................................................................ 25 3.2 Osnove kvantitativnega merjenja v marketingu .............................................................. 27 3.3 Osnovne vrste merilnih lestvic .......................................................................................... 29 3.3.1 Nominalna lestvica ............................................................................................................... 30 3.3.2 Vrstna (ordinalna) lestvica .................................................................................................. 30 3.3.3 Intervalna lestvica ................................................................................................................. 30 3.3.4 Razmernostna (proporcionalna) lestvica .......................................................................... 31 3.4 Merski modeli z latentnimi in manifestnimi spremenljivkami...................................... 31 4 Veljavnost in zanesljivost merilnih lestvic .................................................... 35 4.1 Proces razvoja merilne lestvice .......................................................................................... 35 4.2 Natančnost merjenja ............................................................................................................ 37 4.2.1 Veljavnost merjenja .............................................................................................................. 39 4.2.2 Zanesljivost merjenja ........................................................................................................... 43 5 Preverjanje veljavnosti in zanesljivosti lestvice ............................................. 45 5.1 Raziskovalna faktorska analiza in preverjanje veljavnosti merilne lestvice ................ 45 5.2 Faktorski model .................................................................................................................... 47 6 KAZALO. 5.3 Potek faktorske analize pri preverjanju veljavnosti merilne lestvice ........................... 48 5.3.1 Priprava niza vprašanj .......................................................................................................... 49 5.3.2 Zbiranje podatkov na preizkusnem ali reprezentativnem (končnem) vzorcu ........... 51 5.3.3 Metoda ekstrakcije faktorjev............................................................................................... 52 5.3.4 Izvedba faktorske analize .................................................................................................... 53 5.3.5 Interpretacija faktorske rešitve ........................................................................................... 58 5.3.6 Poimenovanje faktorjev ...................................................................................................... 65 5.3.7 Ocenjevanje veljavnosti konstrukta lestvice .................................................................... 66 5.4 Preverjanje zanesljivosti merilne lestvice ......................................................................... 66 6 Klasične metode za preverjanje povezav med spremenljivkami in konstrukti ............................................................................................................................. 69 6.1 Najpogostejši neparametrični za merjenje povezav ....................................................... 70 6.1.1 Koeficient φ ........................................................................................................................... 70 6.1.2 Kontingenčni koeficient ...................................................................................................... 71 6.1.3 Cramerjev V .......................................................................................................................... 72 6.2 Najpogostejši parametrični testi za merjenje povezav ................................................... 74 6.2.1 Korelacijska analiza .............................................................................................................. 75 6.2.2 Regresijska analiza ................................................................................................................ 80 7 Modeliranje strukturnih enačb (SEM) .......................................................... 99 7.1 Osnovne značilnosti modeliranja strukturnih enačb...................................................... 99 7.2 Razlika med modeliranjem strukturnih enačb in multivariatno regresijsko analizo 101 7.3 Razlogi za uporabo metode modeliranja strukturnih enačb ....................................... 103 7.4 Vrste modeliranja strukturnih enačb ............................................................................... 104 7.5 Zaporedje korakov pri izvajanju modeliranja strukturnih enačb ............................... 105 7.6 Oblikovanje konceptualnega modela .............................................................................. 107 7.7 Zbiranje podatkov .............................................................................................................. 111 7.8 Identifikacija modela .......................................................................................................... 112 7.9 Ocenjevanje parametrov modela ..................................................................................... 113 7.10 Ocenjevanje ustreznosti modela ...................................................................................... 117 7.10.1 Ocenjevanje celotne (globalne) ustreznosti modela ..................................................... 118 7.10.2 Ocenjevanje merjenih delov modela ............................................................................... 122 7.11 Preverjanje zanesljivosti in veljavnosti............................................................................ 122 7.11.1 Preverjanje zanesljivosti .................................................................................................... 122 7.11.2 Preverjanje konvergentne veljavnosti ............................................................................. 123 7.11.3 Preverjanje diskriminantne veljavnosti ........................................................................... 123 7.12 Ocenjevanje strukturnega modela ................................................................................... 125 7.13 Primer modeliranja strukturnih enačb v programu IBM AMOS SPSS .................... 125 7.13.1 Analiza merskega modela .................................................................................................. 126 7.13.2 Preverjanje zanesljivosti in veljavnosti konstruktov v merskem modelu ................. 138 7.14 Analiza strukturnega modela ............................................................................................ 140 Literatura ................................................................................................................ 147 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU B. Milfelner Predgovor Ta monografija je namenjena tistim, ki zbirajo in analizirajo podatke, ki so bili pridobljeni v marketinških raziskavah. Prvi cilj monografije je prikazati, na kakšne načine se pravzaprav zbirajo informacije marketinškega značaja v organizacijah, in razložiti, kako razumemo marketinški informacijski sistem. Pri tem ne namenjamo večjega poudarka metodam zbiranja podatkov, saj to ni namen te monografije, temveč raje prikažemo kulturo oziroma aktivnosti v organizaciji, ki v marketinški funkciji organizacije najbolj prispevajo k temu, da se zbirajo podatki, ki so ključni za razvijanje in razumevanje marketinških aktivnosti. Drugi cilj monografije je utemeljevanje merjenja konceptov na znanstveni ravni. Ugotavljamo namreč, da večina raziskovalcev v organizacijah in na univerzah pogosto ne razume kompleksnosti konceptov, ki jih želi izmeriti, in zaradi tega ne izpelje vseh postopkov pri pridobivanju in preverjanju podatkov, ki so jih pridobili s kvantitativnimi metodami zbiranja podatkov. V tej monografiji tako utemeljujemo znanstvene principe teorije kvantitativnega merjenja v marketingu, ki so ključni, da lahko zagotovimo natančne, to pomeni veljavne in zanesljive podatke. Le takšne je namreč smiselno analizirati in jih tako uporabiti kot osnovo za poslovno odločanje v organizacijah. 2 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. Tretji cilj, ki ga dosegamo v monografiji, se osredotoča na opredelitev zanesljivosti in veljavnosti merilnih lestvic in na predstavitev ter osvajanje načinov za preverjanje zanesljivosti in veljavnosti. V marketinški znanosti so se čez leta razvili principi, ki lahko raziskovalcu pred, med in po zbiranju podatkov pomagajo pri oceni natančnosti zbranih podatkov. Številni temeljijo na kvantitativnih analizah, ki jih predstavljamo v tej monografski publikaciji. Zadnji in najpomembnejši cilj monografije je predstaviti najpogostejše metode analiziranja podatkov, ki jih uporabljajo marketinški raziskovalci, pri čemer smo se osredotočili predvsem na merjenje povezav med koncepti oziroma konstrukti. V ta namen opredeljujemo in prikazujemo teoretične osnove za izvedbo analiz, kot tudi praktično izvedbo analiz. V zadnjem poglavju se osredotočamo predvsem na modeliranje strukturnih enačb, ki na področju marketinške znanosti in družboslovnih znanosti v Sloveniji v smislu razlage izvedbe metode doslej še ni bilo deležno veliko pozornosti. Posamezna poglavja monografije so strukturirana na način, ki bralcu omogoča, da najprej spozna teoretične osnove, nato pa se seznani še s praktičnimi marketinškimi primeri. TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU B. Milfelner 1 Marketinški informacijski sistem Marketinške informacijske sisteme v organizacijah najdemo v različnih oblikah, od zelo enostavnih do zelo kompleksnih. Podjetja uporabljajo marketinške informacijske sisteme (MIS) za zbiranje informacij, ki jih potrebujejo za sprejemanje odločitev v marketingu. Marketinški informacijski sistem je proces, ki omogoča organizacijam, da spoznajo, katere informacije potrebujejo. Poudarjamo, da marketinški informacijski sistem ne vključuje le programske opreme, temveč: − štiri vrste podatkov (notranje podatke, marketinško obveščanje, raziskovanje v marketingu in pridobljene baze podatkov); − strojno opremo (hardware) in programsko opremo za analizo podatkov in pripravo poročil; − ljudi, ki določajo vrsto zbiranja, razdeljevanja in uporabe marketinških podatkov v organizaciji; − proces. 1.1 Informacije Informacije, ki jih organizacija zbira za svoje marketinške potrebe, morajo biti: − relevantne, 4 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. − natančne − in pravočasne. Relevantnost informacij pomeni, da morajo biti takšne, da lahko z njimi rešujemo marketinške odločitvene probleme. To pomeni, da jih lahko menedžerji uporabljajo pri svojih odločitvah na način, da so njihove odločitve manj tvegane. Natančnost informacij se nanaša na veljavnost in zanesljivost pri zbiranju informacij. Več o tem v naslednjih poglavjih. Predvsem pri zbiranju primarnih podatkov v marketingu lahko marketinški raziskovalci z različnimi metodami zagotovijo, da informacije in podatki ustrezajo konceptom, ki jih v organizaciji želijo meriti. Pravočasnost informacij se nanaša na časovni vidik pridobivanja informacij. Informacije morajo tako v organizaciji pridobiti takrat, ko jih pri odločanju potrebujejo. Proces, ki se odvija v marketinškem informacijskem sistemu, vsebuje: − zbiranje informacij, − razvrščanje informacij, − analiziranje informacij, − skladiščenje informacij, − distribucijo informacij. Zbiranje informacij se nanaša na izbiro in metodo zbiranja informacij. Pri tem je pomembno, da so informacije veljavne in zanesljive. Nadalje se zbiranje informacij nanaša na metodo zbiranja. V marketingu lahko informacije pridobivamo v smislu primarnih ali sekundarnih podatkov. Primarne podatke lahko pridobivamo z marketinškim obveščanjem ali z raziskovanjem v marketingu. Več o tem v nadaljevanju. Razvrščanje informacij se nanaša na ugotavljanje, ali je za organizacijo pomembno, da podatke razvršča po različnih dejavnikih, na primer po različnih segmentih odjemalcev (demografske, psihografske, vedenjske značilnosti), oddelkih v 1 Marketinški informacijski sistem 5. organizaciji, po izdelkih, trgih itd. Podatki se razvrstijo po ustreznih kategorijah in analizirajo. Pri analiziranju informacij določamo metodo analize, ki jo lahko uporabimo za analiziranje zbranih informacij in podatkov. V osnovi uporabljamo v marketingu metode za analiziranje kvalitativnih podatkov (največkrat analizo vsebine) ali metode za analiziranje kvantitativnih podatkov (statistične metode). Skladiščenje informacij se nanaša na informacijske sisteme (največkrat strojno in programsko opremo), ki omogočajo shranjevanje, iskanje in deljenje informacij. Sem prištevamo predvsem sisteme za načrtovanje podjetniških virov (angl. ERP – enterprise resource planning system), znotraj tega sistema ter druge podsisteme, ki so pomembni za ustrezno delovanje marketinške funkcije, na primer: − sisteme za menedžment odnosov z odjemalci (angl. CRM – customer relationship management system), − sisteme za menedžment dobavnih verig (angl. SCM – Supply-chain management system). Distribucija informacij se nanaša na prenos informacij do funkcij v organizaciji in do zaposlenih, ki jih potrebujejo pri svojem delu in odločanju. Distribucija lahko poteka v smeri od spodaj navzgor (podrejeni – nadrejeni) ali v smeri od zgoraj navzdol (nadrejeni – podrejeni). 1.2 Sestavine marketinškega informacijskega sistema Marketinški informacijski sistem sestavljajo različne informacije, ki jih v organizacijah obdelujejo z različno strojno in programsko opremo in jih potem uporabljajo pri odločanju. Prikazan je na sliki 1. Solomon et al. (2012) deli informacije na: − notranje informacije, − marketinško obveščanje, − raziskovanje marketinga in − pridobljene baze podatkov. 6 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. Informacije nato obdelujemo s pomočjo programske in strojne opreme in jih uporabljamo pri marketinškem odločanju. Notranje Marketinško Marketinško Pridobljene baze informacije obveščanje raziskovanje podatkov Programska in strojna oprema Informacije za marketinške odločitve Slika 1: Marketinški informacijski sistem Vir: lasten. 1.2.1 Notranje informacije Notranje informacije koristijo organizacijam, da pripravijo poročila o rezultatih poslovanja, o prodaji in o drugih marketinških aktivnostih (na področju izdelkov, cene, marketinškega komuniciranja in marketinških poti). Najpomembnejše notranje informacije vključujejo podatke o prodaji (na primer, kateri odjemalci kupujejo določene izdelke in v kakšnih količinah), podatke o stanju zalog in podatke o reklamacijah ter razlogih za reklamacije. Notranje informacije lahko razdelimo na naslednje skupine: − Informacije in podatki iz ciklov naročil in plačil – primeri: − Ponudbe, predračuni, naročilnice, računi, dobavnice − Prevzemnice, skladiščni listi, izdajnice, inventurni listi − Povezave med dokumenti − Prodajne informacije – primeri: − Prodaja po posameznih izdelkih (npr. mobilni telefoni, dodatna oprema, mobilni paketi) − Prodaja po oddelkih (npr. moški, ženski oddelek) 1 Marketinški informacijski sistem 7. − Prodaja po prodajalnah (npr. marketi in supermarketi) − Prodaja po geografskih regijah (npr. podravska, notranjska itd.) − Prodaja glede na način plačila (npr. gotovina, kreditna kartica, kredit itd.) − Prodaja po obdobjih (sezonah) − Prodajni trendi (napovedi prodaje) − Podatki o odjemalcih – fizične osebe (na trgih končnih odjemalcev – angl. B2B): − Demografski podatki (starost, spol, lokacija, osebni dohodki itd.) − Identifikacijski podatki (ime in priimek, naslov, stik, spol, status, št. družinskih članov, starost, poklic, osebni dohodek itd.) − Psihografski podatki (življenjski slog in vrednote) − Vedenjski podatki (pogostost nakupa, pogostost uporabe, pripravljenost na nakup, zvestoba, stališča) − Podatki o odjemalcih – pravne osebe (na medorganizacijskih trgih – angl. B2C): − Podatki o podjetjih (davčna številka, matična številka, naslov, transakcijski račun, panoga, velikost, logotip, plačilni roki itd.) − Ponakupne informacije (reklamacije, knjiga pritožb, pohval in predlogov) Pogosto informacijski sistemi v podjetjih omogočajo prodajalcem in prodajnim menedžerjem dostop do notranjih informacij po različnih informacijskih sistemih, največkrat po sistemu CRM ali ERP ali po intranetu organizacije. Takšni sistemi so zaščiteni, zaposlenim pa so dodeljena dovoljenja za dostop do posameznih vrst podatkov. Prodajno osebje notranje podatke uporablja za boljše zadovoljevanje potreb odjemalcev, saj lahko prejmejo takojšnje informacije o odjemalcih, njihovih preteklih nakupih, cenah izdelkov, zalogah izdelkov, proizvodnih načrtih, datumih pošiljanja in o odjemalčevi zgodovini nakupov. Na podlagi notranjih podatkov lahko tudi marketinški menedžerji prejmejo takojšnje informacije v realnem času (angl. real time information) o tem, kakšne so spremembe v prodaji, prodajnih vzorcih in kakšne so nove prodajne priložnosti. Generirana so dnevna, tedenska ali mesečna poročila o prodaji in o doseganju prodajnih ciljev ter tržnih deležev. 8 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. Telekomunikacijska podjetja uporabljajo različne informacijske sisteme za podporo prodajnemu osebju. Tem so na voljo informacije o preteklih sklenjenih naročniških razmerjih, mobilnih aparatih, ki so jih odjemalci kupili, o plačilih odjemalcev, o značilnostih odjemalcev in o prodajnih paketih. Na tak način lahko prodajno osebje ustrezno prilagodi ponudbo (na primer mobilni paket) odjemalcu na prodajnem mestu. Prodajalci lahko s pomočjo informacijskega sistema zajemajo tudi stike potencialnih novih odjemalcev (angl. leads), spremljajo doseganje individualnih prodajnih načrtov in celo ugotavljajo, kateri odjemalci bi utegnili biti preveč tvegani za sklenitev naročniškega razmerja. Prodajni vodje lahko s pomočjo informacijskega sistema spremljajo dosežke individualnih in skupnih prodajnih načrtov za svojo prodajalno po posameznih postavkah (nova naročniška razmerja, podaljšanje naročniškega razmerja, dodatna oprema, pridobljeni stiki, prodani aparati itd.). Marketinški menedžerji na višjih stopnjah lahko spremljajo prodajo na višjih (na primer regijskih in državnih) ravneh in ustrezno prilagajajo pakete glede na informacije, ki jih pridobijo. 1.2.2 Marketinško obveščanje Drugi pomembni dejavnik marketinškega informacijskega sistema je marketinško obveščanje, s katerim marketinški menedžerji pridobivajo informacijo o relevantnosti za marketinško poslovanje organizacije. Čeprav govorimo o obveščevalskih aktivnostih, predstavlja vsakodnevno pridobivanje informacij iz okolja organizacije (ožjega in širšega). V nasprotju z raziskovanjem v marketingu pa marketinško obveščanje ni sistematično. To pomeni, da je to pridobivanje informacij brez predpostavljenih ciljev, hipotez in načrtov. Večinoma predstavlja spremljanje podatkov na spletnih straneh, spremljanje informacij v relevantnih publikacijah in spremljanje informacij, ki jih organizacija po različnih virih pridobi s svojih trgov. Prodajno osebje je tisto, ki je najbolj v stiku z dejanskimi in potencialnimi odjemalci in dobavitelji, zato je pomemben del marketinškega obveščanja. Metode marketinškega obveščanja delimo v dve skupini, in sicer: − pridobivanje informacij na trgih, kjer organizacija posluje, in − pridobivanje informacij na spletu. 1 Marketinški informacijski sistem 9. Pridobivanje informacij na trgih, kjer organizacija posluje, vključuje: − Usposabljanje in motiviranje prodajnega osebja in drugih zaposlenih za poročanje o spremembah (prodajno osebje, ki je v dnevnih stikih z odjemalci, poroča o njihovih hotenjih, potrebah, zadovoljstvu itd.). − Motiviranje členov v prodajni verigi (distributerjev, maloprodajalcev in drugih posrednikov) za obveščanje o spremembah (posredniki poročajo o odjemalcih, s katerimi poslujejo). − Najem strokovnjakov za zbiranje informacij (npr. metoda skritega kupca ali metoda popisovanja cen). − Notranje in zunanje mreženje (strokovna izobraževanja, sejmi, predstavitve, konference itd.). − Sodelovanje v panelnih raziskavah v vlogi respondenta. − Uporaba javno dostopnih podatkov (v Sloveniji na primer Statistični urad RS – SURS, Urad za makroekonomske raziskave – UMAR). Pridobivanje informacij na spletu vključuje spremljanje naslednjih informacij: − neodvisne ocene odjemalcev na spletnih forumih (npr. consumersearch.com, consumerreports.org), − povratne informacije odjemalcev (ocene) na spletnih prodajnih mestih (npr. mimovrste.com, amazon.com, booking.com), − spremljanje strani, ki odjemalcem podajajo informacije in ekspertna mnenja o izdelkih in objavljajo recenzije izdelkov (npr. digitaltrends.com, whathifi.com), − všečki in komentarji na družbenih omrežjih in spletnih straneh (npr. Facebook, Instagram), − spremljanje obiska spletne strani (Google Analytics) in − spremljanje javnih blogov. 10 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. 1.2.3 Raziskovanje v marketingu1 Raziskovanje v marketingu se nanaša na sistematičen proces zbiranja, analiziranja in interpretiranja podatkov o odjemalcih, konkurentih, poslovnem okolju in izvedenih marketinških aktivnostih znotraj organizacije. Namen marketinškega raziskovanja je povečanje poslovne uspešnosti. Največkrat se takšno raziskovanje izvaja takrat, ko v podjetju primanjkuje informacij za poslovno odločanje oziroma ko je treba reševati odločitvene probleme. Proces raziskovanja v marketingu vključuje naslednje stopnje: − opredelitev problema, − določanje ciljev raziskave, − načrt raziskave, − zbiranje podatkov in informacij, − obdelava in analiza podatkov in informacij, − izdelava poročila in − uporaba izsledkov raziskave. Opredelitev problema je v marketinških raziskavah pomembna, saj morajo marketinški menedžerji sprejemati pomembne odločitve glede marketinških aktivnosti. Takšne odločitve so strateške narave in so v večini primerov tvegane, za zmanjšanje tveganja pa se potrebujejo informacije. Odločitveni problemi marketinških menedžerjev so usmerjeni v aktivnosti, torej se nanašajo na vprašanje, 'kaj storiti', oziroma na to, kako uvesti novo marketinško aktivnost ali spremeniti obstoječo (na primer: Ali naj uvedemo nov izdelek ali naj razvijemo novo celostno grafično podobo ali naj spremenimo cene storitve?). Za rešitev odločitvenega problema je treba določiti in razumeti marketinški raziskovalni problem. Ta je usmerjen v informacije. Zajema opredelitev aktivnosti, s pomočjo katerih bomo učinkoviteje pridobili informacije za rešitev odločitvenega problema. 1 Več o raziskovanju v marketingu lahko najdete v Radonjič in Iršič (2006). 1 Marketinški informacijski sistem 11. Določanje ciljev raziskave se nanaša na cilj, ki ga želimo doseči z raziskovanjem. V marketinških raziskavah določamo cilje v okviru zastavljenih raziskovalnih vprašanj, hipotez in morebitnih omejitev, zaradi katerih naša raziskava morda ne bo tako natančna, kot bi bila v idealnih pogojih. Glede na načrtovanje marketinškega raziskovalnega procesa ločujemo vpogledne (eksploratorne), opisne (deskriptivne) in vzročne (kavzalne) raziskave. Vpogledne raziskave so namenjene natančnejši opredelitvi marketinškega raziskovalnega problema, iskanju osnovnih smernic za odločitve, razvoju hipotez, iskanju definicij ključnih konceptov za proučevanje, pridobivanju vpogleda v raziskovalno problematiko in določanju prioritet za nadaljnje raziskovanje. Pogosto so torej predhodnica opisnim ali vzročnim raziskavam. Pri opisnih raziskavah največkrat zbiramo informacije, s pomočjo katerih opisujemo značilnosti določenih skupin, kot so odjemalci, dobavitelji, organizacije, trgi itd. Ugotavljamo lahko tudi, kolikšno število ali delež proučevane populacije (skupin, oseb) izkazuje določeno vedenje ali pa ugotavljamo zaznave odjemalcev v povezavi z izdelki in storitvami in njihovimi značilnostmi. Prav tako lahko analiziramo značilnosti trgov in podajamo tržne napovedi. Namen vzročnih raziskav pa je ugotoviti in razumeti, kateri dejavniki (spremenljivke) so vzrok (neodvisne spremenljivke) in kateri posledica (odvisne spremenljivke). Gre za ugotavljanje na kakšen način posamezni dejavniki povzročajo katere spremembe pri drugih dejavnikih. Ugotoviti želimo torej naravo povezav med spremenljivkami in predvideti moč povezav. Glede zbiranja informacij v marketingu delimo podatke in informacije glede na njihov izvor v dve osnovni skupini, in sicer na sekundarne in primarne informacije. V skupino sekundarnih podatkov in informacij uvrščamo podatke in informacije, ki so bile že zbrane za potrebe določenih obstoječih raziskav in za druge namene. Med primarne podatke in informacije uvrščamo podatke in informacije, ki v preteklosti še niso bile zbrane in jih organizacija zbira sama za namene reševanja marketinških raziskovalnih problemov (Radonjič in Iršič, 2006). Primarne podatke zbiramo s kvantitativnimi in kvalitativnimi raziskovalnimi metodami. Med kvantitativne največkrat uvrščamo spraševanje (spraševanje s spletnim vprašalnikom), opazovanje (opazovanje z digitalnimi elektronskimi napravami) in eksperiment (proučevanje vplivov in posledic). Med kvalitativne metode pa sodijo poglobljeni intervjuji, fokusne skupine, projektivni in asociativni testi. 12 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. Obdelavo in analizo podatkov in informacij v veliki meri opisujemo v tej monografiji od tretjega poglavja. To so metode za zagotavljanje veljavnosti in zanesljivosti podatkov in informacij. Podatke, ki smo jih zbrali s kvantitativnimi metodami, največkrat obdelujemo s statističnimi metodami, podatke, ki jih zberemo s kvalitativnimi metodami, pa s pomočjo analize vsebine. Priprava poročila se nanaša na interpretacijo pridobljenih rezultatov raziskave. Poročilo mora biti sestavljeno tako, da podaja odgovore na zastavljene marketinške odločitvene probleme oziroma na vprašanja marketinškega menedžmenta. Sama interpretacija podatkov v poročilu ni dovolj. Ta mora namreč vsebovati tudi predloge za aktivnosti, ki izhajajo iz rezultatov raziskave. Uporaba izsledkov raziskovalnega projekta je zadnja stopnja raziskovalnega procesa in se nanaša na ustrezno razdelitev podatkov in informacij, shranjevanje podatkov in informacij ter na uporabe le-teh pri nosilcih odločanja, največkrat vodij marketinške funkcije ali marketinških menedžerjev. 1.2.4 Pridobljene baze podatkov Organizacija lahko marketinške podatke pridobiva tudi s pomočjo nakupa informacij, ki jih potrebuje. Največkrat so to informacije, ki jih za določene namene ali po naročilu zbirajo marketinške raziskovalne agencije. Čeprav so te informacije lahko izjemno koristne, se vedno ne nanašajo natančno na marketinškeproblem, s katerimi se organizacije spoprijemajo. Posebej so pomembne pri prepoznavanju sprememb v prodaji, potrebah in hotenjih odjemalcev in pri napovedovanju trendov. Dve vrsti raziskav, ki jih velja posebej omeniti in ki jih lahko organizacije pridobijo na trgu, so paneli in omnibusi. Panel je metoda organiziranega zbiranja primarnih podatkov, pri kateri s posameznimi metodami zbiranja podatkov (spraševanje ali opazovanje) na istem vzorcu raziskovalne agencije merijo eno ali več značilnosti v najmanj dveh časovnih obdobjih. Ves čas se uporablja stalni vzorec in ista metoda. Značilna je časovna primerljivost podatkov, ki omogoča spremljanje sprememb v času (trendi). Najbolj pogoste vrste panelov so: 1 Marketinški informacijski sistem 13. − paneli prodajaln, − paneli končnih odjemalcev in − specialni paneli. V Sloveniji panele izvajajo različne raziskovalne agencije, kot so AGB Nielsen, Mediana, GfK, Ipsos, Arhea in drugi. Omnibus je kvantitativna večnaročniška raziskava, pri kateri se v okviru iste raziskave zbirajo informacije o različnih temah. Raziskave se izvajajo za več naročnikov, vsak naročnik pa lahko naroči informacije za svoj raziskovalni problem. Prednost omnibusa so nizki stroški, saj se več raziskav (za več naročnikov) izvaja hkrati. Vzorec je reprezentativen za izbrano populacijo. Organizacija lahko torej v sklopu organiziranega zbiranja podatkov zakupi del vsebine (npr. vprašalnika), za katero se zbirajo organizacije. V Sloveniji se večinoma izvajajo omnibusi gospodinjstev. Izvajajo jih raziskovalne agencije, kot so GfK, Mediana, RM Plus in Valicon. 14 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU B. Milfelner 2 Tržna naravnanost 2.1 Pomen tržne naravnanosti za pridobivanje podatkov v marketingu Razumevanje tržne naravnanosti in dejstva, zakaj morajo biti organizacije tržno naravnane, je marketinškim raziskovalcem pomembno. Tržna naravnanost podjetja namreč zaposlene v organizaciji in v marketinškem oddelku usmerja, da pridobivajo ustrezne informacije z različnih trgov, na katerih organizacija posluje. Je kultura zaposlenih in celotne organizacije, ki narekuje aktivnosti, ki so povezane s pridobivanjem marketinških informacij iz okolja in z razdeljevanjem marketinških informacij znotraj organizacije. Organizacija, ki ni tržno naravnana, ne more na ustrezen način razumeti marketinških (raziskovalnih) problemov, s katerimi se spoprijema. Posledično ne more biti ustrezno naravnana na informacije, ki jih mora pridobivati iz svojega okolja, da lahko načrtuje marketinške aktivnosti na vseh sedmih področjih (izdelek, cene, marketinške poti, marketinško komuniciranje, sodelujoči pri procesih, procesi, ambient). Zato je ključno razumevanje, kaj tržna naravnanost je in kako jo lahko v organizaciji dosegamo. V naslednjih podpoglavjih predstavljamo koncept in pomen tržne naravnanosti. 16 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. 2.2 Koncept marketinga Prizadevanja za vpeljavo koncepta marketinga v praksi organizacijam omogočajo podlago za pridobivanje prednostnih pozicij na trgu. Po drugi svetovni vojni so koncept marketinga začele uvajati predvsem severnoameriške organizacije, pozneje tudi organizacije po vsem svetu. Danes številne organizacije zaradi konkurence znova izgubljajo vodilne tržne položaje, zato je ta koncept pomembnejši kot kadar koli. V svojem članku Marketing Myopia je Levit (1960) postavil temelje koncepta marketinga. Pred tem je Drucker (1954) trdil, da sta marketing in inoviranje edini funkciji v podjetju, ki ustvarjata dodano vrednost. Danes se marketinški strokovnjaki in akademiki strinjajo, da je koncept marketinga dimenzija organizacijske kulture, kar je potrjeno tudi z empiričnimi raziskavami, ki pa so bile do devetdesetih let zelo redke in niso empirično obravnavale koncepta. Koncept marketinga definiramo kot filozofijo poslovnega menedžmenta, pri čemer je bistveno, da je marketinška funkcija povezana z drugimi poslovnimi funkcijami organizacije za ustvarjanje uspešnosti. Bistvo koncepta marketinga odjemalca postavljajo v središče organizacije. Na osnovi tega torej organizacija razvija svoje strateške in operativne načrte (Deshpande in Webster, 1989). Koncept marketinga se razlikuje od stroge prodajne naravnanosti in pomeni filozofijo poslovanja podjetja (Baker, Black in Hart, 1994; Houston, 1986; Wong in Saunders, 1993). Koncept marketinga postavlja odjemalca v središče razmišljanja organizacije v povezavi z njenimi strategijami in poslovanjem (Deshpande in Webster, 1989). Na marketing je treba gledati kot na vodilno filozofijo celotne organizacije, saj obstajajo dokazi, da je organizacijam, ki jim to uspeva, uspelo doseči tudi nadpovprečno raven uspešnosti. Do podobnih sklepov prihajata tudi Barksdale in Darden (1971), ki sta že v sedemdesetih letih prejšnjega stoletja izvedla prvo empirično raziskavo na področju koncepta marketinga, s pomočjo katere sta v povezavi s konceptom ugotavljala stališča vodilnih zaposlenih v podjetjih. Ugotovila sta, da je v ospredju filozofska ideja, ki jo lahko udejanja politika menedžmenta organizacije, vendar so jo zaradi neznanih razlogov vsakodnevno sposobne izvajati le redke organizacije. 2 Tržna naravnanost 17. Poleg filozofije organizacije pa se koncept marketinga nanaša tudi na izvajanje aktivnosti v organizaciji, kot so: − naravnanost na odjemalca, − koordinacija marketinških aktivnosti in − vplivi na uspešnost poslovanja organizacije. Na koncept marketinga lahko torej gledamo tudi kot na procese oziroma aktivnosti, ki potekajo v organizaciji. Glede na to, da je spodbuda za procese in aktivnosti prav organizacijska kultura oziroma način razmišljanja, je pri konceptu marketinga v organizaciji v ospredju oboje, tako pravilen način razmišljanja vseh zaposlenih kot način izvajanja marketinških aktivnosti. 2.3 Opredelitev tržne naravnanosti Desphande in Kohli (1989) sta prva povezala delovanje organizacije in pretok informacij v njej in poudarila, da je za koncept marketinga v organizaciji zadolženo vodstvo podjetja. Ti morajo skrbeti za razvoj mehanizmov, ki bodo lajšali in pospešili pridobivanje in pretok informacij. Koncepta tržne naravnanosti so pozneje obravnavali tudi drugi avtorji, opredelitve pa se delijo na dva dela, in sicer: − opredelitev tržne naravnanosti kot niza aktivnosti in procesov in − opredelitev tržne naravnanosti kot sestavine kulture organizacije. Tržno naravnanost lahko opredelimo kot niz aktivnosti in procesov, ki izhajajo iz delovanja organizacije v skladu z marketinškim konceptom (Kohli in Jaworski, 1990). Nekateri avtorji tržno naravnanost imenujejo tudi marketinška naravnanost (npr. Deng in Dart, 1994; Diamantopoulos in Hart, 1993; Gray, Matear, Boshoff in Matheson, 1998). V nadaljevanju bomo pojasnili, zakaj takšno sklepanje ni vedno natančno. Tržna naravnanost zagovarja pristop, po katerem je povezana z usvajanjem marketinškega koncepta kot filozofije. Ta vidik proučevanja definira tržno naravnanost kot sestavino organizacijske kulture (Narver in Slater, 1990) in se osredinja na prepričanja v organizaciji, ki odjemalčeva hotenja in potrebe postavljajo 18 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. na prvo mesto. Tržno naravnana kultura je tako tista, s katero organizacija doseže vrednote in prepričanja, ki omogočajo dolgoročni razvoj tržne naravnanosti oziroma izvajanja aktivnosti, značilnih za tržno naravnane organizacije (Homburg in Pflesser, 2000). 2.3.1 Tržna naravnanost kot aktivnost oziroma proces Na podlagi rezultatov raziskave Kohli in Jaworski (1990) opredeljujeta tržno naravnanost kot pretok in uporabo ključnih informacij v povezavi z odjemalci organizacije. Za tržno naravnano organizacijo je najbolj pomembno, da skrbi za informacije v smislu: − pridobivanja informacij, − razširjanja informacij in − uporabe informacij. Tržna naravnanost je definirana kot »izvajanje tržnega obveščanja, ki se nanaša na trenutne in bodoče potrebe odjemalcev, razširjanje zbranih informacij skozi vse oddelke, in kot uporaba zbranih informacij v vseh oddelkih organizacije« (Kohli in Jaworski, 1990, 6). Tržno naravnana organizacija mora najprej skrbeti za pridobivanje informacij s trgov, na katerih posluje. To je predvsem pridobivanje informacij v povezavi z izraženimi potrebami in preferencami odjemalcev, analizirati pa mora tudi zunanje dejavnike, ki vplivajo na potrebe in preference, torej dejavnike, ki izhajajo iz širšega in ožjega okolja organizacije. Pri tem mislimo tudi na analiziranje dejavnosti konkurentov in tega, kako lahko njihove dejavnosti vplivajo na preference odjemalcev (npr. Day in Wensley, 1983). Druga naloga tržno naravnanega podjetja je sodelovanje vseh oddelkov organizacije v informacijskih procesih (na primer raziskovalnega, proizvodnega, financ itd.). Pridobivanje informacij s trga se na eni strani nanaša na zbiranje in ocenjevanje potreb odjemalcev in na analizo dejavnikov (okolja), ki vplivajo na izoblikovanje in spreminjanje tovrstnih potreb. V tem procesu morajo na drugi strani sodelovati različni oddelki organizacije, ki imajo različne poglede in potrebe po zbiranju informacij s trga ter tudi različne načine interpretacije podatkov. 2 Tržna naravnanost 19. Organizacija se ne more ustrezno prilagoditi svojim trgom (odjemalcem), če informacije niso ustrezno razširjene in ponujene vsem oddelkom in posameznim zaposlenim v organizaciji, ki te informacije potrebujejo pri sprejemanju odločitev in pri delu. Informacije ne potekajo vedno le z marketinškega oddelka v druge oddelke. Potekajo lahko tudi v drugi smeri, torej v marketinški oddelek, odvisno od tega, kdo ustvarja informacije. Ne glede na smer, je razširjanje informacij pomembno, ker omogoča možnost usklajevanja aktivnosti med posameznimi oddelki. V času pridobivanja informacij morajo marketinški menedžerji ustrezno opredeliti, katere informacije so za organizacijo ključne, postopek razširjanja informacij pa se nanaša na procese in obseg izmenjave informacij v organizaciji. Marketinške informacije lahko uporabljajo predvsem strateške poslovne enote v organizaciji, kar pomeni, da se je treba osredotočiti tako na horizontalne kot na vertikalne prenose informacij. Hkrati poznamo tudi formalne in neformalne tokove informacij, ki so pomembni za boljše razumevanje in zadovoljevanje potreb odjemalcev. Tretji dejavnik tržne naravnanosti, ki sta ga predlagala Kohli in Jaworski (1990), je uporaba informacij. Organizacija lahko informacije ustvarja in jih razširja po oddelkih, vendar je za učinkovito odzivanje na potrebe trga najpomembnejša predvsem uporaba. Zato je ta aktivnost celo najpomembnejša med vsemi tremi. Organizacije lahko uporabljajo informacije v obliki izbiranja ciljnih trgov, snovanja novih izdelkov z upoštevanjem trenutnih in prihodnjih potreb, v distribuciji ter pri komuniciranju o izdelkih na način, ki je za odjemalce najbolj ustrezen. Vsi oddelki v tržno naravnani organizaciji morajo sodelovati pri odzivanju na tržne razmere in situacije. Organizacija se mora osredotočati predvsem na potrebe na ciljnih trgih, ki jih je sposobna dobro zadovoljevati. Pridobljene informacije lahko uporabljamo pri identificiranju in ovrednotenju tržnih segmentov in pri razvoju marketinških načrtov. 2.3.2 Tržna naravnanost kot sestavina organizacijske kulture Sočasno s Kohlijem in Jaworskim (1990) sta tržno naravnanost opredelila tudi Narver in Slater (1990). Po njunem mnenju in po mnenju nekaterih drugih avtorjev (Aaker, 1988; Hall, 1980; Porter, 1985) tržno naravnana organizacija mora razumeti, da obstaja več možnosti za ustvarjanje različnih dodanih vrednosti tako za odjemalce kot za spremembo cene pridobivanja in distribucije izdelkov. Takšne organizacije razumejo, na kakšen način lahko najučinkoviteje in najbolj uspešno ustvarjajo 20 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. dodano vrednost za obstoječe in nove ciljne skupine. Cilj tržne naravnanosti je torej ugotavljanje uspešnosti poslovanja, ki izhaja iz vzpostavljanja in ohranjanja odnosov z odjemalci. Narver in Slater (1990) sta tržno naravnanost opredelila kot sestavino kulture organizacije. Delita jo na tri vedenjske komponente (komponente kulture ali poslovne filozofije): − naravnanost na odjemalce, − naravnanost na konkurente in − medfunkcijsko povezanost. Naravnanost na odjemalce je pomembna za proučevanje potreb ciljnih odjemalcev. Na tak način lahko organizacija zanje ustvarja nadpovprečno vrednost oziroma dosega raven razširjenega izdelka (Levitt, 1980). Narver in Slater (1990) podobno kot Kohli in Jaworski (1990) trdita, da lahko organizacija vrednost za odjemalce dosega na dva načina. Prvič, s ponujanjem večjih koristi za odjemalca in drugič, z zmanjševanjem stroškov (cena in drugi necenovni stroški) odjemalca. Naravnanost na odjemalce organizacijo prisili, da so njene aktivnosti določene na podlagi potreb odjemalcev. Organizacija jo dosega tako, da so njene aktivnosti naravnane na dolgoročno povečevanje zadovoljstva odjemalcev. Ta dejavnik so različni avtorji, na primer Saxe in Weitz (1982), proučevali tudi z vidika prodajne funkcije. Takšen pogled mora vključevati tudi druge pomembne deležnike organizacije, kot so lastniki, menedžerji in zaposleni. Poudarjamo, da je samo osredotočenje na informacije o potrebah dejanskih in potencialnih odjemalcev pogosto premalo, upoštevati je treba tudi globlje vrednote in prepričanja ter druge deležnike in javnosti organizacije. Že Kohli in Jaworski (1990) sta v okviru raziskovanja odjemalcev poudarjala, da zbiranje informacij v povezavi z njimi ni dovolj, saj na obstoječe potrebe in hotenja odjemalcev zelo vpliva tudi nenehno spremljanje aktivnosti konkurentov. Zato Narver in Slater (1990) kot drugi dejavnik tržne naravnanosti dodajata naravnanost na konkurente. Takšna naravnanost ponudniku omogoča razumevanje kratkoročnih prednosti in slabosti ter dolgoročnih sposobnosti in strategij obstoječih in potencialnih konkurentov. Zavedati se moramo, da na določenih trgih lahko 2 Tržna naravnanost 21. nastanejo situacije, v katerih finančna uspešnost organizacije ni tako močno povezana s tržno naravnanostjo kot na trgih z velikim številom konkurenčnih ponudnikov. Kot primer lahko navedemo monopolni položaj oziroma primere, v katerih celotna panoga deluje pod svojimi zmožnostmi. Vendar tudi v takšnih primerih organizacije ne smejo zanemarjati razlogov za proučevanje potencialnih in posrednih konkurentov, saj menedžment ne more biti odvisen le od določenih izdelkov, na katerih je zgrajen njihov monopolni položaj. V tržni ekonomiji se tudi ne sme pričakovati, da na trg dolgoročno ne bodo vstopili novi konkurenti. Tretja sestavina tržne naravnanosti je medfunkcijska povezanost, ki se nanaša na pretok informacij v organizaciji. Vsak posameznik v organizaciji, zlasti kontaktno osebje, lahko pripomore k ustvarjanju višje vrednosti. Glede na pomembnost tržnih informacij za ustvarjanje vrednosti mora biti povezanost marketinške funkcije z drugimi poslovnimi funkcijami sistematično vključena v marketinško strategijo. Če v organizaciji ni tradicije (filozofije, kulture) medfunkcijske povezanosti, je treba na vodstveni ravni vzpostaviti sistem povezave in pretoka informacij med funkcijami, s čimer preprečimo izolacijo in pomanjkanje posameznih ustreznih informacij za razumevanje potreb in hotenj odjemalcev v posameznih funkcijah organizacije (Narver in Slater, 1990). Vključitev tretje sestavine, torej medfunkcijske povezanosti, pomeni, da morajo vsi deli organizacije skrbeti za zadovoljevanje potreb odjemalcev na trgih. Tržno naravnanost razumemo kot naravnanost celotne organizacije in ne le marketinške funkcije. Deng in Dart (1994) poudarjata, da je bilo učenje in sprejemanje prav te komponente v severnoameriških podjetjih najtežje in najverjetneje to velja za organizacije tudi pri nas. Homburg in Pflesser (2000) poudarjata, da je za doseganje tržne naravnanosti pomembno predvsem širjenje vrednot, ki podpirajo tržno naravnanost, organizacijske norme za razvijanje tržne naravnanosti in tako imenovani artefakti tržne naravnanosti, to so zgodbe, jezik in rituali, ki imajo za zaposlene lahko simboličen pomen. Iz Narverjeve in Slaterjeve (1990) opredelitve tržne naravnanosti je razvidno, da organizacijska kultura oziroma filozofija omogoča ustrezno naravnanost organizacije, ki ima ustrezne informacije o odjemalcih (o njihovih manifestnih in latentnih potrebah in o njihovem zaznavanju vrednosti). Takšna organizacija ima tudi ustrezne informacije o konkurentih, torej o njihovih strategijah in vplivih na 22 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. zaznavanje vrednosti pri odjemalcih, in je sposobna, da pridobljene informacije uporablja za učinkovito in uspešno zadovoljevanje odjemalcev. Kultura odraža norme, vrednote in prepričanja, ki spodbujajo vedenje v smeri tržne naravnanosti. Če iz kulture izhajajo marketinške aktivnosti, ki omogočajo uspešno delovanje organizacije, jo je izjemno težko posnemati in lahko postane vir konkurenčne prednosti (Barney, 1986). Tudi Deng in Dart (1994) podobno kot njuni predhodniki trdita, da so tržno naravnana podjetja sposobna ustvarjati ustrezne informacije, ki se nanašajo na trenutne in prihodnje potrebe odjemalcev in na relativne sposobnosti konkurentov, da te potrebe zadovoljujejo. Pomembna je tudi integracija in razširjanje pridobljenih informacij v vse oddelke organizacije. Deng in Dart (1994) trem dejavnikom dodajata še četrtega, to je naravnanost na dobiček. Avtorja namreč razlikujeta dobiček kot končni rezultat oziroma računovodski vidik naravnanosti in naravnanost na dobiček. Primer takšne naravnanosti je kompenzacija prodajnega osebja, ki temelji na razliki med kupno in prodajno ceno, s čimer se kaže vpogled prodajnega osebja v računovodske izkaze. Trdita namreč, da je lahko tudi segmentacija trga močan kazalnik naravnanosti na dobiček, saj vključuje pravilno odkrivanje dobičkonosnih ciljnih segmentov in posledično tudi pravilno opredelitev in oblikovanje tržne ponudbe. V zadnjih dvajsetih letih smo priča tudi temu, da se podjetja vse bolj osredotočajo tudi na latentne potrebe odjemalcev. To so potrebe, ki niso očitno izražene s strani odjemalcev ali pa se jih odjemalci sploh še ne zavedajo. Odjemalci sicer imajo neko določeno potrebo, vendar se ne zavedajo učinkovitejšega načina njenega zadovoljevanja. Za organizacijo torej ni dovolj, da pozna, razume in zadovoljuje le izražene oziroma manifestne potrebe odjemalcev. Zato lahko tržno naravnanost razdelimo na tako imenovano odzivno in proaktivno tržno naravnanost (Narver, Slater in MacLachlan, 2004). Odzivna tržna naravnanost se nanaša na razumevanje in zadovoljevanje izraženih potreb odjemalcev, medtem ko se proaktivna tržna naravnanost nanaša na razumevanje in zadovoljevanje prikritih (latentnih) potreb odjemalcev. Narver, Slater in MacLachlan (2004) poudarjajo, da je pomembno oboje. S proaktivno tržno naravnanostjo se organizacija ne le odziva na odjemalce, temveč jih dejansko vodi in tako dosega višjo raven njihovega zadovoljstva. 2 Tržna naravnanost 23. 2.4 Podobnosti in razlike med opredelitvami tržne naravnanosti Če pogledamo oba pristopa razumevanja tržne naravnanosti (Narver-Slaterjev in Kohli-Jaworskijev), ugotovimo, da se kljub različnim interpretacijam med seboj ne razlikujeta občutno. Narver in Slater (1990) ter Kohli in Jaworski (1990) so v definicijo zajeli pomen zbiranja informacij o odjemalcih in konkurentih. Obe opredelitvi poudarjata vlogo in pomen sodelovanja med različnimi funkcijskimi področji, kar je izvedljivo le, če v organizaciji obstaja ustrezen pretok informacij. Tako definiciji nista nasprotujoči, temveč skladni. Kot je prikazano na sliki 2, je to najprej v pridobivanju informacij o ciljnih skupinah in konkurentih (naravnanost na odjemalce in konkurente) in razširjanju pridobljenih informacij v vse oddelke organizacije, nato pa v uspešni in učinkoviti uporabi pridobljenih informacij na ciljnih trgih, za kar se potrebuje ustrezna povezanost med oddelki in posamezniki v organizaciji, ki vplivajo na ustvarjanje vrednosti na trgih. Sestavine tržne naravnanosti kot miselnosti Naravnanost na Naravnanost na (obstoječe in možne) (obstoječe in možne) Medfunkcijska povezanost konkurente ciljne skupine Vsaka sestavina tržne naravnanosti kot miselnosti vsebuje vedenjske dimenzije: • zbiranje ustreznih informacij, • razširjanje ustreznih informacij, • uporabo ustreznih informacij. Slika 2: Sestavine tržne naravnanosti Vir: Gabrijan, Milfelner, Snoj in Gaber (2005) Tržna naravnanost naj bi torej pomenila organizacijski okvir, ki bi se tedaj, ko ga organizacija sprejme in uvede, zakoreninil v organizacijski kulturi. Je posrednica med poslovnimi strategijami, ki se določajo na podlagi predhodne kulturne poslovne filozofije, to je koncept marketinga (Hunt in Morgan, 1995). Tržna naravnanost usmerja organizacijo v izbiro strategije, koncept pa usmerja menedžerje v to, da se osredotočajo na odjemalce organizacije. 24 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU B. Milfelner 3 Teorija merjenja v marketingu 3.1 Koncepti Preden se lotimo razlage konceptov in konstruktov, je treba poudariti, da je pri sestavljanju konstruktov pomembno razumevanje teorije oziroma teoretičnih marketinških pojmov. Wacker (1998) navaja tri razloge, zakaj je teorija za empirično raziskovanje pomembna. Prvič, predstavlja (teoretični) okvir za analizo, drugič, predstavlja učinkovito metodo za razvoj področja in tretjič, podaja razumljivo razlago posameznim pojmom. Teorija ima torej osrednjo vlogo v raziskovanju v marketingu. V idealnem primeru naj bi teoretična spoznanja vodila raziskavo, vendar tudi raziskave na različnih področjih marketinga lahko prispevajo k razvoju teorije (Udo Akang, 2012). Teorija in pregled teorije sta torej osnova za razvoj vsakega merjenja v marketingu, saj v teoriji najdemo razlago konceptov. Zato je za vsakega raziskovalca pri snovanju merjenja pomembno, da pozna teorijo, ki razlaga koncepte, ki jih želi meriti. Seveda pa moramo najprej odgovoriti na vprašanje, kaj koncepti sploh so? Ti se ne pojavljajo samo v znanosti, temveč so temelj človeškega mišljenja, ne glede na to, na kaj se mišljenje nanaša. Razumemo namreč tisto, kar lahko prepoznamo. Na primer besedo ali koncept televizorja prepoznamo po značilnosti, ki jih televizorju 26 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. pripisujemo. V družbenih znanostih pa koncepte prepoznamo in klasificiramo na podlagi spola, rase, izobrazbe, socialnih značilnosti. Koncepti predstavljajo posplošene abstrakcije. To pomeni, da imamo, ko poznamo koncept, neko splošno idejo, ki jo lahko povežemo z razumevanjem določenih pojmov (Jaccard in Jacoby, 2009). Koncept televizorja lahko povežemo z različnimi tipi in znamkami televizorja. V marketingu lahko na primer koncept zaznane vrednosti povežemo z različnimi znamkami in prepričanji odjemalcev glede tovrstnih znamk. Koncepti vsebujejo tudi neskončne možnosti. Koncept televizorja in televizije se z leti spreminja in se bo še spreminjal. Koncepti so hipotetični, kar pomeni, da so samo opisi in ideje realnosti in obstajajo samo v mislih ljudi in raziskovalcev (Jaccard in Jacoby, 2009). Čeprav so hipotetični, se lahko nanašajo na snovne stvari (npr. televizor, mačka itd.) ali na nesnovne pojme, kot so lakota, ljubezen, vrednost, zadovoljstvo. V znanosti in marketingu oblikujemo in uporabljamo koncepte, ker z njimi lažje obvladujemo zelo raznoliko realnost. Prav tako omogočajo red in klasifikacijo in posledično boljše razumevanje. Tako je v marketingu veliko lažje razumeti zadovoljstvo kot razmerje med pričakovano in zaznano vrednostjo, kot pa razumeti, kako se oblikuje zadovoljstvo pri vsakem posamezniku, v podjetju ali za vsak izdelek in panogo posebej. In od kod izvirajo marketinški koncepti? Zaltman et al. (1973) pravijo, da jih raziskovalci ustvarjamo, ko razmišljamo o reševanju marketinških raziskovalnih problemov. Velikokrat jih raziskovalci definirajo na podlagi kvalitativnega raziskovanja (poglobljenih intervjujev ali fokusnih skupin), s pomočjo novih raziskovalnih tehnik ali prenosa iz drugih znanosti (psihologije, vedenjske ekonomije itd.) (Grapentine, 2015). V družbenih znanostih, torej tudi v marketingu, koncepte merimo s pomočjo konstruktov, ki so največkrat kvantificirane spremenljivke. To pomeni, da lahko zavzamejo različne številske vrednosti. Lahko bi torej dejali, da so konstrukti kvantificirani koncepti. 3 Teorija merjenja v marketingu 27. Spol je tako na primer spremenljivka, ki lahko zavzame dve vrednosti (1 – moški spol, 2 – ženski spol), osebnostna lastnost znamke starost pa spremenljiva, ki lahko zavzame sedem vrednosti, če jo merimo na semantičnem diferencialu (od 1 – mlad do 7 – star). Vendar pa bomo v naslednjih poglavjih ugotovili, da vsi koncepti, ki jih želimo meriti v marketingu, niso enostavni. Prav nasprotno. To so kompleksni konstrukti, ki jih le redko lahko merimo z eno samo spremenljivko ali celo z enim samim konstruktom. 3.2 Osnove kvantitativnega merjenja v marketingu V marketingu, podobno kot v drugih družboslovnih vedah, merimo različne koncepte, ki se nanašajo na marketinško teorijo in prakso. Pogosto so to koncepti, ki se nanašajo na vedenje in odzive posameznikov, lahko pa zajamemo tudi stanja v organizacijah. Primeri konceptov, ki jih pogosto merimo v marketingu, so zadovoljstvo odjemalcev ali zaposlenih, zaznana vrednost, ugled znamke ali podjetja, tržna naravnanost in podobno. Zavedati se je treba, da je merjenje možno s kvalitativnimi (npr. poglobljeni intervjuji, projektivni testi) ali kvantitativnimi metodami (npr. spraševanje, opazovanje). Ker obravnavamo predvsem kvantitativno analizo podatkov, bomo v nadaljevanju teorijo merjenja spoznali z vidika kvantitativne analize. V okviru kvantitativnega merjenja značilnostim objekta (na primer organizacije) ali subjekta (na primer odjemalca) merjenja po določenih pravilih dodeljujemo vrednosti oziroma števila. Z vrednostjo določamo, ali ima objekt (subjekt) merjenja neko značilnost ali pa različne ravni značilnosti objektov merjenja oziroma dogodkov. Kot primer lahko navedemo dodeljevanje števila glede na spol respondenta v marketinški raziskavi. Osebi, ki je moškega spola, dodelimo številsko vrednost 1, osebi ženskega spola pa številsko vrednost 2. S tem smo opredelili, kakšno značilnost ima respondent (naš subjekt merjenja) glede na spol. Po drugi strani lahko z vrednostjo določamo tudi ravni značilnosti. Tako na primer respondentu, ki je zelo zadovoljen, dodelimo številsko vrednost 5, tistemu, ki je zadovoljen, številsko vrednost 4, tistemu, ki ni zadovoljen, pa številsko vrednost 1. 28 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. Pri tem se je treba zavedati, da v marketingu objektov in subjektov v večini primerov ne merimo neposredno, saj merimo le njihove značilnosti. Prav tako v družbeni znanosti veliko značilnosti ni neposredno merljivih, saj obstajajo le teoretični koncepti. Merimo lahko objektivne značilnosti, kot so starost, osebni dohodek, število kupljenih izdelkov, tržni delež organizacije in podobno. Merjenje takšnih objektivnih značilnosti je lahko precej enostavno. Vendar pa pri raziskavi pogosto merimo tudi subjektivno zaznane značilnosti posameznikov in organizacij, ki jih ne moremo neposredno opazovati, saj so to mentalni konstrukti, ki se nanašajo na posameznikova stališča in vedenje. V tem primeru mora marketinški raziskovalec s pomočjo merilne lestvice zajeti stališča in vedenje posameznika in organizacij na merilni kontinuum, kar je pogosto zahtevna naloga (Burns in Veeck, 2017). To še posebej velja, ker si koncepte lahko posamezniki (respondenti) predstavljajo na zelo različne načine. Zato je pomembno, da koncepte, ki jih želimo meriti, pred tem natančno definiramo. Presoja o tem, kaj neki koncept je in kaj ni, mora torej vedno ostati na strani marketinškega raziskovalca in je ne smemo prepuščati respondentom. Tabela 1: Trditve za merjenje tržne naravnanosti Trditve Konstrukt Zadovoljstvo odjemalcev merimo. Skrbno spremljamo in ocenjujemo aktivnosti za zadovoljevanje odjemalcev. Naravnanost na odjemalce Posebej se posvečamo poprodajnim storitvam. Naše strategije za doseganje konkurenčnih prednosti temeljijo na razumevanju potreb odjemalcev. Tržne informacije si izmenjujejo vse enote (oddelki, službe itd.) našega podjetja. V pripravo poslovnih strategij in načrtov so vključene vse enote (oddelki, službe itd.) podjetja. Medfunkcijska povezanost Informacije o odjemalcih so na voljo vsem v podjetju. Naše poslovne funkcije so povezane z namenom zadovoljevanja odjemalcev. Redno spremljamo trženjske dejavnosti svojih konkurentov. Uprava (poslovodstvo) pogosto razpravlja o prednostih in slabostih konkurentov. Naravnanost na konkurente Na aktivnosti konkurentov se hitro odzovemo. Naše prodajno osebje si medsebojno posreduje informacije o konkurentih. 3 Teorija merjenja v marketingu 29. Prav tako je treba poudariti, da so številni koncepti, ki jih merimo v marketingu, precej kompleksni, zato po njih ne moremo spraševati neposredno, torej samo z enim vprašanjem. Kot primer lahko navedemo merjenje tržne naravnanosti. Oseba, ki lahko poda najboljše mnenje o tržni naravnanosti v podjetju, je nedvomno marketinški menedžer. Vendar bi storili veliko napako, če bi tržno naravnanost ocenjevali le z vprašanjem: »Ocenite tržno naravnanost vašega podjetja na lestvici od 1 do 7.« Vsak marketinški menedžer ima namreč svojo presojo in mnenje o tem, kaj tržna naravnanost pomeni, zato je za raziskovalca pomembno, da presodi, s kolikimi vprašanji (spremenljivkami) je treba opredeliti koncept, da ga bomo lahko veljavno izmerili. To pomeni, da ga bomo izmerili v skladu z eno od definicij, ki smo jih na primer podali v drugem poglavju tega gradiva. Tržna naravnanost se običajno meri z več kot desetimi trditvami ali vprašanji. 3.3 Osnovne vrste merilnih lestvic Kot smo zapisali v prejšnjem poglavju, v okviru kvantitativnega merjenja značilnostim objekta ali subjekta merjenja po določenih pravilih dodeljujemo vrednosti oziroma števila. Izbira ene od štirih osnovnih vrst merilnih lestvic določa pravilo, ki ga bomo uporabili pri dodeljevanju števil. Vsi podatki namreč niso enaki. Uporabljamo jih lahko za razlikovanje, klasificiranje, razvrščanje ali za merjenje razsežnosti neke značilnosti. Osnovna vrsta merilne lestvice tudi neposredno določa, katere statistične metode za obdelavo podatkov lahko uporabimo. Kadar na primer številska vrednost določa spol respondenta, ni smiselno izračunavati aritmetične sredine, je pa to smiselno, kadar številska vrednost določa starost respondenta. Osnovna merilna lestvica je niz simbolov oziroma številskih vrednosti, ki so sestavljeni tako, da lahko simbol ali številsko vrednost po pravilu dodelimo respondentu glede na njegovo stališče ali vedenje. Če je respondent prebivalec Slovenije, mu dodelimo število 1, če je prebivalec Hrvaške, število 2, če pa je prebivalec Avstrije, pa število 3. Drugačen primer je dodeljevanje vrednosti glede na strinjanje s trditvijo. To pomeni, če se respondent s trditvijo popolnoma strinja, mu dodelimo vrednost 5, če se ne strinja, pa vrednost 1. 30 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. Poznamo štiri osnovne vrste merilnih lestvic, ki jih prikazujemo v nadaljevanju, in sicer nominalno, vrstno, intervalno in razmernostno merilno lestvico. 3.3.1 Nominalna lestvica Pri nominalni lestvici števila uporabljamo le kot oznake za identifikacijo in klasifikacijo objekta ali subjekta merjenja. Kadar uporabljamo števila za identifikacijo, obstaja stroga povezava med številom in objektom merjenja. Števila ne predstavljajo obsega karakteristike, ki jih imajo subjekti ali objekti merjenja. Edina dovoljena operacija pri številih pri nominalni lestvici je zajemanje njihovih frekvenc in deležev (njihovo preštevanje). Po navadi jih prikazujemo kot deleže in ne kot druge statistične vrednosti, npr. povprečna vrednost. 3.3.2 Vrstna (ordinalna) lestvica Lestvica, pri kateri so števila dodeljena objektom za določevanje relativnega obsega, v okviru katerega ima objekt ali subjekt določeno značilnost. Določimo lahko, ali ima več ali manj neke značilnosti kot drugi objekt ali subjekt, vendar ne vemo, koliko več oziroma koliko manj. Pri tej lestvici respondente ali njihove značilnosti razvrstimo po določenem vrstnem redu. V ospredju je torej dodeljevanje števil, s pomočjo katerih razvrščamo objekte (npr. od najboljšega do najslabšega izdelka, od najbolj do najmanj preferiranega itd.). Po navadi podatke, pridobljene s to lestvico, obdelamo z mediano, modusom ali ranžirnimi vrstami. Izjemoma računamo tudi povprečne vrednosti. 3.3.3 Intervalna lestvica Pri intervalni lestvici numerično enake razdalje na lestvici predstavljajo enake vrednosti pri značilnostih, ki jih merimo. Ta lestvica omogoča primerjavo razlik med različnimi objekti merjenja, ne omogoča pa izračunavanja razmerij. Za to lestvico je značilno tudi, da točka 0 ni določena. Enota in ničelna točka sta lahko izbrani poljubno (npr. od 1 do 5 in od –2 do +2). Ker večina vedenjskih značilnosti (npr. stališča) v mislih respondentov obstaja na kontinuumu od ene do druge skrajnosti, se ta lestvica v marketinških raziskavah pogosto uporablja. Številske vrednosti uporabljamo za označbo razdalj med različnimi mesti lestvice. Smiselne statistične 3 Teorija merjenja v marketingu 31. metode, ki jih najpogosteje uporabljamo, so aritmetična sredina, standardni odklon in druge statistične metode. Tabela 2: Merilne lestvice, deskriptivne in analitične metode Merilna lestvica Deskriptivne metode Analitične metode Nominalna lestvica Frekvence, odstotki, modus, križno tabeliranje Hi-kvadrat test Korelacija ranga, test značilnosti Vrstna lestvica Mediana, modus, ranžirne vrste razlik, nemetrično multidimenzionalno skaliranje Korelacijska analiza, diskriminantna Intervalna lestvica Aritmetična sredina, standardni odklon analiza, analiza variance, metrično multidimenzionalno skaliranje Proporcionalna lestvica Enako kot pri intervalni skali Enako kot pri intervalni lestvici 3.3.4 Razmernostna (proporcionalna) lestvica Razmernostna lestvica ima vse značilnosti lestvic, ki smo jih opisali pri drugih lestvicah. Ima tudi absolutno ničlo, ki je pomembna, saj je pri podatkih, ki jih pridobimo s tovrstno lestvico, smiselno izračunavanje razmerij. Absolutna ničla je določena z absolutnim konsenzom in jo respondenti lahko enostavno razumejo. Primeri vključujejo merjenje števila nakupov v določenem obdobju, obseg porabljenega denarja, število članov gospodinjstva itd. Pri proporcionalnih lestvicah lahko uporabljamo vse statistične tehnike, najpogosteje pa uporabljamo povprečno vrednost in standardni odklon. Kot smo zapisali, je z osnovno vrsto merilne lestvice povezana tudi metoda obdelave podatkov. V tabeli navajamo osnovne deskriptivne in druge analitične metode, ki jih lahko uporabljamo glede na vrsto osnovne merilne lestvice. 3.4 Merski modeli z latentnimi in manifestnimi spremenljivkami Do zdaj smo podali definicijo konceptov in ugotovili, da koncepte merimo s pomočjo konstruktov, ki jih kvantificiramo, pri tem pa uporabljamo osnovne principe kvantitativnega merjenja v marketingu oziroma osnovne merilne lestvice. Ugotovili smo tudi, da večine konstruktov ne moremo enostavno meriti, kar pomeni, da jih moramo opredeliti z več spremenljivkami. To izhaja iz dejstva, da je 32 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. večina marketinških konstruktov tako kompleksnih, da jih ne moremo izmeriti z enim samim vprašanjem. V teoriji merjenja razlikujemo med latentnimi in opazovanimi spremenljivkami latentnih spremenljivk. Opazovane spremenljivke imenujemo tudi manifestne spremenljivke. Latentne spremenljivke so torej pravi konstrukti, ki jih želimo meriti, vendar jih ne moremo neposredno opazovati. To pomeni, da v marketinških raziskavah po latentnih spremenljivkah ne sprašujemo neposredno in jih ne merimo neposredno z vprašanji ali trditvami. Manifestne spremenljivke po drugi strani odražajo latentno spremenljivko in omogočajo merjenje kompleksnih konstruktov oziroma latentnih spremenljivk. So torej kazalniki latentne spremenljivke. V marketinških raziskavah merimo manifestne spremenljivke neposredno, največkrat z vprašanji ali trditvami, ki sestavljajo lestvico. Latentnih spremenljivk v marketinških raziskavah neposredno ne merimo. ξ1 λ1 λ2 λ3 x1 x2 x3 δ2 δ2 δ3 Slika 3: Primer merskega modela z eno latentno in tremi manifestnimi spremenljivkami Vir: lasten. Kot primer lahko navedemo konstrukt zadovoljstva, ki smo ga že omenili. Iz teorije vemo, da je odjemalec zadovoljen takrat, ko izrazi svoje zadovoljstvo s storitvijo (x1), ko so izpolnjena njegova pričakovanja (x2) in ko je vesel, da je izbral določenega ponudnika storitve (x3). Ker zadovoljstva ne moremo meriti neposredno, lahko opazujemo oziroma raziskujemo manifestacije zadovoljstva pri odjemalcu. Na naslednji sliki grafično prikazujemo takšen merski model. Latentna spremenljivka zadovoljstvo je predstavljena v krogu in označena z grško črko ξ (ksi), tri manifestne 3 Teorija merjenja v marketingu 33. spremenljivke pa v kvadratih in označene s črko x. Puščica poteka v smeri od latentne k manifestnim spremenljivkam, kar pomeni, da se zadovoljstvo odraža v treh dejavnikih, ki smo jih navedli, in ne obratno. Grška črka δ (delta) označuje še rezidual oziroma vrednost napake, kot ga pogosto imenujemo. To je merska napaka, saj v modelu nikoli ne moremo v celoti pojasniti latentne spremenljivke, v našem primeru zadovoljstva, saj poleg zadovoljstva vplivajo na tri dejavnike tudi drugi, vseh pa nikoli ne moremo upoštevati. V idealnem primeru je rezidual majhen. Povezava med latentno in manifestno spremenljivko, torej konstruktom in kazalniki konstrukta, je opredeljena z grško črko λ (lambda). V večini primerov predpostavljamo, da je to enostavna linearna povezava. Kot bomo v nadaljevanju spoznali, to povezavo pogosto imenujemo faktorska utež. 34 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU B. Milfelner 4 Veljavnost in zanesljivost merilnih lestvic 4.1 Proces razvoja merilne lestvice Snovanje merilne lestvice je proces, ki ima določene stopnje in jim marketinški raziskovalec mora slediti. Namen posameznih stopenj je razvoj lestvice, ki je veljavna in zanesljiva. Veljavnost pomeni, da merilna lestvica meri prav tisti koncept, ki ga raziskovalec želi meriti, zanesljivost pa, da merilna lestvica podaja konsistentne rezultate tudi pri ponavljajočih se merjenjih. Kot smo ugotovili, potrebujemo v marketingu za merjenje konceptov (konstruktov) lestvice z več postavkami (vprašanji ali trditvami). Primeri takšnih lestvic sta semantični diferencial ali Likertova lestvica. Obe sta sestavljeni iz več trditev oziroma postavk. Razvoj lestvice z več postavkami je proces, ki ga prikazujemo na sliki 4. Raziskovalec začne z razvojem teorije, kjer definira koncept. Za to je pomemben dober pregled znanstvene in strokovne literature. Naslednji korak je priprava nabora vprašanj oziroma trditev. To je možno storiti na osnovi pregleda literature (prevzem oziroma prilagoditve obstoječih lestvic) ali preliminarne kvalitativne raziskave. Sledi stopnja kvalitativne presoje raziskovalca in drugih vključenih v proces razvoja lestvice, v okviru katere zmanjšamo število vprašanj ali trditev na ustrezno raven. Na 36 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. tej stopnji pogosto sodelujejo akademiki ali strokovnjaki iz stroke, ki obravnavajo koncept, ki ga marketinški raziskovalec želi meriti. Skrajšan niz vprašanj oziroma trditev je lahko še vedno predolg ali pa ga sestavljajo neustrezna vprašanja ali trditve, zato na stopnji preizkusa merilne lestvice uporabljamo tudi kvantitativne statistične metode. V ta namen najprej raziskovalci zberejo podatke na manjšem (preizkusnem) vzorcu in analizirajo podatke s statističnimi tehnikami za preverjanje veljavnosti in zanesljivosti, ki jih bomo opisali v nadaljevanju (največkrat faktorska analiza, korelacija in preverjanje zanesljivosti). Rezultat te stopnje je lestvica z manjšim številom vprašanj ali trditev, torej prečiščena lestvica. Pri prečiščeni lestvici znova preverimo veljavnost, zanesljivost in posplošljivost z že omenjenimi statističnimi tehnikami. Na osnovi vseh presoj pridobimo končno merilno lestvico. Kot je prikazano na sliki, se proces ponavlja z več možnimi povratnimi zankami. Razumevanje in/ali razvoj teorije Priprava nabora vprašanj ali trditev: teorija, sekundarni podatki, kvalitativna raziskava Izbira manjšega niza vprašanj ali trditev po presoji raziskovalca Zbiranje podatkov na testnem vzorcu Statistična analiza Razvoj prečiščene lestvice Zbiranje podatkov na končnem vzorcu Ovrednotenje zanesljivosti, veljavnosti in posplošljivosti lestvice Končna merilna lestvica Slika 4: Proces razvoja lestvice z več kazalniki Vir: Prilagojeno po Malhotra et al. (2017) 4 Veljavnost in zanesljivost merilnih lestvic 37. 4.2 Natančnost merjenja Natančnost merjenja merilne lestvice v marketinških raziskavah zagotavljamo s preverjanjem veljavnosti in zanesljivosti merilnih lestvic. O obeh konceptih bomo podrobneje razpravljali v nadaljevanju. Da bi ju bolje razumeli, moramo najprej opredeliti, na kaj se natančnost merjenja nanaša in kakšne napake lahko nastanejo pri merjenju z merilnimi lestvicami v marketinških raziskavah. Meritev je vrednost (pri kvantitativnem merjenju je to številska vrednost), ki odraža značilnost objekta ali subjekta merjenja. Meritev nikoli ni popolnoma natančna vrednost, ki odraža značilnost, temveč zgolj opazovana vrednost. V marketinških raziskavah na napake merjenja namreč vplivajo številni dejavniki, kar se odraža v dejstvu, da izmerjena vrednost ni vedno enaka dejanski vrednosti značilnosti, ki jih merimo. Če želimo izmeriti, ali so odjemalci zadovoljni s turistično storitvijo, jih lahko, kot smo prikazali v poglavju 3.3, prosimo, da svoje zadovoljstvo ocenijo z opredelitvijo strinjanja z naslednjimi trditvami po petstopenjski Likertovi lestvici (od 1 – nikakor se ne strinjam do 5 – popolnoma se strinjam): − Z bivanjem v tem hotelu sem zadovoljen. − Ta hotel je popolnoma izpolnil moja pričakovanja. − Vesel sem, da sem izbral ta hotel. Kako pa bomo ugotovili, da te trditve resnično merijo, ali so bili naši odjemalci zadovoljni s hotelom? Vprašamo se lahko, ali vprašanja resnično merijo tisto, kar smo želeli meriti, torej, ali je tisto, kar sprašujemo, hkrati tudi tisto, kar želimo izmeriti. Naša meritev mora torej čim natančneje odražati koncept, ki ga merimo. V tem primeru bo tudi napaka merjenja manjša. Malhotra et al. (2017) opredeljuje napake merjenja po naslednjem modelu: XO = XT + XS + XR 38 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. Pri čemer je: − XO = napaka merjenja − XT = resnična vrednost značilnosti merjenja − XS = sistematična napaka − XR = naključna napaka Napaka merjenja, kot je razvidno, vsebuje sistematične in naključne napake. Predvsem sistematične napake so tiste, ki vplivajo na rezultate merjenja. To so dejavniki, ki povzročajo, da je naša meritev višja ali nižja, kot bi morala biti. Po drugi strani naključne napake povzročajo (naključno) variabilnost med tistim, kar dejansko merimo, in tistim, kar želimo meriti. Naključne napake torej niso stalne, saj so to dejansko kratkoročni dejavniki, ki na opazovane vrednosti vplivajo različno pri vsakem ponavljajočem se merjenju. Sistematični in naključni dejavniki, ki vplivajo na natančnost merjenja, so lahko naslednji (Malhotra in Birks, 2017): − Stabilni dejavniki respondentov, ki vplivajo na različno ocenjevanje, kot so njihova inteligenca, stopnja izobrazbe in želja po družbeni sprejetosti. − Kratkoročni osebni dejavniki, kot so zdravje, čustva in utrujenost. − Situacijski dejavniki, kot so prisotnost drugih ljudi, hrup in drugi moteči dejavniki. − Vprašanja, vključena v merilno lestvico (večje in manjše število vprašanj). − Fizični dejavniki, kot so slab tisk ali prikaz vprašalnika na zaslonu, preveliko število vprašanj na prikazni strani ali slab dizajn vprašalnika. − Slaba razumljivost vprašanj ali trditev (na primer dvojna vprašanja), kot tudi slaba navodila za izpolnjevanje. − Slaba administracija vprašalnika in razlike pri postavljanju vprašanj med osebami, ki izvajajo spraševanje. − Analitični dejavniki, kot so razlike v ocenjevanju in statističnih analizah. 4 Veljavnost in zanesljivost merilnih lestvic 39. Prav razumevanje razlik med sistematičnimi in naključnimi napakami kaže potrebo po razlikovanju med veljavnostjo in zanesljivostjo merjenja, ki ju predstavljamo v naslednjih podpoglavjih. 4.2.1 Veljavnost merjenja Z zagotavljanjem veljavnosti merjenja se skušamo izogniti sistematičnim napakam pri merjenju. Vsaka lestvica, ki ni veljavna, dejansko ni uporabna, saj ne meri koncepta (konstrukta), ki ga raziskovalec želi izmeriti (Sarstedt in Mooi, 2014). Veljavnost merjenja se torej nanaša na raven, do katere merilna lestvica ustrezno ocenjuje značilnosti konstrukta na reprezentativnem vzorcu in raven, do katere merilna lestvica ni 'okužena' z dejavniki, ki merijo druge konstrukte. Veljavnost merjenja, torej veljavnost konstrukta, se nanaša na to, ali marketinški raziskovalec resnično meri to, kar želi meriti. V tem primeru je vrednost sistematične napake merjenja enaka nič. Veljavnost lestvice in konstrukta je tako opredeljena z ravnjo, do katere opazovane vrednosti na lestvici odražajo dejanske vrednosti konstrukta in ne sistematične in naključne napake. V nadaljevanju predstavljamo različne vrste veljavnosti konstrukta, ki jih lahko preverjamo. Vsebinska veljavnost Vsebinska veljavnost (angl. content validity, nekateri avtorji pojem enačijo tudi s face validity) se nanaša na ocenjevanje veljavnosti vsebine lestvice. To je sistematična, a subjektivna presoja o tem, kako dobro vsebina lestvice predstavlja koncept, ki ga želimo izmeriti. Za ocenjevanje vsebinske veljavnosti mora raziskovalec najprej opredeliti koncept, ki ga želi izmeriti, za kar je seveda nujno, da pozna definicijo koncepta – kaj koncept predstavlja in česa ne. Zadovoljstvo je v marketingu, kot smo že omenili, največkrat definirano kot razmerje med pričakovano in zaznano vrednostjo. Ta definicija opredeli, kaj morajo vključevati trditve ali vprašanja, ki sestavljajo merilno lestvico, s katerimi želimo izmeriti zadovoljstvo. 40 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. Vsebinsko veljavnost preverjamo tako, da raziskovalec ali skupina raziskovalcev, ki obravnavajo področje merjenja, pregledajo merilno lestvico in presodijo, ali ta ustrezno odraža in zajema celoten obseg koncepta. Po navadi lestvico preverijo akademiki ali strokovnjaki s specifičnega področja marketinga, ki ga zajema koncept, in presodijo, ali resnično odraža, kar želimo izmeriti. Strokovnjakom zato po navadi tudi predstavimo definicijo koncepta, ki smo jo uporabili za pripravo lestvice. To pomeni, da vsebinsko veljavnost preverjamo in dosegamo pred dejanskim merjenjem oziroma preden začnemo zbirati podatke na preizkusnem ali končnem vzorcu. Ne pozabimo, da lestvica, ki ni vsebinsko veljavna, ni uporabna, saj z njo ne merimo konceptov, ki smo jih želeli izmeriti. Prav zaradi tega je preverjanje vsebinske veljavnosti ključno pri procesu priprave veljavne merilne lestvice. Veljavnost konstrukta Veljavnost konstrukta se nanaša na značilnosti konstrukta, ki ga želi marketinški raziskovalec meriti. Pri merjenju veljavnosti konstrukta raziskovalec želi empirično preveriti, ali vprašanja, ki merijo posamezni konstrukt, dejansko merijo isto latentno spremenljivko. Za ocenjevanje veljavnost konstrukta je tako pomembno ugotoviti, katere spremenljivke ga sestavljajo in kako so povezane s pripadajočim konstruktom in z drugimi konstrukti. Veljavnost konstrukta preverjamo tudi z namenom, da izboljšamo lestvico in jo še bolj približamo teoriji. Veljavnost merjenja opredelimo kot odstopanje izbranih merjenih spremenljivk od teoretičnih spremenljivk. Diamantopoulos in Siguaw (2000) poudarjata, da je veljavnost obseg, do katerega spremenljivke, torej vprašanja ali trditve, dejansko merijo koncepte, ki naj bi jih merili. O veljavnosti konstrukta največkrat govorimo, kadar je zadoščeno vsaj dvema oblikama veljavnosti, in sicer konvergentni in diskriminantni veljavnosti (Aaker et al., 2001). Kot lahko opazimo, smo pri preverjanju vsebinske veljavnosti večinoma govorili o definiciji koncepta. Tukaj pa so v ospredju konstrukti, ki so, kot smo že predstavili, kvantificirani koncepti oziroma največkrat latentne spremenljivke. V nasprotju z vsebinsko veljavnostjo pa veljavnost konstrukta preverjamo takrat, ko so podatki že zbrani (na primer na preizkusnem ali končnem vzorcu). Veljavnost konstrukta 4 Veljavnost in zanesljivost merilnih lestvic 41. preverjamo s statističnimi metodami. Ocenjujemo jo z ocenjevanjem treh vrst veljavnosti, in sicer: − konvergentne veljavnosti, − diskriminantne veljavnosti in − nomološke veljavnosti. Konvergentna in diskriminantna veljavnost Konvergentna veljavnost se nanaša na medsebojno povezanost vprašanj ali trditev oziroma spremenljivk, s katerimi merimo iste konstrukte. Če dve ali več spremenljivk (vprašanj ali trditev) merijo iste konstrukte, pomeni, da morajo biti med seboj močno povezane. Z drugimi besedami, povezava med spremenljivkami, ki sestavljajo isti konstrukt, mora biti visoka. Diskriminantna veljavnost se po drugi strani nanaša na medsebojno povezanost vprašanj, trditev oziroma spremenljivk, s katerimi merimo različne konstrukte. Če dve ali več spremenljivk (vprašanj ali trditev) merijo različne konstrukte, pomeni, da morajo biti med seboj šibko povezane. Z drugimi besedami, povezava med spremenljivkami istega konstrukta mora biti večja kot povezava med spremenljivkami različnih konstruktov. Konvergentno in diskriminantno veljavnost razlagamo na sliki 5, kjer sta prikazana dva konstrukta (dve latentni spremenljivki), oba z dvema manifestnima spremenljivkama (vprašanjema ali trditvama). Če želimo konvergentno in diskriminantno veljavna konstrukta, pomeni, da mora biti povezava med spremenljivkama pripadajočega konstrukta močnejša kot povezava med spremenljivkami ne pripadajočih konstruktov. Tako povezava med x1 in x2 mora biti močnejša kot na primer povezava med x1 in x3 in x1 in x4. Konvergentno in diskriminantno veljavnost lahko preverimo s Pearsonovim korelacijskim koeficientom, kjer izračunamo korelacijsko matriko. Drugi možni pristop je izvedba raziskovalne (eksploratorne) faktorske analize, tretji pa izvedba potrjevalne (konfirmatorne) faktorske analize (Lehman, 1988). Vsemetode bomo predstavili v nadaljevanju.. 42 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. ξ1 ξ2 λ1 λ2 λ3 λ4 x1 x2 x3 x4 δ1 δ2 δ3 δ4 Slika 5: Konstrukt z dvema latentnima spremenljivkama in štirimi manifestnimi Vir: lasten. Nomološka veljavnost Nomološka veljavnost se nanaša na to, v kolikšni meri so konstrukti, ki jih merimo z merilno lestvico, povezani z drugimi konstrukti. Dejansko so to povezave med latentnimi spremenljivkami. Če so konstrukti med seboj povezani glede na teoretične domneve, morajo enako pokazati tudi statistične analize. Po navadi raziskovalec v ta namen pripravi konceptualni model, v okviru katerega opredeli hipoteze. Te predstavljajo nomološko mrežo, v kateri so različni konstrukti med seboj povezani (Malhotra in Birks, 2017). Preverjanje nomološke veljavnosti se torej odvija na ravni preizkusa hipotez. Inova- Zvestoba tivnost odjemalcev Tržna Finančna naravnanost uspešnost Ugled Tržni delež in obseg prodaje Slika 6: Primer konceptualnega modela z vplivi med konstrukti Vir: lasten. 4 Veljavnost in zanesljivost merilnih lestvic 43. Kriterijska veljavnost Pogosto v literaturi najdemo v povezavi z veljavnostjo merjenja še pojem kriterijska veljavnost (angl. criterion validity) (Sarstedt in Mooi, 2014; Malhotra in Birks, 2017), ki pa jo redkeje preverjamo. Kriterijsko veljavnost preizkusimo, če vemo, da se mora meritev določene merilne lestvice nanašati na vnaprej znan rezultat. Na primer meritev stališč in/ali nakupnih namer bi morala sovpadati z dejansko prodajo. Kriterijsko veljavnost delimo na trenutno (angl. concurrent validity) in napovedovalno (angl. predictive validity). Trenutno veljavnosti merimo takrat, ko so podatki, ki smo jih pridobili z lestvico (na primer stališča), in kriterijska spremenljivka (na primer obseg prodaje) pridobljeni v istem časovnem obdobju. Napovedovalna veljavnost se nanaša na sposobnost lestvice za napovedovanje v prihodnosti. Raziskovalec najprej zbere podatke na lestvici v določenem časovnem obdobju in primerja rezultate z dejanskim stanjem v prihodnosti. S takšnim merjenjem lahko preverimo, kako dobro lahko s stališči odjemalcev, ki smo jih izmerili na določeni lestvici, napovedujemo prihodnje nakupe odjemalcev. 4.2.2 Zanesljivost merjenja Zanesljivost merjenja se nanaša na konsistentnost rezultatov merilne lestvice v ponavljajočih se obdobjih. Sistematične napake merjenja ne vplivajo na zanesljivost merjenja, nanj vplivajo predvsem naključne napake. Zanesljivost merjenja lahko ocenjujemo na različne načine. V literaturi največkrat zasledimo dva načina merjenja zanesljivosti, in sicer: − dvojni preizkus zanesljivosti (angl. test – retest reliability), − preizkus interne konsistentnosti (angl. internal consistency reliability). Pri dvojnem preizkusu gre za to, da so rezultati merjenja, ki jih zberemo v dveh različnih časovnih obdobjih, enaki. Raziskovalci po navadi zberejo podatke z isto merilno lestvico v dveh časovnih obdobjih na istem vzorcu in s pomočjo korelacijskega koeficienta ocenijo, kako močno so enake spremenljivke povezane med seboj. Večja je povezanost med rezultati (večja je korelacija med enakimi 44 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. spremenljivkami), večja je zanesljivost lestvice (Shukla, 2008; Sarstedt in Mooi, 2014). Takšen postopek je sicer zelo zamuden in drag, zato se redko uporablja. Bolj uveljavljen in pogost način je preverjanje interne konsistentnosti. V tem primeru seštejemo vrednosti, ki smo jih pridobili na lestvici, in tako pridobimo skupno vrednost. Vsaka spremenljivka (vprašanje) mora meriti del konstrukta, ki ga želimo meriti. Obstajajo različne tehnike za ocenjevanje zanesljivosti, a najbolj uveljavljena je tehnika razdeljenih polovic ali Cronbachova alfa. V tem primeru se lestvica razdeli na dve polovici, za vsako od polovic pa se izračuna skupna vrednost. Nato se izračuna korelacija med obema polovicama. Če je korelacija visoka, je to kazalnik visoke interne konsistentnosti lestvice. Cronbachova alfa, ki je višja od 0,7, kaže visoko zanesljivost lestvice. Nekatere raziskave (na primer Cortina, 1993) so razkrile, da je koeficient Cronbachova alfa občutljiv na število vprašanj oziroma trditev (spremenljivk), ki sestavljajo lestvico. Ta je lahko sprejemljiva (na primer večja od 0,7) kljub pomanjkanju zanesljivosti lestvice, kadar lestvico sestavlja veliko trditev oziroma vprašanj. Zato moramo koeficient vedno ocenjevati tudi iz tega vidika. TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU B. Milfelner 5 Preverjanje veljavnosti in zanesljivosti lestvice V tem poglavju bomo obravnavali praktične vidike preverjanja veljavnosti in zanesljivosti lestvice. Najbolj pogosta metoda, ki jo za to uporabljamo, je faktorska analiza. Najprej opisujemo pomen in značilnosti raziskovalne faktorske analize, nato pa podajamo praktični primer preverjanja veljavnosti merilne lestvice. Posebej poudarjamo, da v tem gradivu obravnavamo samo raziskovalno faktorsko analizo, potrjevalno faktorsko analizo pa predstavljamo v poglavju, kjer obravnavamo modeliranje strukturnih enačb.Potrjevalna faktorska analiza se prav tako pogosto uporablja za preverjanje veljavnosti konstruktov. 5.1 Raziskovalna faktorska analiza in preverjanje veljavnosti merilne lestvice Pojem faktorska analiza se po navadi uporablja kot krovno ime za vrsto statističnih postopkov in tehnik, ki jih lahko uporabljamo z namenom zmanjševanja in povzemanja večjih količin podatkov. Kot takšna se v marketinškem raziskovanju uporablja tudi za preverjanje veljavnosti merilnih lestvic, saj je v tem primeru veliko število spremenljivk (vprašanj, trditev), ki so med seboj povezane in predstavljajo pripadajoče konstrukte. S pomočjo faktorske analize lahko povezave med nizi 46 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. medsebojno povezanih spremenljivk proučimo in jih predstavimo v obliki pripadajočih faktorjev. Podali smo že primer zadovoljstva, ki ga merimo s tremi spremenljivkami (vprašanji, trditvami). Drugi konstrukti na področju marketinga (na primer kakovost storitev) so lahko kompleksnejši in jih merimo na semantičnem diferencialu ali Likertovi lestvici. Takšne meritve lahko s pomočjo faktorjev lažje razlagamo ali pa preverimo, ali lestvica dejansko meri konstrukte (faktorje), ki jih raziskovalec želi meriti. Faktorsko analizo izvajamo torej v naslednjih primerih: − Za iskanje ustreznih dimenzij oziroma faktorjev, ki razlagajo korelacije med nizi spremenljivk (na primer preverjanje, ali vsa vprašanja lestvice merijo isti konstrukt, oziroma za ugotavljanje števila konstruktov, ki jih meri lestvica). − Za oblikovanje novega niza oziroma manjšega števila nepovezanih spremenljivk, s pomočjo katerih povzamemo večje število med seboj povezanih spremenljivk (zelo težko je preverjati povezave med kompleksnimi konstrukti, kot so zaznana vrednost, zadovoljstvo in kakovost storitev, saj vsakega od konstruktov sestavlja večje število med seboj povezanih spremenljivk). − Za iskanje manjšega niza spremenljivk, kadar ne vemo, kako so te spremenljivke med seboj povezane in kako jih respondenti razumejo (pri eksploratornem oziroma vpoglednem raziskovanju in pri procesu definiranja novih konceptov pogosto izmerimo spremenljivke, za katere ne vemo, kako so med seboj povezane oziroma v katere konstrukte ali faktorje se združujejo). V raziskovanju v marketingu se faktorska analiza najpogosteje uporablja v naslednjih primerih (Malhotra et al., 2017): − Pri preverjanju veljavnosti konstrukta merilne lestvice (to bomo podrobneje obravnavali v naslednjih poglavjih). − Pri segmentaciji odjemalcev za ugotavljanje niza spremenljivk, ki se nanašajo na različne segmente odjemalcev (na primer demografske, vedenjske, psihografske, geografske spremenljivke). 5 Preverjanje veljavnosti in zanesljivosti lestvice 47. − Pri raziskovanju izdelkov za ugotavljanje značilnosti znamk, ki vplivajo na odločitve odjemalcev. − Pri raziskavah, ki se nanašajo na marketinško komuniciranje, za razumevanje medijev in vedenja ciljnega občinstva na ciljnih trgih. − Pri raziskavah cene, kjer lahko proučujemo značilnosti cenovno občutljivih kupcev. 5.2 Faktorski model V tem poglavju bomo predstavili faktorski model oziroma matematični model, na podlagi katerega izračunamo faktorsko analizo. V nasprotju z regresijsko analizo, ki jo bomo spoznali pozneje, faktorska analiza ne kategorizira spremenljivk na odzivne (odvisne) in napovedovalne (neodvisne). Pri faktorski analizi namreč izračunamo manjše nize spremenljivk, ki temeljijo na povezanosti osnovnih spremenljivk, s katerimi smo začeli analizo, pri tem pa v novo izračunanih spremenljivkah (faktorjih) še vedno ohranimo večino informacij osnovnih spremenljivk (Janssens et al., 2008). Faktorska analiza temelji na principu izračuna faktorjev, pri čemer je vsaka spremenljivka izražena kot linearna kombinacija posameznih faktorjev. Delež variance spremenljivke, ki je enak z varianco drugih spremenljivk, ki so vključene v analizo, imenujemo komunaliteta. Kovarianca med spremenljivkami je pri faktorski analizi opisana v smislu manjšega števila splošnih faktorjev in unikatnih faktorjev za vsako spremenljivko, ki pa jih pri faktorski analizi ne opazujemo. Če so spremenljivke standardizirane, analitični faktorski model izraža vsako merjeno spremenljivko kot funkcijo splošnih faktorjev in standardiziranih multiplih regresijskih koeficientov spremenljivke na splošni faktor: 𝑋𝑋𝑖𝑖 = 𝐴𝐴1𝑖𝑖𝐹𝐹1 + 𝐴𝐴2𝑖𝑖𝐹𝐹2 + ⋯ + 𝐴𝐴𝑚𝑚𝑖𝑖𝐹𝐹𝑚𝑚 Pri čemer je: − Xi = standardizirana spremenljivka 48 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. − Ami = standardiziran multipli regresijski koeficient spremenljivke i za splošni faktor m − F = splošni faktor − m = število splošnih faktorjev Faktorje lahko definiramo po naslednji enačbi: 𝐹𝐹𝑖𝑖 = 𝑊𝑊𝑖𝑖1𝑋𝑋1 + 𝑊𝑊𝑖𝑖2𝑋𝑋2 + ⋯ + 𝑋𝑋𝑖𝑖𝑖𝑖𝑋𝑋𝑖𝑖 Pri čemer je: − Fi = ocena i faktorja i − Wi = faktorska utež − K = število spremenljivk Faktorske uteži lahko določimo tako, da prvi faktor pojasnjuje največji delež celotne variance vseh spremenljivk, ki jih uvrstimo v faktorsko analizo, nato drugega tako, da pojasnjuje drugi največji delež preostale variance, ki ni koreliran s prvim faktorjem. Na enak način lahko določimo druge uteži preostalih faktorjev. Faktorji so torej določeni tako, da v nasprotju z drugimi spremenljivkami njihove vrednosti niso povezane (Malhotra et al., 2017). 5.3 Potek faktorske analize pri preverjanju veljavnosti merilne lestvice Faktorsko analizo izvedemo v več stopnjah, in sicer: − Priprava niza vprašanj za konstrukt, pri čemer pred tem preverimo vsebinsko veljavnost. − Zbiranje podatkov na preizkusnem (n > 30) ali reprezentativnem (končnem) vzorcu. − Izbira metode ekstrakcije faktorjev. − Izvedba faktorske analize. − Interpretacija faktorske rešitve. − Zmanjševanje (izločanje) števila spremenljivk (vprašanj, trditev). − Poimenovanje faktorjev (konstruktov). 5 Preverjanje veljavnosti in zanesljivosti lestvice 49. − Ocenjevanje veljavnosti. Posamezne stopnje za izvajanje faktorske analize podrobneje opisujemo v nadaljevanju. Kot je razvidno s slike 7, se postopek na stopnji izvedbe in interpretacije faktorske analize ponavlja. Če ne dobimo takšne faktorske rešitve, ki kaže veljavno lestvico, izločimo spremenljivke, ki niso ustrezno povezane s faktorji, in postopek ponovimo. Več o izločanju spremenljivk bomo obravnavali v posebnem poglavju. Priprava niza vprašanj Zbiranje podatkov Izbira metode ekstrakcije faktorjev Izvedba faktorske analize Zmanjševanje števila spremenljivk Interpretacija faktorske rešitve Ocena veljavnosti konstrukta lestvice Slika 7: Stopnje pri izvedbi faktorske analize Vir: lasten. 5.3.1 Priprava niza vprašanj Pri pripravi niza vprašanj moramo, kot smo že zapisali, upoštevati teorijo konceptov, ki jih želimo proučevati. Koncepti so lahko enostavni, kar pomeni, da jih bo sestavljal en sam konstrukt, ali kompleksni, kar pomeni, da bodo sestavljeni iz več konstruktov. V prvem primeru pričakujemo, da bo rezultat faktorske analize en sam faktor, v drugem pa več faktorjev. V tej stopnji je torej nujen pregled znanstvene in strokovne literature. V njej pogosto odkrijemo že obstoječe lestvice, ki jih lahko uporabimo takšne, kot so, ali po potrebi prilagodimo. 50 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. Poglejmo si primer, kjer želimo izmeriti koncept 'Stališča do družbene odgovornosti hotela'. Iz teorije (Sloan et al., 2009; Weaver in Lawton, 2007; Dwyer et al., 2009) smo podali osnovno definicijo koncepta in razvili merilno lestvico, saj v literaturi nismo našli lestvice, ki bi ustrezala tovrstni meritvi. Stališča do družbene odgovornosti hotela smo želeli izmeriti pri gostih hotela in smo ga definirali z dveh vidikov, in sicer (Sloan et al., 2009; Weaver in Lawton, 2007; Dwyer et al., 2009): − Zaznavanje okoljskega vidika družbene odgovornosti hotelov: − vidik, ki zajema opuščanje vseh odvečnih aktivnosti hotela, ki bi lahko negativno vplivale na okolje in na zemeljske vire; − spodbujanje okoljsko sprejemljivih aktivnosti (aktivno varčevanje vode, zmanjševanje obsega odpadkov in recikliranje, ogljični odtis itd.). − Zaznavanje lokalnega vidika družbene odgovornosti hotelov: − naravnanost na sodelovanje z lokalno skupnostjo, zaposlovanje lokalnega prebivalstva, dobri odnosi s poslovnimi partnerji, pošteno ravnanje z zaposlenimi, dobri delovni pogoji, kupovanje lokalnih izdelkov in storitev, promocija lokalnih običajev in kulture. Na podlagi te definicije smo pripravili več trditev, ki smo jih preverjali z vidika vsebinske veljavnosti. Pri preverjanju lestvice sta sodelovala dva akademika s področja marketinga in turizma in en strokovnjak s področja turizma. Končna merilna lestvica je vsebovala trditve, ki so prikazane v tabeli. Trditev je bilo 13, merjene pa so bile po petstopenjski Likertovi lestvici. Kot je razvidno iz tabele, s petimi vprašanji merimo zaznavanje okoljskega vidika družbene odgovornosti hotelov, s preostalimi osmimi pa zaznavanje družbeno lokalnega vidika družbene odgovornosti hotelov. 5 Preverjanje veljavnosti in zanesljivosti lestvice 51. Tabela 3: Trditve merilne lestvice po preverjanju vsebinske veljavnosti Trditve Konstrukt v1 Ta hotel varčuje z električno energijo. v2 Ta hotel varčuje z energijo. Zaznavanje okoljskega v3 Ta hotel uporablja alternativne vire energije. vidika družbene v4 Ta hotel varčuje z vodo. odgovornosti hotelov v5 Ta hotel reciklira odpadke. v6 V tem hotelu so javni prostori in nekatere sobe prilagojene za osebe s posebnimi potrebami. v7 Ta hotel v lokalnem okolju dviguje zavest o odgovorni rabi virov. v8 Ta hotel svojim gostom ponuja informacije o zdravem življenjskem slogu. Zaznavanje lokalnega v9 Ta hotel je zgrajen na način, da je v skladu s kulturo okolja, kjer vidika družbene stoji. odgovornosti hotelov v10 Ta hotel večinoma ponuja lokalno proizvedeno hrano in pijačo. v11 Ta hotel večinoma zaposluje lokalno prebivalstvo. v12 Ta hotel gostom predstavi lokalne običaje in tradicije in jih prosi, da jih spoštujejo. v13 Odnos menedžmenta tega hotela do zaposlenih je pošten in prijazen. 5.3.2 Zbiranje podatkov na preizkusnem ali reprezentativnem (končnem) vzorcu Druga stopnja preverjanja merilne lestvice zajema zbiranje podatkov. Kot smo že omenili, pri pripravi merilne lestvice pogosto najprej zberemo podatke na manjšem preizkusnem vzorcu. To je pomembno predvsem v naslednjih primerih: − ko so raziskovalni rezultati zelo pomembni; − lestvica za merjenje koncepta še ni bila oblikovana s strani drugih raziskovalcev; − pretekle meritve veljavnosti in zanesljivosti merilne lestvice so razkrile, da lestvice za merjenje specifičnega koncepta niso veljavne in zanesljive, zato se pojavlja potreba po spremembi in ponovnem preverjanju lestvice; − na voljo je dovolj časa in finančnih sredstev za izvedbo merjenja veljavnosti in zanesljivosti lestvice na preizkusnem vzorcu. Preizkusni vzorec je po navadi manjši nereprezentativni vzorec, ki zajema ustrezne informante (torej tiste predstavnike populacije, ki imajo informacijo, ki jo želimo pridobiti za potrebe merjenja) iz populacije. Pomembno je, da tudi pri oblikovanju 52 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. preizkusnega vzorca upoštevamo potrebe velikosti vzorca, saj podatke, ki jih pridobimo, obdelamo z različnimi statističnimi metodami, ki imajo svoje predpostavke (npr. normalna porazdelitev podatkov). Nadalje je pomembno tudi, da faktorsko analizo za preverjanje veljavnosti lestvice izvedemo tudi na končnem reprezentativnem vzorcu, saj je to končni dokaz konvergentne in diskriminantne veljavnosti merilne lestvice. V našem primeru smo podatke zbrali na preizkusnem in končnem vzorcu. Za potrebe tega gradiva prikazujemo samo rezultate, ki smo jih pridobili na končnem vzorcu, ki je bil sestavljen tako: − Informanti so bili gostje majhnih hotelov. − Populacijo hotelov je sestavljalo 128 majhnih hotelov v Sloveniji (zasebni hoteli z manj kot 50 sobami). − V vzorec smo zajeli 13 hotelov (odzivnost hotelov je bila 10-%). − Sledilo je osebno spraševanje gostov v 13 hotelih na lokaciji. − Končni vzorec je vseboval 234 (n = 234) hotelskih gostov. 5.3.3 Metoda ekstrakcije faktorjev Pri faktorski analizi lahko faktorje izračunamo na različne načine. Poznamo različne metode ekstrakcije faktorjev, ki se med seboj razlikujejo glede na izračun faktorskih uteži. Najpogosteje uporabljamo metodo osnovnih komponent (angl. principal components), metodo osnovnih osi (angl. principal axis) ali metodo največjega verjetja (angl. uweighted least squares) (Janssens et al., 2008). V primeru metode osnovnih komponent se izračunajo faktorske ocene, ki predstavljajo največje možne deleže variance. To pomeni, da prvi faktor razloži največji možni delež variance, drugi faktorji pa preostale manjše deleže variance. Ta metoda predpostavlja, da je varianca vsake spremenljivke splošna varianca (varianca, ki je porazdeljena med druge variance) in jo je mogoče popolnoma pojasniti z ekstrakcijo faktorjev. 5 Preverjanje veljavnosti in zanesljivosti lestvice 53. Pri drugih metodah imajo posamezne spremenljivke tudi svoje variance (variance, ki jih ne moremo pojasniti in niso povezane z variancami spremenljivk v analizi), kot tudi variance rezidualov (angl. error variance), ki jih pripisujemo napakam merjenja. V končni rešitvi le splošna varianca, ki jo imenujemo tudi komunalitete (glej v naslednjih poglavjih), predstavlja osnovo za ekstrakcijo faktorjev. V teh metodah tako po navadi razložimo manj variance kot pri metodi osnovnih komponent. Čeprav je teoretično takšna metoda skladnejša z realnostjo, pa lahko v nekaterih primerih prinaša težave v analizi in privede do tega, da ne moremo najti končne rešitve. Prav zaradi tega je uporaba metode osnovnih komponent bolj razširjena, še posebej na področju raziskovanja v marketingu (Sarstedt in Mooi, 2014). V nadaljevanju predstavljamo primer izračuna faktorske analize z metodo največjega verjetja. 5.3.4 Izvedba faktorske analize Pri izvedbi faktorske analize izračunavamo različne koeficiente in vrednosti. Njihov izračun bomo v nadaljevanju prikazali s statističnim programom SPSS, v uvodu pa bomo pojasnili, kaj posamezni koeficienti pri faktorski analizi pomenijo oziroma zakaj so pomembni: Korelacijska matrika – korelacijska matrika prikazuje korelacijske koeficiente (r) med vsemi možnimi pari spremenljivk, ki so vključene v analizo. Korelacije razberemo iz zgornjega ali spodnjega diagonalnega dela korelacijske matrike. Kaiser-Meyer-Olkinov (KMO) koeficient – je merilo primernosti vzorca oziroma indeks, ki ga uporabljamo za oceno primernosti podatkov za faktorsko analizo. Visoke vrednosti (med 0,5 in 1) pomenijo, da so podatki primerni za izvedbo faktorske analize. Komunalitete – kažejo povezanost (korelacijo) posamezne spremenljivke (vprašanja, trditve) z drugimi spremenljivkami (vprašanji, trditvami), ki smo jih zajeli v analizo. Spremenljivke (vprašanja, trditve) z nizkimi komunalitetami (običajno nižjimi kot 0,4) lahko izločimo iz nadaljnje analize. 54 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. Lastne vrednosti – predstavljajo celotno varianco spremenljivk, ki je pojasnjena z varianco enega faktorja. Vsota lastnih vrednosti je enaka številu spremenljivk (vprašanj). V faktorski analizi po navadi ohranimo tiste faktorje, ki imajo lastne vrednosti večje od 1. Delež pojasnjene variance – delež variance vseh spremenljivk, ki ga lahko pojasnimo s posameznim faktorjem. Faktorske uteži – predstavljajo korelacijo med spremenljivkami in posameznimi faktorji. Faktorje, ki imajo nizke faktorske uteži, ali faktorje, ki imajo visoke faktorske uteži na več faktorjev, po navadi izločimo iz analize in faktorsko analizo ponovimo. Faktorska ali komponentna matrika – matrika, ki vsebuje faktorske uteži vseh spremenljivk na izračunane faktorje. Rotirana faktorska ali komponentna matrika – čeprav osnovna oziroma nerotirana faktorska ali komponentna matrika prikazujeta povezave med faktorji in spremenljivkami, jo težko interpretiramo, ker so faktorji povezani z velikim številom spremenljivk. Rotirana faktorska matrika pomaga pri lažji interpretaciji rezultatov, zlasti ob izračunavanju večjega števila faktorjev. Pri faktorski analizi je za raziskovalca pomembno, da razume, na kakšen način bo izračunal faktorje in koliko faktorjev bo izračunal. Ker govorimo o raziskovalni faktorski analizi, načeloma število faktorjev določimo glede na merila oziroma statistične vrednosti, ki jih v okviru faktorske analize izračunamo. Iz teorije sicer razumemo, koliko konstruktov (latentnih spremenljivk) naj bi sestavljale spremenljivke (vprašanja, trditve), za katere preverjamo veljavnost. To pomeni, da bi pri raziskovalni faktorski analizi po določenih merilih, ki jih opisujemo v nadaljevanju, morali izračunati število faktorjev, ki ustreza številu latentnih spremenljivk. Merila za izračun faktorjev so naslednja: − Teorija ali predhodne izkušnje (faktorjev mora biti toliko, kolikor konstruktov je raziskovalec glede na teoretične izsledke predvidel; v našem primeru bi torej morali izračunati dva faktorja, saj imamo dva konstrukta). 5 Preverjanje veljavnosti in zanesljivosti lestvice 55. − Merilo lastnih vrednosti: − lastne vrednosti, kot smo zapisali, pojasnjujejo, koliko variance spremenljivk (vprašanj, trditev) lahko pojasnimo s faktorjem ali več faktorji; − upoštevamo pravilo, da ohranimo tiste faktorje, ki imajo lastno vrednost večjo od 1, torej pojasnjujejo varianco več kot ene spremenljivke (enega vprašanja ali trditve). − Preizkus diagrama polzenja (angl. scree plot): − diagram polzenja je diagram lastnih vrednosti, ki prikazuje razmerje med lastnimi vrednostmi in številom faktorjev. − Delež variance, ki je pojasnjen z ohranjenimi faktorji: − ohranjeni faktorji naj bi pojasnili vsaj 60 % variance spremenljivk (vprašanj) (Hair, 2009). V nadaljevanju bomo predstavili preverjanje veljavnosti merilne lestvice s faktorsko analizo. Predstavili bomo korake pri izvedbi faktorske analize in podrobneje razložili, kaj posamezni rezultati, ki smo jih izračunali, pomenijo. Faktorsko analizo najpogosteje izvajamo s statističnimi programskimi paketi. V našem primeru bomo prikazali izvedbo in rezultate, ki jih pridobimo s statističnim programom SPSS. Faktorsko analizo v programu SPSS izvedemo tako, da izberemo ukaz Analyze -> Dimension Reduction -> Factor in izberemo vse spremenljivke (vprašanja, trditve), ki sestavljajo merilno lestvico, ter jih premaknemo v desno polje. Slika 8: Zaslonski prikaz za izvedbo faktorske analize v programu SPSS Vir: zajem zaslona, lasten. 56 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. Na gumbu 'Descriptives'nato označimo naslednja polja: − Coefficients (izpis korelacijske matrike), − KMO and Barttlet’s test of sphericity (izpis koeficienta KMO za merjenje primernosti faktorske analize). Slika 9: Okno 'Descriptives' pri izvajanju faktorske analize Vir: zajem zaslona, lasten. Sledi izbira metode izračunavanja faktorjev na gumbu 'Extraction': − izberemo principal component (metoda osnovnih komponent), Principal axis factoring (metoda osi) ali Maximum Likelihood (metoda največjega verjetja); v našem primeru smo izbrali metodo osnovnih komponent; − po želiji izberemo Scree Plot (izris diagrama polzenja). Slika 10: Okno 'Extraction' pri izvajanju faktorske analize Vir: zajem zaslona, lasten. 5 Preverjanje veljavnosti in zanesljivosti lestvice 57. Na gumbu 'Rotation' nato izberemo metodo rotacije (najpogosteje Varimax). Več o metodah rotacije pišemo v nadaljevanju. Slika 11: Okno 'Rotation' pri izvajanju faktorske analize Vir: zajem zaslona, lasten. Z izbiro gumba 'Options' izberemo še nekatere možnosti, ki bodo olajšale interpretacijo rotirane faktorske, in sicer: − v polju 'Coefficient Display' izberemo 'Sorted by size' (razvrščanje faktorskih uteži od spremenljivk z največjo faktorsko utežjo do spremenljivk z najmanjšo); − v polju 'Coefficient Display' pri 'Suppress absolute values' vnesemo 0,3 (izbris faktorskih uteži, ki so manjše od 0,3). Slika 12: Okno 'Options' pri izvajanju faktorske analize Vir: zajem zaslona, lasten. 58 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. 5.3.5 Interpretacija faktorske rešitve Korelacijska matrika je matrika korelacijskih koeficientov med vsemi spremenljivkami. Načeloma je koristna za preverjanje konvergentne in diskriminantne veljavnosti, vendar je v našem primeru dokaj zapletena, saj vsebuje veliko število koeficientov, ki bi jih morali proučiti, če bi želeli podati natančno mnenje o obeh vrstah veljavnosti. Iz tega razloga bomo to sodbo podali po izvedbi faktorske analize. Korelacijska matrika lahko nakazuje na morebitne šibke korelacije med posameznimi spremenljivkami (vprašanji, trditvami). Takšne bi lahko na tej stopnji analize izločili, vendar svetujemo, da raziskovalec še pred tem prouči komunalitete in faktorske uteži. Korelacije v matriki so Pearsonovi bivariatni korelacijski koeficienti, ki lahko zavzamejo vrednosti med –1 in +1. Pozitivna linearna korelacija odraža dejstvo, da so visoke vrednosti ene spremenljivke povezane z visokimi vrednostmi v drugi spremenljivki, medtem ko negativna korelacija kaže na to, da so visoke vrednosti ene spremenljivke pozitivno povezane z nizkimi vrednostmi v drugi spremenljivki. Naslednja tabela, ki smo jo izpisali, je Kayser-Mayer-Olkinov koeficient (KMO), torej merilo primernosti vzorca, in Barttletov test sferičnosti, ki je merilo statistične značilnosti korelacij. S prvim preizkusom ugotavljamo moč korelacijskih koeficientov. Majhne vrednosti statistike KMO kažejo na to, da korelacije med pari spremenljivk ne moremo pojasniti z drugimi spremenljivkami in da faktorska analiza morebiti ni primerna. Zaželena je vrednost KMO, ki je večja od 0,5. V našem primeru vidimo, da je koeficient KMO ustrezen, saj je enak 0,909. Z drugim testom preverjamo, ali med vključenimi spremenljivkami obstaja dovolj velika korelacija, da je smiselno nadaljevati faktorsko analizo. Statistična značilnost Barttletovega testa, ki je nižja od p < 0,05, kaže na to, da je analiza smiselna. V našem primeru je preizkus statistično značilen, torej je vrednost p (Sig.) < 0,05. 5 Preverjanje veljavnosti in zanesljivosti lestvice 59. Tabela 4: Izpis korelacijske matrike pri izvajanju faktorske analize v programu SPSS 60 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. Tabela 5: Izpis koeficienta KMO in Barttletovega testa pri izvajanju faktorske analize v programu SPSS Vrednost komunalitet v naslednji tabeli stolpca 'Extraction' kaže delež variance, ki je pojasnjen z izračunom skupnega števila faktorja ali komponent. Komunalitete tako kažejo povezanost (korelacijo) posamezne spremenljivke (vprašanja ali trditve) z drugimi spremenljivkami (vprašanji ali trditvami), ki smo jih zajeli v analizo. Nizka vrednost komunalitet pove, da posamezna spremenljivka ni dovolj povezna s faktorji in jo zato lahko izločimo iz nadaljnje analize. Ker ni splošnega pravila, kako visoke morajo biti komunalitete, različni avtorji navajajo različne vrednosti. Po navadi izločamo spremenljivke, ki imajo komunalitete nižje od 0,4. Nekateri avtorji priporočajo tudi višjo mejno vrednost 0,5 (Sarstedt in Mooi, 2014). Tabela 6: Izpis komunalitet pri izvajanju faktorske analize v programu SPSS 5 Preverjanje veljavnosti in zanesljivosti lestvice 61. Naslednja tabela prikazuje interpretacijo faktorske rešitve. Tabela je pomembna predvsem zaradi interpretacije lastnih vrednosti in faktorjev. V drugi vrstici so prikazane lastne vrednosti (Initial eigenvalues). Interpretacija lastnih vrednosti je naslednja. Pri p spremenljivkah (vprašanjih oziroma trditvah) je logično, da ohranimo največ p faktorjev oziroma komponent. Zaradi teorije in zmanjševanja števila podatkov želimo ohraniti manj kot p faktorjev. Lastne vrednosti pomenijo število spremenljivk, katerih varianco lahko razložimo s posameznim faktorjem. Tabela 7: Izpis lastnih vrednosti in deležev pojasnjene variance pri izvajanju faktorske analize v programu SPSS V našem primeru lahko za 13 spremenljivk izračunamo 13 faktorjev. S prvim faktorjem oziroma komponento razložimo varianco 6,6 spremenljivke, z drugim pa varianco 1,4 spremenljivke. Če delimo lastno vrednost vsakega faktorja s številom spremenljivk, izračunamo delež celotne variance vseh spremenljivk, ki ga pojasnjuje posamezni faktor. Vidimo, da lahko s prvima faktorjema pojasnimo 62,3 % variance vseh spremenljivk. V drugem stolpcu so še enkrat prikazane lastne vrednosti in deleži variance, vendar samo za faktorje, ki jih ohranimo. Pri ohranjanju oziroma izračunavanju faktorjev uporabljamo naslednja pravila: − teorije in izkušnje (raziskovalec lahko sam določi število faktorjev glede na predhodno teorijo, čeprav moramo poudariti, da pri raziskovalni faktorski analizi za preverjanje veljavnosti lestvic to ni priporočljivo, saj iščemo empirični dokaz, da je lestvica veljavna); 62 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. − merilo lastne vrednosti (po tem merilu ohranimo le tiste faktorje, ki imajo lastne vrednosti večje od 1, saj faktorji z lastno vrednostjo, manjšo od 1, pojasnjujejo varianco manj kot ene spremenljivke); − delež pojasnjene variance (ohranimo toliko faktorjev, da pojasnjujejo več kot 60 % variance vseh spremenljivk). Po navadi upoštevamo merilo lastne vrednosti, lahko pa preverimo tudi strukturo z enim faktorjem več ali manj, glede na to, kako je lestvica zastavljena. V našem primeru vidimo, da smo pri ohranjanju dveh faktorjev zadostili vsem merilom, in sicer je rešitev skladna s teorijo, ki je bila osnova za pripravo lestvice. Po merilu lastne vrednosti prav tako ohranimo dva faktorja, ki pojasnjujeta več kot 60 % variance vseh spremenljivk. Tabela 8: Izpis rotirane faktorske matrike pri izvajanju faktorske analize v programu SPSS Naslednji korak pri faktorski analizi je pregled rotirane faktorske matrike. Kot smo zapisali, osnovna oziroma nerotirana faktorska ali komponentna matrika prikazuje povezave med faktorji in spremenljivkami, a jo težko interpretiramo, kadar izračunamo več kot en faktor. Faktorji so namreč povezani z velikim številom spremenljivk. Rotirana faktorska matrika pomaga pri lažji interpretaciji rezultatov. Poznamo različne metode rotacije. V osnovi jih delimo na pravokotne in poševne rotacije. Več o rotacijah najdete v Sarstedt in Mooi (2014). Načeloma se priporoča, 5 Preverjanje veljavnosti in zanesljivosti lestvice 63. da izberemo kvadratno metodo rotacije, največkrat Varimax. Če imamo težave z interpretacijo rezultatov, ki smo jih pridobili s to metodo, lahko v nadaljevanju poskusimo s poševnimi rotacijami. Na sliki je prikazana rotirana faktorska matrika, v stolpcih pa vrednosti faktorskih uteži. Faktorske uteži so korelacije med spremenljivkami (vprašanji ali trditvami) in posameznimi faktorji oziroma komponentami. Faktorske uteži nam pomagajo pri interpretaciji (razlagi) faktorjev. Predznak faktorske uteži kaže smer (pozitivna ali negativna) povezave med spremenljivkami in faktorji. 5.3.6 Zmanjševanje števila spremenljivk Naslednji korak pri analizi veljavnosti lestvice s faktorsko analizo je zmanjševanje števila spremenljivk. V skladu z načeli veljavnosti konstrukta izločimo tiste spremenljivke (vprašanja ali trditve), ki: − niso dovolj močno povezane z nobenim faktorjem (pomanjkanje konvergentne veljavnosti), − so močno povezane z več faktorji (pomanjkanje diskriminantne veljavnosti). Cilj je torej, da ohranimo spremenljivke, ki so močno povezane s pripadajočimi faktorji oziroma komponentami (latentnimi spremenljivkami, konstrukti) in šibko na ne pripadajoče faktorje ali komponente. Druge spremenljivke izločimo. Pri analizi spremenljivk v rotirani faktorski matriki veljajo naslednja načela: − Faktorske uteži na pripadajoč faktor morajo biti višje od 0,6 (vprašanje mora biti močno povezano s konstruktom, ki ga meri). − Faktorske uteži na ne pripadajoč faktor (na druge faktorje) morajo biti nižje od 0,4 (vprašanje ne sme biti močno povezano s konstruktom, ki ga ne meri). − Iščemo najboljšo možno rešitev, kjer je vsaka spremenljivka (vprašanje) močno povezana s pripadajočim (samo enim) faktorjem in šibko povezana z drugimi faktorji. 64 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. Če pogledamo svoj primer (rotirano faktorsko matriko na zgornji sliki), opazimo, da načelom, ki smo jih zapisali, ne ustrezajo spremenljivke v5, v6 in v13. Te spremenljivke lahko izločimo iz analize. Sledi ponovitev izvedbe faktorske analize brez izločenih spremenljivk in ponovni pregled naslednjih vrednosti: − komunalitet, − lastnih vrednosti, − deležev pojasnjene variance, − števila faktorjev, − faktorskih uteži. Postopek ponavljamo tako dolgo, dokler ne dosežemo konvergentne veljavnosti. To pomeni, dokler ni vsaka spremenljivka (vprašanje ali trditev) močno povezana s pripadajočim (samo enim) faktorjem in šibko povezana s preostalimi. Priporočljivo je, da faktorsko analizo ponovimo po vsaki izločeni spremenljivki, torej spremenljivke izločamo posamično. Tabela 9: Izpis končne rotirane faktorske matrike pri izvajanju faktorske analize v programu SPSS 5 Preverjanje veljavnosti in zanesljivosti lestvice 65. V končni faktorski rešitvi vidimo, da so spremenljivke (trditve) v7, v8, v9, v10 in v11 močno povezane s prvim faktorjem in šibko z drugim. Spremenljivke v1, v2, v3 in v4 so močno povezane z drugim faktorjem in šibko s prvim. 5.3.7 Poimenovanje faktorjev Končna rešitev, ki jo pridobimo s faktorsko analizo, kadar preverjamo veljavnost lestvice, naj bi bila logična in skladna s teorijo (z definicijo koncepta). Čeprav faktorje (konstrukte) poimenuje raziskovalec, je priporočljivo, da pri tem upošteva predhodno literaturo in izhodišča, ki jih je imel pri pripravi lestvice. V našem primeru smo pridobili dva faktorja oziroma dva konstrukta, kar je v skladu s teoretičnimi izhodišči, ki smo jih postavili pri snovanju lestvice. Prvi faktor oziroma konstrukt, ki smo ga poimenovali 'zaznavanje lokalnega vidika družbene odgovornosti hotelov', sestavljajo naslednje trditve: − v7 Ta hotel v lokalnem okolju dviguje zavest o odgovorni rabi virov. − v8 Ta hotel svojim gostom ponuja informacije o zdravem življenjskem slogu. − v9 Ta hotel je zgrajen na način, da je v skladu s kulturo okolja, kjer stoji. − v10 Ta hotel večinoma ponuja lokalno proizvedeno hrano in pijačo. − v11 Ta hotel večinoma zaposluje lokalno prebivalstvo. − v12 Ta hotel gostom predstavi lokalne običaje in tradicije in jih prosi, da jih spoštujejo. Drugi faktor, ki smo ga poimenovali 'zaznavanje okoljskega vidika družbene odgovornosti hotelov', pa sestavljajo naslednje trditve: − v1 Ta hotel varčuje z električno energijo. − v2 Ta hotel varčuje z energijo. − v3 Ta hotel uporablja alternativne vire energije. − v4 Ta hotel varčuje z vodo. 66 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. 5.3.8 Ocenjevanje veljavnosti konstrukta lestvice Na zadnji stopnji moramo preveriti še veljavnost konstrukta. Kot smo zapisali, sta pomembni predvsem konvergentna in diskriminantna veljavnost. Za konvergentno veljavnost so pomembne visoke korelacije med spremenljivkami (vprašanji ali trditvami) istega konstrukta. V faktorski analizi nam pri tej presoji pomagajo faktorske uteži. Visoke faktorske uteži (> 0,6) na pripadajoč faktor za posamezno spremenljivko pomenijo, da je lestvica konvergentno veljavna. Nizke faktorske uteži (< 0,4) na ne pripadajoč faktor pa za spremenljivke pomenijo, da te niso močno povezane z drugimi faktorji oziroma konstrukti in bi zato lahko lestvico ocenili kot diskriminantno veljavno. Nekateri avtorji sicer trdijo, da raziskovalna faktorska analiza ne zagotavlja eksplicitnega preizkusa enorazsežnosti (Gerbing in Anderson, 1988), temveč zagotavlja zgolj konsistentnost, in da je za preverjanje diskriminantne veljavnosti treba izvesti potrjevalno faktorsko analizo (angl. CFA – confirmatory factor analysis). Tako v končni faktorski rešitvi ugotovimo, da so spremenljivke (trditve) v7, v8, v9, v10 in v11 močno povezane s prvim faktorjem in šibko z drugim. Spremenljivke v1, v2, v3 in v4 pa so močno povezane z drugim faktorjem in šibko s prvim. To kaže tako na konvergentno kot na diskriminantno veljavnost naše lestvice. 5.4 Preverjanje zanesljivosti merilne lestvice Kot smo zapisali v poglavju 4.2.2, zanesljivost merilne lestvice največkrat preverjamo z ugotavljanjem notranje konsistentnosti lestvice. Merilo interne konsistentnosti, ki se v marketingu največkrat uporablja, je Cronbachova alfa. Če je ta koeficient višji od 0,7, pomeni, da je lestvica zanesljiva. V programu SPSS preverimo zanesljivost lestvice tako, da za vprašanja, ki sestavljajo posamezne konstrukte, izračunamo Cronbachovo alfo. To storimo z ukazom Analyse -> Scale -> Reliability Analysis. Na gumbu Statistics lahko označimo tudi 'Scale if Item deleted'. V tem primeru bomo pridobili tudi vrednosti koeficienta alfe v primerih, če posamezno vprašanje ali trditev izločimo iz analize. 5 Preverjanje veljavnosti in zanesljivosti lestvice 67. Slika 13: Zaslonski prikaz za izpis Cronbachove alfe v programu SPSS Vir: zajem zaslona, lasten. V našem primeru vidimo, da je koeficient enak 0,9, torej je višji od 0,7, kar pomeni, da je naša lestvica oziroma konstrukt zanesljiv. Tabela 10: Izpis Cronbachove alfe v programu SPSS 68 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU B. Milfelner 6 Klasične metode za preverjanje povezav med spremenljivkami in konstrukti V šestem poglavju bomo predstavili metode za preverjanje povezav, ki jih marketinški raziskovalci najpogosteje uporabljajo za preverjanje povezav med konstrukti. Pri tem bomo najprej razložili razliko med statističnimi testi, ki jih lahko marketinški raziskovalci uporabljajo za preverjanje povezav. Prav tako bomo poudarili pomen vrste podatkov (glede na osnovni tip merilne lestvice), za katere povezave preverjamo. Seveda ne bomo obravnavali vseh statističnih testov, bomo pa predstavili predvsem tiste, ki se v raziskovanju marketinga najpogosteje uporabljajo. Metode za preverjanje povezav lahko razdelimo na dve veliki skupini, in sicer na parametrične in neparametrične teste. Neparametrične teste uporabljamo za preverjanje povezav, kadar je vsaj ena spremenljivka merjena na vrstni ali nominalni lestvici. Parametrične teste pa uporabljamo takrat, ko podatke merimo vsaj na intervalni lestvici. Nekateri avtorji navajajo tudi strožje pogoje za uporabo parametričnih testov (npr. Cramer, 2000), in sicer: 70 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. − spremenljivke so merjene na intervalni ali razmernostni lestvici, razdalje med številskimi vrednostmi pa so enake; − vzorci so zajeti iz populacije, kjer so variance enake ali homogene; − podatki so normalno porazdeljeni. V marketinških raziskavah je, če želimo uporabljati parametrične , predvsem pomembno, da so spremenljivke merjene na intervalni ali razmernostni lestvici, saj je druga pogoja težje doseči. Nekateri parametrični testi so sicer precej robustni kljub odklonom podatkov od normalne porazdelitve. Kljub temu priporočamo preverjanje normalne porazdelitve podatkov pred uporabo parametričnega , ki temelji na normalni porazdelitvi. Odločitev, ali bomo za preverjanje povezave izbrali parametrični ali neparametrični, temelji predvsem na tem, na kateri osnovni merilni lestvici smo zbrali podatke. Zato je pomembno, da raziskovalec že pri snovanju merjenja razmišlja, katere povezave želi preveriti in kako podrobne podatke o moči tovrstnih povezav želi izračunati. 6.1 Najpogostejši neparametrični za merjenje povezav V nadaljevanju bomo predstavili nekatere najpogosteje uporabljene neparametrične teste za merjenje povezav v marketinških raziskavah. Kadar spremenljivke merimo na nominalni ali vrstni lestvici, takšne spremenljivke imenujemo tudi kategorične spremenljivke. Predstavili bomo naslednje neparametrične teste: − koeficient φ, − kontingenčni koeficient in − Cramerjev V. 6.1.1 Koeficient φ Koeficient φ uporabljamo za merjenje moči povezave med spremenljivkama, ki sta dihotomni. To pomeni, da sta obe kategorični in lahko zavzameta največ dve vrednosti (npr. spol, odgovori DA in NE). Izračunavamo ga lahko torej samo pri tabelah 2 × 2. Koeficient je enak kvadratnemu korenu razmerja med vrednostjo χ2 in številom enot v vzorcu. 6 Klasične metode za preverjanje povezav med spremenljivkami in konstrukti 71. 𝛷𝛷 = �𝜒𝜒2 𝑛𝑛 Pri čemer je: − φ = koeficient fi − n = število enot v vzorcu − χ2 = hi-kvadrat χ2 izračunamo po naslednji formuli: (f f ) χ ∑ − = 2 2 o e fe Pri čemer sta: − fo = opazovane frekvence − fe = pričakovane frekvence Kadar je koeficient enak 0, pomeni, da med spremenljivkama ni nikakršne povezave, kadar pa sta spremenljivki popolnoma povezani, je koeficient enak 1. Koeficient lahko zajame tudi negativno vrednost med 0 in –1. Izračun je odvisen od vrste računalniškega programa, ki ga uporabljamo. 6.1.2 Kontingenčni koeficient Kot smo zapisali, se koeficient φ uporablja takrat, kadar preverjamo povezavo v tabelah 2 × 2. Za nominalne ali vrstne spremenljivke, ki lahko zavzamejo več kategorij (na primer starostni razredi), uporabljamo kontingenčni koeficient (C). Z njim lahko ugotavljamo povezave v tabelah z več kot dvema kategorijama, torej v tabelah, ki so enake n × n. Tudi ta koeficient je povezan s statistiko χ2, kakor izhaja iz naslednje enačbe. 𝜒𝜒2 𝐶𝐶 = � 𝜒𝜒2 + 𝑛𝑛 72 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. Pri čemer je: − C = kontingenčni koeficient − χ2 = hi-kvadrat − n = število enot v vzorcu Kontingenčni koeficient nikoli ne preseže vrednosti 1, vendar je njegova zgornja meja odvisna od števila kategorij. Na primer za tabelo, ki je sestavljena iz enakega števila vrstic in stolpcev (s × s), lahko zgornjo mejo (limz) izračunamo po naslednji enačbi: 𝑙𝑙𝑙𝑙𝑙𝑙𝑧𝑧 = �𝑠𝑠 − 1 𝑠𝑠 Pri tem je s enak številu vrstic in stolpcev. Enačbo lahko uporabimo samo, kadar je število vrstic in stolpcev enako. 6.1.3 Cramerjev V Tudi Cramerjev V koeficient se uporablja za preverjanje povezav med dvema kategoričnima spremenljivkama, podobno kot kontingenčni koeficient za tabele, ki so večje kot 2 × 2, torej za spremenljivke z več kategorijami. Od koeficienta φ se razlikuje po tem, da ima zgornjo mejo, kadar ga izračunamo za tabele, ki so večje kot 2 × 2. Koeficient φ namreč v tem primeru ni omejen. Cramerjev V lahko torej zavzame vrednosti med 0 in 1. Večji je koeficient, močnejša je povezanost med spremenljivkami. Izračunamo ga po naslednji enačbi: 𝜒𝜒2 𝑉𝑉 = � 𝑛𝑛 min(𝑣𝑣 − 1), (𝑠𝑠 − 1) Pri čemer je: − V = Cramerjev V koeficient 6 Klasične metode za preverjanje povezav med spremenljivkami in konstrukti 73. − v = število vrstic v tabeli − s = število stolpcev v tabeli V števcu ulomka vpišemo samo tisto vrednost, ki je najmanjša. Če je število vrstic manjše od števila stolpcev, bo števec ulomka pod korenom enak (v – 1) in obratno. V nadaljevanju prikazujemo še izračun obeh statistik s programom SPSS. V programu izberemo ukaz Analyze -> Descriptive Statistics -> Crosstabs. Nato označimo spremenljivke. Ne pozabimo, da morajo biti te nominalne ali vrstne. V našem primeru nas zanima, ali vrsta odjemalcev (podjetja ali končni odjemalci), pri katerih podjetje ustvari največji prihodek, vpliva na hitrost odziva pri odgovarjanju na vprašalnik. Po premišljeni razlagi ti spremenljivki ne bi smeli biti povezani. Slika 14: Prikazni okni v programu SPSS za izračun kontingenčnega koeficienta, koeficienta φ in Cramerjevega V koeficienta Vir: lasten. Na gumbu Statistics označimo Chi-square (po izbiri, če želimo izračunati tudi statistiko χ2), Contingency coefficient in Phi and Cramer's V. Rezultati kažejo, da med obema spremenljivkama ni povezave, saj so vsi koeficienti v tabeli zelo majhni in statistično niso značilni pri p < 0,05. To razberemo v stolpcu Approximate Significance v tabeli 11, kjer so te vrednosti pri vseh koeficientih višje od 0,05. 74 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. Tabela 11: Izpis kontingenčne tabele in rezultati povezav med spremenljivkami v programu SPSS V drugi tabeli opazimo tudi, da sta Cramerjev V in kontingenčni koeficient enaka, kar je razumljivo, saj je to pravzaprav tabela 2 × 2. Koeficient φ ima prav tako enako vrednost, vendar je negativen. Načeloma interpretiramo samo samo moč povezave in ne na smer (pozitiven/negativen) koeficienta, ker pri kategoričnih podatkih ne moremo govoriti o pozitivnih in negativnih povezavah med spremenljivkami. To pa je značilno za povezave med intervalnimi in razmernostnimi spremenljivkami, ki jih proučujemo s parametričnimi testi. 6.2 Najpogostejši parametrični testi za merjenje povezav Kadar proučujemo vpliv med posameznimi marketinškimi spremenljivkami, nas po navadi zanima povezava med spremenljivkami ali vpliv ene ali več neodvisnih spremenljivk na eno ali več odvisnih. Takšno proučevanje obravnavata bivariatna ali multivariatna statistična analiza (Kumar et al., 1999; Malhotra in Birks, 2003). S pomočjo multivariatnih tehnik analiziramo medsebojno povezanost med številnimi spremenljivkami simultano glede na vrsto modela, na katerem temelji izbrana tehnika. Večina multivariatnih tehnik identificira vzorce podobnosti ali povezav med 6 Klasične metode za preverjanje povezav med spremenljivkami in konstrukti 75. spremenljivkami, predvideva relativno pomembnost vsake spremenljivke ali napoveduje pomembnost izidov. Dva najpogostejša parametrična testa, ki ju uporabljamo za preverjanje povezav med spremenljivkami, sta korelacijska in regresijska analiza. Ne pozabimo, da morajo biti spremenljivke merjene na razmernostni ali na intervalni lestvici. Bistvena razlika med korelacijo in regresijo je naslednja. Pri korelaciji ugotavljamo povezavo med dvema spremenljivkama (npr. x in y), ne da bi vnaprej vedeli (definirali), katera spremenljivka je neodvisna (napovedovalna) in katera odvisna (odzivna). Pri regresijski analizi ocenjujemo vrednost odzivne (odvisne) spremenljivke glede na znano vrednost neodvisne spremenljivke. Obe metodi predvidevata linearno zvezo med spremenljivkama, pri čemer pri korelaciji izračunamo samo moč povezave, pri regresijski analizi pa opisujemo, kako se odzivna spremenljivka spreminja glede na vrednost neodvisne spremenljivke. Tako pri korelaciji nimamo neodvisnih in odzivnih (odvisnih) spremenljivk. Korelacija meri povezanost, regresija pa vpliv. V slednjem primeru torej raziskovalec vnaprej določi, katera spremenljivka je neodvisna in katera odzivna, česar pri korelaciji ne počnemo. 6.2.1 Korelacijska analiza V marketinških raziskavah želimo velikokrat ugotoviti moč in smer povezave, kot na primer v naslednjih primerih: − Kako močno je prodaja povezana s stroški oglaševanja? − Ali obstaja povezava med zadovoljstvom odjemalcev s storitvami in finančno uspešnostjo podjetja? − Ali so zaznave odjemalcev glede kakovosti povezane z njihovim zaznavanjem zadovoljstva? V takšnih primerih najpogosteje uporabimo korelacijski koeficient r, ki povzame moč povezave med dvema metričnima (intervalnima ali razmernostnima) spremenljivkama. To je indeks, ki pokaže, ali obstaja linearna povezava med dvema spremenljivkama (Malhotra in Birks, 2003, 512). Kazalec je znan tudi pod nazivom Pearsonov korelacijski koeficient ali bivariatna korelacija. Pozitivna korelacija odraža 76 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. dejstvo, da so visoke vrednosti ene spremenljivke povezane z visokimi vrednostmi v drugi spremenljivki, medtem ko negativna korelacija kaže, da so visoke vrednosti ene spremenljivke pozitivno povezane z nizkimi vrednostmi v drugi spremenljivki. V matematični obliki lahko, če imamo na voljo vzorec n opazovanj in spremenljivki X in Y, korelacijski koeficient zapišemo kot: n ∑(X − )( − i X iY Y) i=1 C n −1 xy OV r = = . n 2 n (X − X) Y ( −Y 2 ) SxSy i i ∑ ∑ i=1 n −1 i=1 n −1 V tej enačbi X in Y predstavljata aritmetično sredino vzorca, Sx in Sy pa standardni odklon. COVxy je kovarianca med X in Y, ki meri povezanost med obema spremenljivkama. Z deljenjem z zmnožkoma standardnih odklonov dosežemo standardizacijo koeficienta r, kar pomeni, da lahko ta zajame vrednosti med –1 in +1 in ni več odvisen od enot merjenja. Pomemben statistični kazalnik, predvsem z vidika marketinških managerjev, je kvadrat korelacijskega koeficienta (r2). Interpretiramo ga lahko na tri ekvivalentne načine (Myers in Mullet, 2003, 44): − predstavlja delež variance, ki je skupen dvema spremenljivkama; − predstavlja delež variance v eni spremenljivki, ki ga lahko razložimo z varianco v drugi spremenljivki; − predstavlja delež prekrivanja v obeh spremenljivkah. V obliki enačbe lahko zapisano ponazorimo kot: pojasnjena  varianca 𝑆𝑆𝑆𝑆 𝑟𝑟2 = 𝑥𝑥 celotna varianca = 𝑆𝑆𝑆𝑆𝑦𝑦 6 Klasične metode za preverjanje povezav med spremenljivkami in konstrukti 77. Obe vrednosti, r in r2, sta simetrični, kar pomeni, da je korelacija med X in Y enaka korelaciji med Y in X. V tem primeru ne moremo govoriti o odvisnosti obeh spremenljivk, le o povezavi, kot smo zapisali v prejšnjem poglavju. Kadar je vrednost koeficienta r enaka 0, ne moremo trditi, da med spremenljivkama ni nikakršne povezave. Še vedno namreč obstaja verjetnost, da med spremenljivkama obstaja nelinearna povezava, ki je z vrednostjo r nismo zajeli. Še enkrat poudarjamo, da korelacijski koeficient kaže le medsebojno povezanost in ne vzročno povezavo med spremenljivkama. S korelacijsko analizo lahko zaradi tega merimo zgolj naravo in stopnjo povezanosti (kovariance) med spremenljivkama. Pred interpretacijo pomena korelacijskega koeficienta je treba proučiti še njegovo statistično značilnost. Kadar kazalnik ni statistično značilen v okviru spremenljivega intervala zaupanja (v marketinških raziskavah po navadi 95 ali 90 %), zaključimo, da med spremenljivkama z veliko verjetnostjo ni statistično značilne povezave. Statistično značilnost povezave ugotavljamo s pomočjo enostavnega t-testa: n − 2 t = r 2 1 . − r Kadar izračunana vrednost t ni statistično značilna na želenem ali večjem intervalu zaupanja, pomeni, da povezava med proučevanima spremenljivkama ne obstaja. Tudi pri korelacijskem koeficientu je, podobno kot pri drugih statističnih tehnikah, pomembno razumevanje predpostavk, ki morajo biti izpolnjene za ustrezno interpretacijo. Če predpostavke ne veljajo, so lahko rezultati zavajajoči. Termin 'robusten' kaže delež, do katerega posamezna tehnika podaja natančne ali vsaj zadovoljive rezultate, četudi pri njihovi uporabi niso izpolnjene vse predpostavke. Bolj v takšnih primerih tehnika podaja sprejemljive rezultate, bolj je robustna. Na težavo opozarjamo zaradi tega, ker v številnih marketinških uporabah te metode niso oziroma ne morejo biti izpolnjene popolnoma vse predpostavke. To raziskovalcem povzroča težave, saj se sprašujejo, v kolikšni meri bodo takšni odmiki povzročili napačne interpretacije proučevanih pojavov. 78 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. V primeru bivariatne (Pearsonove) korelacije predpostavljamo naslednje (Myers in Mullet, 2003): − med proučevanima spremenljivkama obstaja linearna povezava; − obe spremenljivki sta merjeni na intervalni ali proporcionalni skali; − obe spremenljivki imata statistično pomembno razpršenost, range in varianco (kar pomeni, da večina opazovanj nima enotne vrednosti ali intervala) in − obstaja vsaj tri do petkrat toliko primerov, opazovanj oziroma respondentov, kot je spremenljivk (v nasprotnem primeru so lahko korelacijski ter tudi regresijski koeficienti nestabilni ali celo zavajajoči). V nadaljevanju prikazujemo primer izračuna regresijskega koeficienta v programu SPSS. Izračunati želimo korelacijo med štirimi spremenljivkami, in sicer trditvami, ki sestavljajo merilno lestvico, za katero smo v predhodnem poglavju izvajali faktorsko analizo. Pokazali bomo tudi, kako lahko s korelacijsko analizo preverjamo konvergentno in diskriminantno veljavnost. V programu za izračun korelacijskega koeficienta izberemo ukaz Analyze -> Correlate -> Bivariate. Sledi izbira spremenljivk. Zaradi poenostavitve in lažjega prikaza bomo izbrali samo po dve spremenljivki konstrukta 'zaznavanje okoljskega vidika družbene odgovornosti hotelov': − v1 Ta hotel varčuje z električno energijo in − v2 Ta hotel varčuje z energijo. Izbrali bomo še dve spremenljivki konstrukta 'zaznavanje lokalnega vidika družbene odgovornosti hotelov', in sicer: − v8 Ta hotel svojim gostom ponuja informacije o zdravem življenjskem slogu in − v9 Ta hotel je zgrajen na način, da je v skladu s kulturo okolja, kjer stoji. 6 Klasične metode za preverjanje povezav med spremenljivkami in konstrukti 79. V polju Correlation Coefficients izberemo 'Pearson'. Program izpiše vse možne pare korelacijskih koeficientov med štirimi spremenljivkami, prikaz pa imenujemo korelacijska matrika. Slika 15: Prikazno okno v programu SPSS za izračun korelacijskega koeficienta Vir: zajem zaslona, lasten. Tabela 12: Izpis korelacijskih koeficientov v programu SPSS Korelacijska matrika je simetrična matrika in v našem primeru obsega 16 polj. Kot opazimo, so rezultati v zgornji desni in spodnji levi polovici identični, medtem ko so korelacije med istimi spremenljivkami enake 1. Pri interpretaciji tabele najprej preverimo statistično značilnost korelacijskih koeficientov. Tako ugotovimo, da so vsi statistično značilni pri p > 0,01 (**). Sledi interpretacija moči korelacijskega koeficienta. V našem primeru so vse povezave pozitivne. 80 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. Opazimo, da obstaja močnejša povezava med trditvijo (spremenljivko) v1 in v2 (r = 0,67), kot recimo med trditvijo v1 in v7 (r = 0,40), v1 in v8 (r = 0,30), v2 in v7 (r = 0,32) ter v2 in v8 (r = 0,24). To pomeni, da lahko ugotovimo ali je lestvica konvergentno in diskriminantno veljavna. Pri konvergentni veljavnosti iščemo močne povezave med pripadajočimi trditvami (spremenljivkami) konstrukta, pri diskriminanti pa šibke med nepripadajočimi trditvami konstrukta. 6.2.2 Regresijska analiza Medtem ko korelacija meri stopnjo povezave med spremenljivkama, regresija določa tudi smer povezave. Z izračunom regresijske premice lahko predvidevamo vrednost odvisne spremenljivke za izbrano pojasnjevalno spremenljivko. Pojem regresijska analiza se nanaša na tehnike, ki jih uporabljamo, kadar želimo izpeljati enačbo, ki povezuje odvisno spremenljivko, s pojasnjevalno spremenljivko. Zajema frekvenčno porazdelitev odvisne spremenljivke, kadar so spremenljivke, ki jih uporabljamo za ocenjevanje, določene na različnih ravneh, torej konstante. Kadar ugotavljamo povezavo med spremenljivkama na tak način, je rezultat analize vedno model oziroma enačba (Churchill, 1999). Regresijski model lahko uporabimo za razlago, predvidevanje in nadzor spremenljivke, ki jo proučujemo (Kumar et al., 1999). Z njim proučujemo linearno povezavo med odzivno in pojasnjevalno spremenljivko (Zikmund, 1999). V tem pogledu je metoda nadgradnja izračunu korelacijskega koeficienta. Bivariatno regresijo v literaturi srečujemo tudi pod pojmom enostavna linearna regresija. Pojem bivariatna se nanaša na preverjanje vpliva med dvema spremenljivkama. Srivastava (2002) jo definira tudi kot linearno povezavo med nadzorovano spremenljivko X (neodvisno spremenljivko) in odzivno spremenljivko Y (odvisno spremenljivko). Nadzorovano spremenljivko pri tem uporabljamo za predvidevanje odzivne spremenljivke. Primere iz marketinške prakse, ki smo jih navedli pri razlagi regresijskih koeficientov, lahko preoblikujemo tako, da je zanje primerna uporaba regresijske analize: 6 Klasične metode za preverjanje povezav med spremenljivkami in konstrukti 81. − Ali lahko varianco v prodaji razložimo s pomočjo variance v stroških za oglaševanje? − Kakšen je vpliv zadovoljstva odjemalcev s storitvami na finančno uspešnost podjetja? − Ali zaznave odjemalcev glede kakovosti določajo zaznavanje odjemalcev glede cen? Priprava razsevnega diagrama Določanje splošnega modela Ocena parametrov Ocena standardiziranega reg. koef. Test statistične značilnosti Ugotavljanje moči in znač. povezave Preverjanje natančnosti predvidevanja Ugotavljanje veljavnosti modela Slika 16: Stopnje pri izvajanju bivariatne regresijske analize Vir: Malhotra in Birks (2003, 520) Na sliki 16 prikazujemo in razlagamo stopnje pri izvajanju regresijske analize. Razsevni diagram Bivariatno regresijsko analizo začnemo s prikazom na razsevnem diagramu. Ta po navadi ni dovolj dober kazalnik medsebojnih vplivov, saj za interpretacijo ni praktičen. V marketingu namreč lahko prikazujemo več sto ali celo več tisoč točk podatkov (pridobljenih s strani respondentov), ki jih težko razločno prikažemo na posameznem grafu (Myers in Mullet, 2003). Prav tako v marketingu pogosto merimo 82 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. spremenljivke na lestvicah s petimi ali sedmimi kategorijami. Grafični prikaz tako majhnega števila kategorij pogosto ni razumljiv. Analizo nadaljujemo s formuliranjem splošnega modela, ocenjevanjem parametrov in standardnih regresijskih koeficientov, testom statistične značilnosti, ugotavljanjem moči in pomembnosti povezave, preverjanjem natančnosti predvidevanja in ugotavljanjem veljavnosti modela (Malhotra in Birks, 2003). Določanje splošnega modela Drugi korak pri bivariatni regresijski analizi, kot je prikazano na sliki, je določanje splošnega modela. Splošna oblika linearne premice je naslednja: Y = β + β 0 1X , kjer imajo oznake naslednji pomen: − Y = odvisna spremenljivka (odzivna) − X = pojasnjevalna spremenljivka (neodvisna, nadzorovana) − β0 = presek osi y − β1 = naklon premice. Zgornja enačba prikazuje deterministično povezavo, pri čemer je spremenljivka Y popolnoma določena z vrednostjo spremenljivke X, če sta znana koeficienta β0 in β1. V marketinškem raziskovanju je determinističnih povezav izjemno malo, skorajda nič, zaradi česar regresijskemu postopku dodamo še stohastično spremenljivko (odklon ali rezidual). S tem zajamemo verjetnostno oziroma stohastično naravo povezave. Zapis osnovne regresijske povezave: Y = β + 0 β 1X + i i e . Oznaka ei je rezidual (statistična napaka), povezan z i opazovanji. 6 Klasične metode za preverjanje povezav med spremenljivkami in konstrukti 83. Ocena parametrov Predvidevanje regresijskih parametrov izvedemo na podlagi naslednje enačbe: Yˆ = a + bx i i , kjer je Yˆ i ocenjena vrednost spremenljivke Yi, a in b pa sta ocenjeni vrednosti konstant β 0 in β 1. Konstanto b po navadi imenujemo kar nestandardiziran regresijski koeficient (Malhotra in Birks, 2003), regresijski koeficient (Kumar et al., 1999) ali 'surov' regresijski koeficient (Myers in Mullet, 2003), saj ga izračunamo iz 'surovih', torej nestandardiziranih vrednosti. To je naklon regresijske krivulje. Ta določa spremembe spremenljivke Y ob spremembi spremenljivke X za eno enoto. Konstanto po metodi najmanjših kvadratov izračunamo na naslednje načine: ∑n n (X − X Y )( − i i Y) ∑ X Y − i i n Y X C X OV Y i=1 i= b = = = 1 . S 2x ∑n n (X − 2 2 2 i X) ∑ X − i nX i=1 i=1 Presek ordinate pa izračunamo iz enačbe: a = Y − X b . Ocena standardiziranega regresijskega koeficienta Analizo nadaljujemo z izračunom standardiziranega regresijskega koeficienta. Čeprav so vrednosti b primerne za predvidevanje, nam z vidika natančnosti ocenjevanja in moči povezave povedo zelo malo2. Vrednosti b so namreč nestandardizirane, zaradi česar lahko zajamejo zelo različne vrednosti, še posebej, kadar so razponi med neodvisno in odvisno spremenljivko veliki. Zato pri regresijski analizi izračunavamo še standardiziran regresijski koeficient. 2 Če proučujemo vpliv sprememb v obrestni meri (v decimalnih vrednostih) na število novogradenj (v milijonih), dobimo kot rezultat izjemno velike vrednosti nestandardiziranega koeficienta b. V nasprotju s tem primerom bi pri proučevanju vpliva vložkov v oglaševanje na prodajo (na prodajalno) dobili izjemno nizke vrednosti istega koeficienta. 84 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. Standardizirani regresijski koeficient lahko podobno kot pri korelacijski analizi zajamejo vrednosti od +1 do –1. Ker kažejo na moč povezave med spremenljivkama, so pri večjem številu neodvisnih spremenljivk (multivariatni analizi) še boljši kazalnik kot pri bivariatnem modelu. Imenujemo jih tudi beta koeficient (Myers in Mullet, 2003; Malhotra in Birks, 2003) ali beta obtežitev (Malhotra in Birks, 2003). Standardizacija je proces, pri katerem izvirne podatke pretvorimo v nove spremenljivke z aritmetično sredino 0 in varianco 1. Sx β = b S y Preizkus statistične značilnosti Statistično pomembnost linearne povezave med spremenljivkama X in Y preverjamo z naslednjima hipotezama: H : β = H : β ≠ 0 1 0 in 1 1 0. Ničelna hipoteza v tem primeru določa, da med X in Y ni linearne povezave. Alternativna hipoteza se nanaša na pozitivno ali negativno linearno povezavo med enakima spremenljivkama. Za izračun statistične značilnosti lahko izvedemo naslednji t-test: b t = SE , b pri čemer je SEb standardni odklon od vrednosti b imenovan tudi standardna napaka. Ugotavljanje moči in pomembnosti povezave Ugotavljanje moči in statistične pomembnosti povezave med vsemi odvisnimi spremenljivkami in neodvisno spremenljivko merimo s koeficientom determinacije r2 (Kumar et al., 1999). V bivariatni regresiji je to koeficient kvadrat korelacijskega koeficienta, njegova vrednost pa se giblje med 0 in 1. Kakor je bilo že omenjeno v okviru razlage korelacijskega koeficienta, predstavlja delež celotne variance Y, ki jo lahko razložimo z varianco X. Koeficient ima pomembnejši značaj v okviru multivariatne regresijske analize, zaradi česar ga bomo natančneje razložili v nadaljevanju. 6 Klasične metode za preverjanje povezav med spremenljivkami in konstrukti 85. V osnovi lahko koeficient prikažemo z enačbo: ∑( Y − 2 i Y ) = ∑( ˆ Y − 2 i Yi ) + ∑( Y − 2 ˆ i Y) . Enačba predstavlja naslednjo formulacijo: skupna varianca = pojasnjena varianca + nepojasnjena varianca, kjer imajo izrazi naslednje pomene: − skupna varianca (SSy) = vsota kvadratov ocene napake, pridobljena, če spremenljivke Y ne ocenjujemo s spremenljivko X, − pojasnjena varianca (SSreg) = zmanjšani del vsote kvadratov ocene, pridobljen, kadar spremenljivko Y ocenjujemo s spremenljivko X in − nepojasnjena varianca (SSres) = vsota kvadratov ocene napake, pridobljena, če spremenljivko Y ocenjujemo s spremenljivko X. Koeficient determinacije predstavlja delež pojasnjene variance v celotni varianci: (𝑆𝑆𝑆𝑆 𝑆𝑆𝑆𝑆 𝑟𝑟2 = 𝑦𝑦 − 𝑆𝑆𝑆𝑆𝑟𝑟𝑟𝑟𝑟𝑟) 𝑟𝑟𝑟𝑟𝑟𝑟 𝑆𝑆𝑆𝑆 = 𝑦𝑦 𝑆𝑆𝑆𝑆𝑦𝑦 Če je na primer R2 enak 0,740, pomeni, da lahko 74 % variance spremenljivke Y pojasnimo s spremenljivko X. Če med spremenljivkama ni linearne povezave, je koeficient enak 0. Predpostavke linearne regresijske analize Ker regresijski model po navadi uporabljamo za predvidevanja, nas vedno zanima, kako natančno lahko na njegovi podlagi predvidevamo stvarnost. Regresijski model je veljaven le, če so izpolnjene vnaprej znane predpostavke. V nadaljevanju prikazujemo predpostavke, v okviru katerih je linearni model veljaven, kadar ga ocenjujemo po metodi najmanjših kvadratov (angl. least squares ali ordinary least squares). Klasični linearni regresijski model temelji na 10 predpostavkah. V primeru bivariatne regresijske analize z dvema spremenljivkama so te predpostavke naslednje (Gujarati, 2003): 86 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. − regresijski model je linearen v parametrih (regresand Y in regresor X sta lahko tudi nelinearna); − vrednosti, ki jih zajame pojasnjevalna spremenljivka X, so v ponavljajočih se vzorcih nespremenljive (fiksne); − aritmetična sredina stohastičnega člena (statistične napake) ei je enaka 0; − vrednosti Y so okrog pripadajoče vrednosti X enakomerno porazdeljene, kar pomeni, da imajo enako varianco (homoskedastičnost – pogojne variance ei so identične); − med stohastičnimi členi ni avtokorelacije (korelacija med ei in ej je enaka nič); − kovarianca med ei in Xi je enaka nič; − število opazovanj n je večje kot število parametrov, ki jih ocenjujemo (število opazovanj n mora biti večje kot število pojasnjevalnih spremenljivk); − variabilnost v vrednostih X (vse vrednosti X v danem vzorcu ne smejo biti enake); − regresijski model je pravilno določen; − med pojasnjevalnimi spremenljivkami ni popolne linearne povezave (multikolinearnosti)3. Glede predpostavk naj omenimo še to, da je v marketinških raziskavah pomembno, da so izpolnjene vsaj predpostavke, ki niso odvisne od vrste zbranih podatkov. Do zdaj smo obravnavali povezave med dvema spremenljivkama, pri multivariatni analizi pa je v ospredju proučevanje povezav med tremi ali več spremenljivkami. Takšno analizo imenujemo multivariatna regresijska analiza ali multipla regresijska analiza. Multivariatna analiza ima številne podobnosti z bivariatno, zaradi česar bomo na tem mestu opozorili predvsem na nekatere pomembne razlike. Multivariatna regresijska analiza je tehnika, s pomočjo katere proučujemo medsebojno povezanost med eno odvisno spremenljivko Y in več neodvisnimi spremenljivkami ( X1, X2, X3 … Xk) (Myers in Mullet, 2003; Srivastava, 2002; Zikmund, 1999). Cilj takšne analize torej ostaja v osnovnem pogledu enak, saj še vedno želimo podati enačbo, ki omogoča predvidevanje vrednosti odzivne 3 Predpostavka velja za multivariatni linearni regresijski model. 6 Klasične metode za preverjanje povezav med spremenljivkami in konstrukti 87. spremenljivke, le da jo zdaj določa večje število pojasnjevalnih spremenljivk (Churchill, 1999). Z multiplo regresijo (Malhotra in Birks, 2003) lahko tako v okviru marketinškega raziskovanja pridobimo odgovore na naslednja vprašanja: − V kolikšni meri lahko varianco v prodaji razložimo s pomočjo stroškov za oglaševanje, cen in ravni distribucije? − Kakšen je vpliv različnih dejavnikov zadovoljstva odjemalcev s storitvami na finančno uspešnost podjetja? Osnovni model multiple regresije lahko zapišemo v obliki enačbe: Y = β + β 0 1 X + β 1 2 X + β 2 3 X + 3 ...+ β + k X k e , ki jo podobno kot pri bivariatnem regresijskem modelu ocenimo z naslednjim modelom: Yˆ = a + b 1 X + 1 b 2 X + 2 b 3 X + 3 ...+ b X k k . Koeficient a znova predstavlja presek ordinate (konstanto), vrednosti bk pa predstavljajo delne regresijske koeficiente (Malhotra in Birks, 2003). V literaturi jih imenujejo tudi mrežni regresijski koeficienti (Churchill, 1999). Model podaja najboljšo možno oceno spremenljivke Y za vse pojasnjevalne spremenljivke X, a pod pogojem, da so izpolnjene vse predpostavke. Prav tako lahko z njegovo pomočjo sodimo o moči vpliva posameznih spremenljivk na odvisno spremenljivko. V tem primeru moramo vrednosti b spremeniti v β koeficiente. Večina statističnih pojmov, ki smo jih prikazali v okviru bivariatne regresije, velja tudi za multiplo regresijo. Novi pa so naslednji pojmi: − R: koeficient, ki ga interpretiramo na enak način kot koeficient r pri bivariatni regresijski analizi. Definira moč povezave med spremenljivkami. 88 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. − Koeficient R2: koeficient multiple determinacije, ki je prilagojen številu neodvisnih spremenljivk in velikosti vzorca. − F-test uporabljamo za preverjanje ničelne hipoteze, ki pravi, da je koeficient multiple determinacije enak nič. Princip preverjanja je enak preverjanju statistične pomembnosti povezave med X in Y pri bivariatni analizi, statistika pa je porazdeljena po F- distribuciji. − delni regresijski koeficient b1 definira spremembo v predvidevanih vrednostih Y na enoto spremembe v spremenljivki X1, kadar so druge neodvisne spremenljivke ( X2 … Xk) konstantne. V osnovi torej multipla regresija pojasnjuje naslednje (Myers in Mullet, 2003): − kako dobro lahko vse neodvisne spremenljivke pojasnijo varianco odvisne spremenljivke (koeficient multiple determinacije); − relativno pomembnost vsake neodvisne spremenljivke pri pojasnjevanju variance odvisne spremenljivke (standardizirani regresijski koeficienti); − najboljšo oceno vrednosti odvisne spremenljivke za kakršno koli kombinacijo neodvisnih; − delež sprememb odvisne spremenljivke, ki ga lahko pričakujemo pri spremembi pojasnjevalne spremenljivke za eno enoto (nestandardizirani regresijski koeficienti). Koraki, ki si zaporedno sledijo pri multivariatni regresijski analizi, so podobni predstavljenim pri bivariatni. Zaradi tega se bomo v nadaljevanju posvetili predvsem nekaterim posebnostim, kot so delni regresijski koeficienti, moč povezave, preverjanje statistične pomembnosti in predpostavke, pri katerih izvajamo multivariatno regresijsko analizo. Navedli bomo tudi nekatere težave, s katerimi se najpogosteje srečujemo. Delni regresijski koeficienti Pomen delnih regresijskih koeficientov pri multipli regresiji je v osnovi drugačen kot pri bivariatnem koeficientu. Vzrok temu je medsebojna povezanost med pojasnjevalnimi spremenljivkami, npr. X1 in X2. V bivariatni regresiji namreč spremenljivke X2 ne upoštevamo, zaradi česar smo varianco v odvisni spremenljivki 6 Klasične metode za preverjanje povezav med spremenljivkami in konstrukti 89. Y, ki je izhajala iz pojasnjevalnih spremenljivk X1 in X2, pripisovali le spremenljivki X1. Kadar upoštevamo več neodvisnih spremenljivk, to ne velja. Delni regresijski koeficient b1 interpretiramo kot pričakovano spremembo odzivne spremenljivke Y, če pojasnjevalno spremenljivko X1 spremenimo za eno enoto, pri čemer je spremenljivka X2 konstantna ali nadzorovana. Podobna razlaga je relevantna tudi za koeficient b2, zaradi česar te vrednosti tudi smiselno poimenujemo delni regresijski koeficienti (Kumar et al., 1999; Malhotra in Birks, 2003). Iz zapisanega hkrati opazimo, da je združen učinek obeh spremenljivk na odvisno spremenljivko možno seštevati. To pomeni, da sprememba X1 in X2 za eno enoto pomeni spremembo v Y za (b1 + b2). Definirati pa je treba še standardiziran regresijski koeficient ( β koeficient) (Myers in Mullet, 2003). Beta koeficient so delni regresijski koeficienti, ki jih pridobimo ob standardiziranju vseh spremenljivk (njihova aritmetična sredina je enaka 0, varianca pa 1). Razmerje med standardiziranim in nestandardiziranim (surovim) koeficientom ostaja enako kot pri bivariatni analizi. Presek in delne korelacijske koeficiente izračunamo z rešitvijo sistema simultanih enačb. Ker jih lahko pridobimo s pomočjo katerega koli računalniškega statističnega programskega paketa (na primer SPSS), postopka ne bomo podrobno prikazovali4. Standardizirani koeficienti so primernejši za ugotavljanje in pojasnjevanje vpliva posamične neodvisne spremenljivke pod pogojem, da so tudi statistično značilni. Na tem mestu velja omeniti razliko med enostavnim bivariatnim korelacijskim koeficientom in multiplim regresijskim koeficientom. Te vrednosti so v marketingu pogosto uporabljene kot merila za relativno pomembnost izdelkov, storitvenih sestavin, premoženja itd. Pričakovali bi, da bodo proporcionalne ali vsaj v enakih okvirjih kot pri bivariatni analizi, vendar primerjava kaže, da to ni tako. Vzrok temu je dejavnik, ki ga imenujemo multikolinearnost ali zgolj kolinearnost. Nanaša se na delež medsebojne povezanosti med pojasnjevalnimi spremenljivkami. Višje vrednosti kolinearnosti imajo večji vpliv na β koeficiente. Hkrati to pomeni, da sta pomen in uporabnost standardiziranega koeficienta tem manjša, čim večji je izmerjen delež kolinearnosti. 4 Za natančno pojasnilo, kako izračunati delne regresijske koeficiente, glej Gujarati (2003). 90 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. Moč povezave med spremenljivkami Moč povezave med pojasnjevalno in odvisno spremenljivko lahko merimo s pomočjo multiplega korelacijskega koeficienta (Malhotra in Birks, 2003). Interpretiramo ga na enak način kot enostavni bivariatni koeficient ( r). Oba koeficienta lahko zavzameta vrednosti od –1 do +1, vendar iz vidika marketing managementa nobeden od njiju nima posebno pomembne razlagalne funkcije. Iz tega razloga po navadi navajamo kvadrat multiplega korelacijskega koeficienta ( R2), ki ga imenujemo tudi multipli determinacijski koeficient. Interpretiramo ga na naslednje načine (Myers in Mullet, 2003; Kumar et al., 1999): − predstavlja delež variance odvisne spremenljivke, ki je skupen z varianco kombiniranih pojasnjevalnih spremenljivk; − predstavlja delež variance v odvisni spremenljivki, ki ga lahko razložimo s pomočjo vseh pojasnjevalnih spremenljivk in − predstavlja delež prekrivanja med odvisno spremenljivko in kombinacijo pojasnjevalnih spremenljivk. Multipli determinacijski koeficient izračunamo s pomočjo naslednjega izraza: ∑ n Y(ˆ − Y 2) i 2 i= R = 1 . ∑ n Y( − Y 2) i i=1 R2 je vsota vseh bivariatnih neodvisnih in odvisnih spremenljivk. R2 se ob dodajanju večjega števila pojasnjevalnih spremenljivk (regresorjev) ne more zmanjševati, zaradi česar izračunavamo t. i. korigirani (Artenjak, 1997) ali prilagojen determinacijski koeficient. Ta upošteva manjši vpliv dodanih neodvisnih spremenljivk. 2 n −1 R =1− 1 ( 2 − R ) n − k −1 Vrednost prilagojenega R2 je zelo blizu vrednosti R2, oba koeficienta pa zavzemata večje vrednosti kot r2 pri bivariatni analizi. 6 Klasične metode za preverjanje povezav med spremenljivkami in konstrukti 91. Preizkus statistične značilnosti Preizkus statistične značilnosti izvajamo za celotno regresijsko enačbo, kakor tudi za specifične delne regresijske koeficiente. Ničelna hipoteza za skupni preizkus določa, da je koeficient multiple determinacije v populaciji Rpop enak 0: H : 2 R = 0 pop 0 , kar je ekvivalentno ničelni hipotezi H β = β = β = = β = 0 : 1 2 3 ... k 0. Skupni preizkus lahko izvajamo na naslednji način: 2 R / F = k 1 ( 2 . − R ) /( n − k − ) 1 Predpostavke pri izvajanju multivariatne regresije Večina predpostavk, na katerih temelji multipli regresijski model, je enakih kot pri bivariatni regresiji. Kot smo nakazali, je za interpretacijo individualnih regresijskih koeficientov v multiplem modelu relevantna dodatna predpostavka, ki pravi, da med pojasnjevalnimi spremenljivkami obstaja le majhna ali nikakršna kolinearnost. Pri visoki interkorelaciji namreč najboljša spremenljivka za napovedovanje izkazuje največji regresijski koeficient, medtem ko druge spremenljivke, ki so mu statistično podobne, imajo veliko nižje koeficiente. Ti so lahko tudi zelo blizu ničli. Posledično lahko raziskovalec sklene napačen zaključek, da spremenljivke med seboj niso povezane. Ker se lahko pri multivariatni regresijski analizi srečamo tudi z drugimi težavami, jih bomo v nadaljevanju opredelili. Najpogostejše težave pri multivariatni regresijski analizi V skladu z zapisanim v prejšnjem poglavju se postavlja vprašanje, kolikšna kolinearnost je dovoljena. Odgovor ni preprost, saj je to odvisno predvsem od števila pojasnjevalnih spremenljivk v multiplem regresijskem modelu, od števila medsebojnih povezav, moči povezav in statistične značilnosti povezav. Za medsebojne korelacije, ki so manjše od 0,5 (r ≤ 0,5), velja, da načeloma ne bodo 92 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. imele bistvenega vpliva na regresijske koeficiente. V nasprotju s tem bi lahko korelacije, ki so večje od 0,7 (r ≥ 0,7), predstavljale težave. Težavi se lahko izognemo na različne načine (Myers in Mullet, 2003): − Pred izvajanjem multivariatne regresijske analize proučimo medsebojne vplive (korelacije) med posameznimi spremenljivkami in presodimo smiselnost njihove uporabe v modelu. Postopno lahko izločamo spremenljivke z visoko stopnjo kolinearnosti tako dolgo, dokler ne prejmemo zadovoljujočega rezultata. V tem primeru moramo spremenljivke izločiti glede na moč povezave v vsakem paru tako dolgo, dokler korelacije med njimi niso spremenljive (r ≤ 0,5). − Izračunamo lahko indeks tolerance, ki ga ponuja večina statističnih programov. Indeks kaže delež variance spremenljivke, ki ga ne moremo razložiti z nobeno drugo spremenljivko v modelu. Visok indeks tolerance (≥ 0,6) pomeni, da proučevana spremenljivka relativno ni povezana z drugimi, medtem ko nizka toleranca (≤ 0,3) kaže relativno visoko kolinearnost z drugimi spremenljivkami in dejstvo, da pričujoča spremenljivka dodaja malo število novih informacij. − Med spremenljivkami, ki kažejo najvišjo stopnjo kolinearnosti, izberemo tisto, ki je najmočneje povezana z odvisno spremenljivko. Druge izločimo ali iz njih pridobimo eno samo novo spremenljivko (posamezne spremenljivke so lahko obtežene enako ali glede na njihovo moč povezave z odvisno spremenljivko). − Izvedemo lahko faktorsko analizo vseh neodvisnih spremenljivk, pri čemer poteka postopek iskanja skupin spremenljivk, ki so med seboj močno povezane, vendar niso povezane s katero koli drugo spremenljivko. Za vsako tako skupino, ki jo imenujemo komponente ali faktorji, izračunamo faktorske ocene neodvisnih spremenljivk. Ker faktorji niso povezani in vključujejo večino informacij spremenljivk, ki faktorje sestavljajo, lahko zamenjajo neodvisne spremenljivke kot nov niz v multiplem regresijskem modelu. V multipli regresijski analizi se pogosto srečujemo z velikim številom opazovanj oziroma ocenjevanj s strani posameznega respondenta, pri čemer lahko posamezni respondenti izpustijo vrednost za eno ali več spremenljivk. Kadar se pri podatkih 6 Klasične metode za preverjanje povezav med spremenljivkami in konstrukti 93. srečujemo s takšnimi manjkajočimi vrednostmi, imamo na voljo dve alternativi (Myers in Mullet, 2003): − Popolnoma izločimo respondenta, kar imenujemo tudi 'korelacija z izbrisom'. V tem primeru preskočimo respondenta, ki ima najmanj eno manjkajočo vrednost. Težava te odločitve je, da v nekaterih primerih izločevanje povzroči izgubo velikih količin dragocenih podatkov5. − Dodajamo ocenjene vrednosti za vsako od manjkajočih spremenljivk. To lahko storimo na različne načine: − Manjkajočo vrednost zamenjamo z vrednostjo, ki predstavlja aritmetično sredino vzorca za obravnavano spremenljivko; − Z aritmetično sredino zamenjamo vse spremenljivke za obravnavanega respondenta; − Manjkajočo vrednost zamenjamo z vrednostjo druge spremenljivke, ki z njo izkazuje visoko moč povezave. Čeprav je izbira med navedenimi možnostmi precej arbitrarna, menimo, da smo metode navedli v preferenčnem vrstnem redu. To še posebej velja za ocene respondentov, ki so si med seboj zelo različne. Zamenjava aritmetične sredine za celotni vzorec (prva možnost) najbrž ni tako smiselna kot zapolnjevanje posameznih manjkajočih spremenljivk (druga možnost). Zadnja možnost predstavlja t. i. odzivni niz za vsakega respondenta, kjer je manjkajoča vrednost zelo blizu referenčni vrednosti, uporabljeni za zamenjavo. Hkrati je treba določiti mejo manjkajočim vrednostim. Nekateri respondenti namreč niso natančni ali so brezbrižni, pri čemer izpustijo veliko število vrednosti. Myers in Mullet (2003) v povezavi s tem ugotavljata, da se pri analitikih pojavlja razlika pri deležu sprejetih manjkajočih vrednosti, ki se lahko giblje od 15 do 25 odstotkov. V skladu s to ugotovitvijo bi morali respondente z več kot 25 % manjkajočih vrednosti izločiti iz vzorca in jih obravnavati kot nesodelujoče v raziskavi. 5 Myers in Mullet (2003) navajata primer študije, pri kateri je zgolj 212 respondentov od 1250 navedlo ocene pri vseh 75 atributih. 94 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. Koračna regresija Regresijski modeli, ki smo jih obravnavali, zahtevajo identifikacijo vseh neodvisnih spremenljivk, ki jih vključujemo v model. Da bi se izognili težavi kolinearnosti, lahko izvajamo tudi koračno regresijo. Ta ponuja način za izločanje spremenljivk, ki se v modelu prekrivajo in zaradi tega le malo ali pa sploh ne prispevajo k natančnosti napovedovanja. Rezultat je regresijski model z zmanjšanim številom spremenljivk. Namen koračne analize je torej, da iz velikega števila napovedovalnih spremenljivk pridobimo manjši podniz spremenljivk, ki najbolje razlaga varianco v odvisni spremenljivki. V tovrstnem postopku neodvisne spremenljivke vključujemo oziroma jih izločamo iz modela drugo za drugo (McIntyre et al., 1983, 1–11). Poznamo več različnih vrst koračne regresije (Malhotra in Birks, 2003): − Vključevanje naprej. V model neodvisne spremenljivke vključujemo drugo za drugo pod pogojem, da izpolnjujejo merilo, ki ga določimo z vrednostjo F. Vrstni red vključevanja spremenljivk je določen s prispevkom pojasnjene variance. − Izločanje nazaj. V začetku so v regresijsko enačbo vključene vse neodvisne spremenljivke. Te nato izločamo drugo za drugo na podlagi predhodno določene vrednosti F. − Koračna rešitev. Vključevanje naprej kombiniramo z izločanjem neodvisnih spremenljivk, ki na vsakem koraku ne izpolnjujejo več predpisanega merila. Rezultat koračne regresije ni enačba, ki bi bila optimalna, da z njo pridobimo kar največjo vrednost koeficienta R2 za določeno število spremenljivk za predvidevanje6. Zaradi izločanja na podlagi korelacije se lahko zgodi, da pomembnejša spremenljivka ni vključena v model, medtem ko predstavlja manj pomembnejša enega od členov v regresijski enačbi. Optimalni regresijski model bi tako zahteval izračun kombinatorne rešitve, pri kateri bi proučili vse možne kombinacije. Kljub temu je koračna regresija učinkovita predvsem v primerih velikega števila neodvisnih spremenljivk. 6 Glej na primer Ittner in Larcker (1997), Laroche in Sadokierski (1994) in druge. 6 Klasične metode za preverjanje povezav med spremenljivkami in konstrukti 95. V nadaljevanju prikazujemo primer izračuna multivariatne regresije s statističnim programom SPSS. Izračun bivariatne regresije je podoben, v bistvu še bolj enostaven, pri čemer izberemo samo eno neodvisno in eno odvisno spremenljivko. Prav tako poudarjamo, da bomo prikazali samo osnovne izračune, pri čemer je možno pred začetkom izvajanja analize s programom izvesti tudi nekatere dodatne izračune za preverjanje ali predpostavke, ki smo jih opisali v tem poglavju, za podatke, na katerih izvajamo analizo, veljajo. V našem primeru nas zanima, kako trije dejavniki tržne naravnanosti, in sicer naravnanost na odjemalce, naravnanost na komponente in medfunkcijska povezanost, vplivajo na inovativnost podjetja. Po teoretičnih in empiričnih ugotovitvah iz literature (npr. Han et al., 1998; Ozkaya et al., 2015) naj bi namreč tržna naravnanost v podjetjih pozitivno vplivala na uvedbo izdelkov, ki so za podjetje in trg inovativni, saj takšna podjetja bolje razumejo potrebe in hotenja odjemalcev. Potrebe in hotenja pa se zadovoljujejo s pomočjo potencialnih novih inovativnih izdelkov. Svoj regresijski model preverjamo na vzorcu 464 podjetij. Slika 17: Zaslonski prikaz v programu SPSS za izvajanje linearne multivariatne analize Vir: zajem zaslona, lasten. V programu SPSS najprej izberemo ukaz Analyze -> Regression -> Linear. Nato izberemo neodvisne (napovedovalne) in odvisne (odzivno) spremenljivke, ki jih premaknemo v polja 'Dependent' za odvisno spremenljivko in 'Independent' za 96 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. neodvisno spremenljivko. Upoštevati moramo, da je lahko neodvisnih spremenljivk več, odvisna pa samo ena. Kot je razvidno iz prikaza, je 'Inovativnost' odvisna spremenljivka, 'naravnanost na odjemalce', 'naravnanost na konkurente' in 'medfunkcijska povezanost' pa so neodvisne spremenljivke. V tem primeru izberemo metodo 'Enter'. Če želimo izvajati druge metode, ki smo jih opisali, lahko izberemo tudi druge možnosti (npr. Stepwise) za koračno regresijo. Druga polja nam omogočajo, da analizo izvedemo samo na določenem delu vzorca (Selection variables) in da označimo respondente na razsevnem diagramu (Case labels). V našem primeru bomo polji pustili prazni. Izberemo še gumb 'Statistics' in v njem označimo Estimates, Model fit, Collinearity diagnostics in Durbin-Watson. Na ta način bomo izpisali nestandardizirane in standardizirane regresijske koeficiente (Estimates), koeficient multiple determinacije (Model fit), preverili predpostavko o multikolinearnosti neodvisnih (Collinearity diagnostics) spremenljivk in avtokorelacijo residualov, torej predpostavko, da med stohastičnimi členi ni avtokorelacije (Durbin-Watson). Tabela 'Model Summary' pokaže, da lahko 30,9 % variance odvisne spremenljivke pojasnimo z vsemi neodvisnimi spremenljivkami, ki smo jih vključili v model (vrednost R2 = 0,309). Prilagojena vrednost R2 (Adjusted R Square) je popravek determinacijskega koeficienta, ki upošteva število neodvisnih spremenljivk. Ta podatek je zanesljivejša vrednost, vidimo pa, da v našem primeru razlika med obema koeficientoma ni velika. Proučimo še vrednost Durbin-Watsonove statistike, ki je kazalnik morebitne prisotnosti avtokorelacije rezidualov. Vrednost 2 pomeni, da avtokorelacija ni prisotna, vrednosti med 0 in 2 pomenijo, da je prisotna pozitivna avtokorelacija, vrednosti med 2 in 4 pa, da je prisotna negativna avtokorelacija. V našem primeru je ta vrednost enaka 1,96, torej nakazuje, da je prisotna izjemno majhna pozitivna avtokorelacija. Po pravilu palca so vrednosti te statistike, ki se gibljejo med 1,5 in 2,5, ustrezne, kar pomeni, da avtokorelacija ni pristna in da lahko nadaljujemo analizo. 6 Klasične metode za preverjanje povezav med spremenljivkami in konstrukti 97. Slika 18: Zaslonski prikaz v programu SPSS za izvajanje linearne multivariatne analize za izvajanje dodatnih statističnih analiz Vir: zajem zaslona, lasten. Tabela 13: Povzetek modela in statistična značilnost multiplega determinacijskega koeficienta Prav tako pogledamo še v tabelo 'ANOVA'. S pomočjo analize variance preverjamo ničelno hipotezo, da je R2 enak 0. Če je statistična značilnost (Sig.) nižja od 0,05, torej p < 0,05, zavrnemo ničelno hipotezo in potrdimo hipotezo, da se R2 statistično značilno razlikuje od 0, torej je statistično značilen. V našem primeru lahko potrdimo prav to. 98 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. Tabela 14: Delni regresijski koeficienti V tabeli 'Coefficients' so navedeni delni regresijski koeficienti, ki kažejo povezavo med posamezno neodvisno in odvisno spremenljivko. Pokažejo torej, koliko variance odvisne spremenljivke lahko razložimo s posamezno neodvisno spremenljivko. Najprej preverimo statistično značilnost koeficientov v stolpcu 'Sig'. V našem primeru vidimo, da so vsi statistično značilni pri p < 0,05, kar je pogoj za to, da med neodvisno in odvisno spremenljivko obstaja povezanost. Če so vsi podatki merjeni na istem intervalu, je vrednost nestandardiziranega koeficienta b enaka standardiziranemu koeficientu β. V našem primeru vidimo, da ni tako, zato interpretiramo koeficiente v stolpcu 'Standardized Coefficients Beta', torej standardizirane koeficiente β. Opazimo, da ima naravnanost na odjemalce najmočnejši vpliv na inovativnost (β1 = 0,303), sledi naravnanost na konkurente (β2 = 0,209), najšibkejši vpliv pa ima medfunkcijska povezanost (β3 = 0,168). Za preverjanje predpostavke o multikolinearnosti je pomembno, da preverimo stolpec 'Collinearity Statistics', in sicer predvsem stolpec 'Tolerance'. Toleranca (variance inflation factor) predstavlja delež variance v neodvisni spremenljivki, za katero je toleranca izpisana, ki je neodvisna od drugih neodvisnih spremenljivk. Toleranca, ki je nižja od 0,5, nakazuje potencialno možnost multikolinearnosti, toleranca, nižja od 0,3, pa resne težave z multikolinearnostjo. V našem primeru težav z multikolinearnostjo nimamo, saj so vse vrednosti toleranc višje od 0,5, najnižja je pri spremenljivki naravnanosti na odjemalce, in sicer 0,665. TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU B. Milfelner 7 Modeliranje strukturnih enačb (SEM) 7.1 Osnovne značilnosti modeliranja strukturnih enačb V marketingu pogosto uporabljamo odvisne analitične tehnike. Nekatere, kot je multivariatna regresijska analiza, smo že prikazali. Prikazali smo tudi uporabo medsebojno odvisnih metod, s katerimi pogosto ugotavljamo veljavnost in zanesljivost merilnih instrumentov (na primer faktorsko analizo). Cilj odvisnih metod je prikazati ali ugotoviti, katere so tiste neodvisne spremenljivke, ki imajo najmočnejšo povezavo z odvisnimi ali pojasnjevalnimi, medtem ko medsebojno odvisne metode težijo k razkritju prioritetne strukture oziroma vzorca povezav med večjim številom izbranih neodvisnih spremenljivk ali povezav med manifestnimi in latentnimi spremenljivkami. Modeliranje strukturnih enačb (angl. structural equation modelling – SEM) uporabljamo za doseganje obeh ciljev. To pomeni, da lahko kombiniramo tako elemente faktorske analize (za identifikacijo osnovnih latentnih spremenljivk oziroma konstruktov, ki odražajo ali definirajo manifestne spremenljivke) kot elemente multivariatne regresijske analize. SEM omogoča restriktivnejše preverjanje veljavnosti in zanesljivosti konstruktov, ki je ključno za vrednotenje vsakega osnovnega koncepta, kakor tudi merjenje vpliva med spremenljivkami. Bistvena 100 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. prednost SEM pred klasično multivariatno regresijo je ta, da z njimi merimo vpliv latentnih spremenljivk, ki lahko nastopajo tako v vlogi odvisne, kot tudi neodvisne spremenljivke. Prav tako lahko merimo posredni in neposredni vpliv med spremenljivkami v modelu (Myers and Mullet, 2003, 321). Medtem ko smo pri korelaciji in regresiji spoznali, da metodi z gotovostjo ne moreta potrditi vzročnosti, s SEM skušamo doseči prav to. Maruyama (1998, 4) razlaga, da SEM podaja ocene povezav med vsemi hipotetičnimi povezavami med spremenljivkami v teoretičnem modelu. SEM omogoča, da lahko raziskovalec, ko podatki niso skladni z modelom, tega zavrne ali pa spremeni hipoteze, na osnovi katerih je zasnovan. Druga možnost je, da sestavi več alternativnih modelov in med njimi poišče tistega, ki je najbolj ustrezen (Kline, 2015, 11), torej najboljše pojasni povezave med spremenljivkami. Tretja možnost je tako imenovani razvoj modela, ki se uporablja največkrat (Jöreskog, 1993). Ko se izkaže, da prvotni model ne ustreza podatkom, tega raziskovalec spremeni, pri čemer največkrat na novo določi povezave med latentnimi spremenljivkami ali pa nekatere spremenljivke izloči, tako da je model teoretično smiseln, enostaven in ustreza podatkom (Kline, 2015). Zaradi zapletenih težav, ki jih v marketingu rešujemo ali pa jih skušamo razumeti, se metoda modeliranja strukturnih enačb zelo pogosto uporablja že od devetdesetih let, čeprav so jo Jöreskog (1969), Keesling (1972) in Wiley (1973) razvili že v sedemdesetih. SEM se pogosto uporablja v poslovnih in drugih družbenih vedah (Kelloway, 1998, 1). Pravzaprav je v zadnjih petintridesetih letih postala ena najpomembnejših analitičnih metod podatkov za preverjanje povezav. SEM omogoča, da raziskovalec presodi ustreznost modela, pri čemer je pri tej metodi ključno, da model ustreza podatkom, kar imenujemo tudi stabilnost modela. Če ugotovimo, da je model stabilen, lahko s pomočjo informacij, ki smo jih pridobili, trdimo, da natančno predstavlja vzročni proces. Čeprav še vedno le bolj ali manj uspešno ocenjujemo ali skušamo dokazovati vpliv, je SEM velik napredek v primerjavi z regresijsko analizo. SEM predstavlja kombiniranje faktorske analize in analize povezav v izjemno obsežno statistično metodologijo. Tipična faktorska analiza je po navadi raziskovalna (eksploratorna), kar pomeni, da raziskovalec a priori ne pozna osnove, po kateri bi lahko opredelil osnovni konstrukt, ki ga sestavlja niz manifestnih 7 Modeliranje strukturnih enačb (SEM) 101. spremenljivk. Raziskovalec oblikuje nize spremenljivk na osnovi pridobljenega znanja, predhodnih raziskav oziroma lastnih izkušenj in nato s pomočjo faktorske analize definira osnovne konstrukte. Pri strukturnem modeliranju po drugi strani predvidevamo, da raziskovalec v osnovi razume področje, ki ga obravnava, zato faktorsko analizo, ki jo izvajamo s pomočjo SEM, imenujemo potrjevalna ali konfirmatorna faktorska analiza (Myers and Mullet, 2003, 323). SEM največkrat razumemo kot krovni termin, ki vključuje tri različne, a med seboj povezane metodologije. To so analiza poti, modeliranje enačb in modeliranje strukturnih enačb z latentnimi spremenljivkami (Myers in Mullet, 2003, 333). 7.2 Razlika med modeliranjem strukturnih enačb in multivariatno regresijsko analizo Pri regresijski analizi se velikokrat srečamo s številnimi prekrivanji med neodvisnimi spremenljivkami. To pomeni, da je določena spremenljivka v modelu lahko v vlogi neodvisne in odvisne spremenljivke hkrati. Kakor je bilo že omenjeno, to v primeru regresijske analize pomeni, da moramo zasnovati in oceniti dva ali več modelov, tovrstna prekrivanja pa lahko vodijo tudi do nerazumljivih in celo zavajajočih rezultatov glede vpliva neodvisnih spremenljivk na posamezno odvisno spremenljivko. Ena od številnih prednosti strukturnih modelov je prav v možnosti razlage tako posrednih kot neposrednih vplivov posameznih spremenljivk v modelu. Slika 22 prikazuje enostavni regresijski model z neposrednim vplivom petih neodvisnih spremenljivk na spremenljivko y. Spremenljivke x so prediktorne, y pa je odvisna spremenljivka. Vrednosti b so regresijski koeficienti, medtem ko je e rezidual pri ocenjevanju spremenljivke y. Obojestranske puščice, ki povezujejo spremenljivke x, predstavljajo medsebojne korelacije. V nasprotju z multivariatnim regresijskim modelom je na sliki 22 prikazanih pet eksogenih oz. endogenih spremenljivk v strukturnem modelu, ki vključuje tako neposredne kot posredne vplive. Tak model ima mnogo večjo moč razlage, hkrati pa tudi večjo kompleksnost (Maruyama, 1998, 38). Kot lahko opazimo, imata spremenljivki x1 in x2 tako posredni kot neposredni vpliv na spremenljivko x5, medtem ko imata na spremenljivko x3 zgolj neposreden vpliv. Hkrati sta obe 102 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. povezani tudi z obojestransko puščico, kar pomeni, da med njima obstaja nekavzalna povezava. Pri gradnji modela mora raziskovalec zaradi prikazanega dobro razumeti vzročno povezanost spremenljivk v modelu, saj lahko le na tak način poveže spremenljivke na smiseln način. e3 x1 x3 P31 x b1 2 x P53 b 1 2 P32 P51 x3 b3 y P43 x5 e5 P41 b P52 4 x x2 P 4 54 b5 P42 x4 x5 e5 Regresijski model Strukturni model Slika 19: Regresijski model in strukturni model s petimi spremenljivkami Vir: Maruyama (1998, 23 in 38) S klasično multivariatno regresijsko analizo težje ocenjujemo medsebojne vplive latentnih spremenljivk, ki so sestavljene iz več manifestnih spremenljivk. V teh primerih je treba zasnovati večje število regresijskih modelov ali najprej več manifestnih spremenljivk združiti v skupno spremenljivko, pri čemer raziskovalci največkrat izračunajo bodisi povprečne ocene spremenljivk bodisi faktorske ocene. Obe metodi imata omejitve in ne podajata tako natančnih rezultatov kot metoda SEM. SEM prav tako omogoča izločanje učinka kolinearnosti med neodvisnimi spremenljivkami, strukturne enačbe pa raziskovalcu pomagajo pri identifikaciji osnovnih konstruktov, ki so podvrženi med seboj podobnim spremenljivkam, in končno tudi pri ocenjevanju moči povezav med konstrukti. Čeprav je SEM dejansko uspešna pri izločanju učinka kolinearnosti, saj kolinearnost pravzaprav uporablja za definiranje osnovnih konstruktov neodvisnih spremenljivk, pa zanjo še vedno veljajo nekatere druge osnovne predpostavke kot pri multivariatni regresiji. 7 Modeliranje strukturnih enačb (SEM) 103. V literaturi najdemo malo primerjav med obravnavanima statističnima metodama. Cheng (2001, 650–667) ob primerjavi zaključuje, da SEM presega uporabnost multivariatne regresijske analize, in sicer v naslednjih pogledih: − možnost oblikovanja modela, kjer imajo spremenljivke vzajemne vplive; − možnost preverjanja postavljenih hipotez s pomočjo več različnih oblikovanih modelov; − večja učinkovitost rešitve težave, ki jo omogoča iskanje najbolj optimalnega modela. 7.3 Razlogi za uporabo metode modeliranja strukturnih enačb SEM je med najpogosteje uporabljanimi statističnimi metodami, s katero preizkušamo povezave v modelih na področju poslovnih ved in marketinga. Metoda je bila razvita kot empirični pripomoček v kvantitativni analizi številnih znanosti. V večini primerov je učinkovitejša od nekaterih multivariatnih tehnik, kot so multipla regresija, analiza poti in faktorska analiza. Čeprav imajo nekatere navedene tehnike dokaj močno vlogo pri preizkusu posameznih povezav v poslovnih in družbenih vedah, te osnovne statistične metode, ki dovoljujejo uporabo omejenega števila spremenljivk, niso dovolj za razumevanje kompleksnih težav marketinga in managementa, kjer posamezna odvisna spremenljivka predstavlja neodvisno spremenljivko v novem vplivnem razmerju (Cheng, 2001, 650; Schumacker in Lomax, 2016, 6). Ugotovimo lahko, da omenjene metode težko zajamejo celovitost interakcijskega vpliva med spremenljivkami, ki imajo dvojno vlogo, torej so hkrati odvisne in neodvisne, medtem ko lahko metoda, s pomočjo katere proučujemo serijo odvisnih povezav, pomaga pri boljšem razumevanju zapletenih marketinških in vedenjskih vprašanj. SEM v literaturi zagovarjajo predvsem zaradi večje moči razlaganja in večje statistične učinkovitosti pri preizkusu modela (Cheng, 2001, 650; Hair, 1998). Kot drugi razlog lahko navedemo kakovostnejše preizkušanje veljavnosti in zanesljivosti merilnih instrumentov oziroma merilnih lestvic. Kot smo poudarili v poglavju o veljavnosti merilnih lestvic, je pri teh treba upoštevati napake pri merjenju. V preteklosti raziskovalci pogosto nanje niso bili pozorni. SEM vključuje latentne in manifestne spremenljivke in z njimi povezane reziduale, ki jih je treba upoštevati pri merjenju konvergentne in diskriminantne veljavnosti. Omenjamo še 104 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. možnost upoštevanja vseh manifestnih spremenljivk oziroma vprašanj ali trditev v modelih, kjer proučujemo vplive. Programska orodja, kot so LISREL, AMOS, MPLUS, R, SMART-PLS ali WARPPLS, so dodatno pospešila uporabo SEM v aplikativnih raziskavah. Omogočajo tudi številne funkcije za primerjavo povprečnih vrednosti ali vplivov med latentnimi spremenljivkami med skupinami in analizo podatkov na več različnih ravneh (npr. podjetje, panoga, gospodarstvo). Prav tako raziskovalci niso povezani več izključno s preverjanjem linearnih povezav. 7.4 Vrste modeliranja strukturnih enačb V marketingu uporabljamo v osnovi predvsem dve vrsti SEM, in sicer tako imenovano modeliranje strukturnih enačb, ki temelji na kovariančnih strukturah (angl. covariance based SEM – CB-SEM), in modeliranje strukturnih enačb, ki temelji na metodi delnih najmanjših kvadratov (angl. partial least squares based SEM – PLS-SEM). V nadaljevanju bomo obravnavali izključno metodo CB-SEM, a je za raziskovalca pomembno, da pozna uporabnost obeh. Nekateri raziskovalci namreč brez upoštevanja ciljev raziskave in značilnosti podatkov, ki jih uporabijo, uporabijo metodo, ki jim je bližje, brez utemeljitev, zakaj so jo izbrali. Prav razumevanje in upoštevanje razlik ter prednosti in slabosti obeh metod je namreč pomemben dejavnik pri odločitvi, ki jo bomo izbrali. CB-SEM se primarno uporablja za potrjevanje že obstoječih teorij na osnovi postavljenih hipotez. Po drugi strani se PLS-SEM uporablja, kadar je raziskava bolj vpogledne narave, torej takrat, kadar je to napovedovalna raziskava ali napovedovalna in vpogledna raziskava hkrati. To dejstvo izhaja iz značilnosti obeh metod, saj se statistični cilji med njima zelo razlikujejo. Statistični cilj CB-SEM je napoved parametrov modela, ki je najmanj različen od opazovane kovariančne matrike, potem ko je teoretični model potrjen. Po drugi strani je statistični cilj metode PLS-SEM maksimizacija variance, ki jo lahko razložimo z neodvisno spremenljivko (Hair et al., 2012). CB-SEM je osnovan na skupnem faktorskem modelu, medtem ko je PLS-SEM osnovan na kompozitnem modelu (Hair et al., 2017, 109). 7 Modeliranje strukturnih enačb (SEM) 105. Prednosti obeh metod so uporaba več različnih odvisnih in neodvisnih spremenljivk in možnost obstoja multikolineranosti med neodvisnimi spremenljivkami. Menimo, da je osnovna slabost PLS-SEM predvsem to, da je metoda uporabna le za vpogledne in napovedovalne raziskave, prav tako je manj primerna takrat, ko raziskavo zasnujemo na osnovi predhodnih teoretičnih spoznanj ter zastavimo hipoteze. Prav tako je tudi manj primerna za preverjanje veljavnosti in zanesljivosti merilnih instrumentov. Pri metodi CB-SEM namreč izračunavamo poleg faktorskih uteži tudi reziduale za vsako posamezno manifestno spremenljivko (trditev ali vprašanje). To omogoča izločanje manifestnih spremenljivk z velikim rezidualom in nizkimi faktorskimi utežmi, saj tako dobimo kakovostnejše latentne konstrukte. Na stopnji potrjevalne (konfirmatorne) faktorske analize metoda CB-SEM predpostavlja kovariantnost latentnih spremenljivk in s tem boljše kvantitativno ovrednotenje le-teh (Bagozzi in Yi, 2012). Prav tako CB-SEM ponuja bistveno obsežnejšo metodologijo ocenjevanja ustreznosti modela z različnimi indeksi ustreznosti. PLS-SEM je primerna metoda, kadar so vzorci majhni (ti so še posebej značilni za vpogledne raziskave) in kadar podatki niso normalno porazdeljeni (Henseler et al., 2009), saj je metoda CB-SEM dokaj občutljiva na odklone podatkov od normalne porazdelitve. V obeh primerih metoda PLS-SEM podaja robustne rezultate, model pa lahko posplošimo na celotno populacijo (Hair et al., 2016). Prav tako je uporaba PLS-SEM priročnejša takrat, ko so latentne spremenljivke določene s tako imenovanimi formativni indikatorji, kjer manifestne spremenljivke ne odražajo latentnih, temveč nanje vplivajo (Sarstedt et al., 2016). Pri tem je potrebno poudariti, da lahko formativne indikatorje zasnujemo tudi v okviru analize z metodo CB-SEM (Diamantopoulos in Winklhofer, 2001). Kot smo že zapisali, v nadaljevanju podrobneje opisujemo značilnost modeliranja strukturnih enačb, ki temelji na kovariančnih strukturah. 7.5 Zaporedje korakov pri izvajanju modeliranja strukturnih enačb Klasični pristop k modeliranju strukturnih enačb, ki ga uporabljamo pri večini družbenih znanosti, prikazujemo s sliko 12. Ta pristop je smiseln tako za potrjevalno (konfirmatorno) faktorsko analizo (merski model) kot za preverjanje povezav med latentnimi spremenljivkami (strukturni model). V merskem modelu je predvideno, 106 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. da vse spremenljivke med seboj korelirajo, v strukturnem pa predvidimo vplive med latentnimi spremenljivkami, ki so lahko eksogene ali endogene. CB-SEM se, kot smo že poudarili, začne z dobrim poznavanjem koncepta in teoretičnega problema. Strukturne enačbe morajo namreč odražati zrcalno sliko teorije. Tako je za pridobivanje relevantnih rezultatov treba najprej natančno opredeliti model, torej latentne in manifestne spremenljivke, in če je v ospredju strukturni model, tudi povezave med latentnimi spremenljivkami. Pri naslednji stopnji je pomembna identifikacija modela, ki je namenjena temu, da raziskovalec oceni, ali je zastavljen model mogoče rešiti. Nato ocenjujemo parametre modela za celotni strukturni model (indeksi ustreznosti) in za posamezne dele modela (na primer faktorske uteži in reziduale). Sledi še njegovo spreminjanje, če se to izkaže kot nujno. Ti stopnji sta ponavljajoči se, saj po navadi naredimo spremembo v modelu in nato ponovno ocenjujemo celotno ustreznost modela in parametre modela, dokler niso doseženi ciljni standardi. Teorija Oblikovanje konceptualnega modela Zbiranje podatkov Identifikacija modela Podrobna opredelitev strukturnega modela Ocenjevanje parametrov Ocenjevanje ustreznosti modela Spreminjanje modela Razprava Slika 20: Zaporedje korakov pri izvajanju SEM Vir: Prirejeno po Kaplan (2000, 8) in Diamantopoulus in Suguaw (2000, 7) 7 Modeliranje strukturnih enačb (SEM) 107. Šele ko dosežemo ustrezen model, sledi stopnja interpretacije rezultatov. Še enkrat poudarjamo, da je zelo pomembna povezava med teorijo in sestavljanjem strukturnih enačb modela. Metoda CB-SEM predpostavlja, da se konceptualizacija modela od teorije razlikuje le po obstoju določenega deleža napake oziroma reziduala. Četudi model spreminjamo, je cilj vedno najti najbolj ustrezen model, ki je čim bolj v skladu s teoretičnimi izsledki. 7.6 Oblikovanje konceptualnega modela Konceptualizacijo strukturnega modela prikazujemo na sliki 21. Kot smo že pojasnili, v strukturnem modelu predvidimo vplive med latentnimi spremenljivkami. Iz diagrama je razvidno, da lahko napake nastanejo na različnih mestih snovanja konceptualnega modela (npr. izpustitev pomembnih spremenljivk, nepravilno razvrščanje spremenljivk in vključevanje nerelevantnih povezav). Pri konceptualizaciji modela je pomembno razumevanje pojmov endogena in eksogena spremenljivka. Endogena spremenljivka je razložena v modelu. To so spremenljivke, katerih vrednosti so definirane v kontekstu modela. Modeli strukturnih enačb razlagajo endogene spremenljivke. Nanje so v modelu predvideni vplivi drugih spremenljivk. Če model ne razlaga posamezne spremenljivke, pomeni, da so te spremenljivke eksogene. Na te spremenljivke torej v modelu vplivi niso predvideni, lahko pa eksogene spremenljivke vplivajo na druge. Njihove vrednosti so definirane zunaj modela. Pomemben je tudi zorni kot konceptualizacije. Kot smo že zapisali, je na tej stopnji pomemben pregled literature, ki je osnova za postavljanje hipotez. V številnih primerih lahko v teoriji najdemo kontradiktorna mnenja in dokaze, kar otežuje zasnovo modela. Predvsem v marketinški znanosti so številna področja zelo redko tako dobro razumljena, da bi lahko posamezen fenomen opisali z enim samim sprejemljivim modelom (Rust in Schmittlein, 1985, 20). Pri tem poudarjamo, da boljši pregled literature raziskovalcu po navadi omogoča tudi izgradnjo boljšega modela. 108 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. ŠTART Pretekle teorije, dokazi in izkušnje iz eksploratornih raziskav Vključeni Definiranje konstruktov Izpuščeni Da irelevantni (latentnih spremenljivk v relevantni Da konstrukti modelu) konstrukti? Preoblikovanje latentnih Ne spremenljivk v eksogene in Ne endogene Da Da Ali lahko posamezno Ne spremenljivko označimo Ne kot eksogeno in endogeno? Da Vrstni red endogenih Možni alternativni modeli spremenljivk Je vrstni red Ne razumljivo Ne definiran Da Vključene Definiranje pričakovanih Izpuščene irelevantne povezav za vse endogene relevantne povezave? spremenljivke povezave? Končni model za Ne preverjanje Ne Slika 21: Konceptualizacija strukturnega modela Vir: Diamantopoulus in Suguaw (2000, 15) 7 Modeliranje strukturnih enačb (SEM) 109. V modelu je treba opredeliti naslednje spremenljivke: − latentne, − manifestne, − eksogene in − endogene spremenljivke. Slika 21 opredeljuje logične korake pri konceptualizaciji strukturnega modela, pri čemer moramo upoštevati, da je definiranje konstruktov (latentnih spremenljivk v modelu) pomembno tudi pri sestavljanju merskega modela (pri potrjevalni faktorski analizi). Temeljno hipotezo SEM je postavil Bolen (Bollen, 1989), in sicer: F = S(T), kjer je S kovariančna matrika opazovane populacije, T vektor modela, S(T) pa kovariančna matrika kot posledica oziroma rezultat modela. Cilj SEM je pojasniti vzorce kovariance, ki jih opazujemo med analiziranimi spremenljivkami. Model pravzaprav predstavlja razlago, čemu sta (oziroma nista) dve (ali več) spremenljivki v odnosu oziroma v povezavi. Iz hipoteze sledi matematični zapis sistema simultanih enačb: η = η B + Γ ξ + ζ . Pomen oznak je naslednji: − η je vektor endogenih latentnih spremenljivk (vektor m × 1 opazovanih endogenih spremenljivk), ki jih želimo razlagati z modelom; − ξ je vektor eksogenih latentnih spremenljivk (vektor n × 1 opazovanih eksogenih spremenljivk), katere namen je razlaga spremenljivk v vektorju η; − ζ je vektor napake (reziduala); − B je m × m matrika regresijskih koeficientov, ki med seboj povezuje latentne endogene spremenljivke; 110 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. − Γ je m × n matrika koeficientov, ki povezuje latentne eksogene spremenljivke. Ko so v model vključeni vsi konstrukti (latentne spremenljivke), sestavimo prikaz različnih, med seboj povezanih sestavin modela. Ta izhaja iz podrobne konceptualizacije strukturnega modela in ponuja celovit pregled nad strukturo modela. Priporočljivo je, da raziskovalec najprej pripravi grafični prikaz, ki mu pomaga pri lažjem postavljanju hipotez. Pomembno je določiti tudi razmerja med manifestnimi in latentnimi spremenljivkami. Enačbi v nadaljevanju prikazujeta modela, ki pojasnjujeta endogene latentne in eksogene latentne spremenljivke: y = Λ + y η ε x = Λ + x ξ δ. Specifikacijo modela lahko povzamemo v naslednjih točkah (Diamantopoulus in Suguaw (2000, 47): − model za spremenljivko η lahko zapišemo s pomočjo treh matričnih enačb, − matrična enačba za model endogenih latentnih spremenljivk povezuje vektor y z vektorjem η po matriki Λ y in matriki rezidualov ε, − matrična enačba za model eksogenih latentnih spremenljivk povezuje vektor x z vektorjem spremenljivk ξ po matriki Λ x in vektorju rezidualov δ, − matrična enačba za strukturni model povezuje dva vektorja η, in sicer z zmnožkom vektorja η z vektorjem B (ki vključuje parametre β) in z zmnožkom vektorja ξ z vektorjem Γ (ki vključuje parametre γ), vektor η pa je povezan tudi z vektorjem rezidualov latentnih spremenljivk ζ. 7 Modeliranje strukturnih enačb (SEM) 111. V modelu se pojavljajo tudi napake merjenja, saj je nemogoče pričakovati, da lahko empirična merjenja izkazujejo popolno veljavnost in zanesljivost. Pojavijo se lahko tudi zmotne meritve oziroma z nepopolne predstave latentnih spremenljivk7. Specifikacija elementov v matriki B dopušča razlikovanje dveh osnovnih vrst modelov (Kaplan 2000, 16), in sicer rekurzivnih in nerekurzivnih ali simultanih modelov. Oba modela sta prikazana na sliki 22. Rekurzivni modeli ne vsebujejo kovarianc med reziduali, hkrati pa so vsi vplivi v modelu le enosmerni. Drugi prikaz predstavlja nerekurzivni model. Ti modeli predvidevajo povratno zvezo (angl. feedback loop) med dvema endogenima spremenljivkama. Prav tako je za takšne modele značilno tudi, da so predvidene kovariance med pari endogenih spremenljivk (Kline, 2016, 135). Obstoj povratne zveze nakazuje dinamično specifikacijo strukturnega modela, saj za povratno zvezo v večini ekonomskih modelov potrebujemo čas. Težava, ki jo prikazujemo, torej zadeva obseg, v katerem bo povratna zveza stabilizirala ali destabilizirala model. x1 x e 1 1 e2 e1 x2 y1 y2 x2 y1 x3 x3 y2 e2 Rekurzivni model Nerekurzivni model Slika 22: Primer rekurzivnega in nerekurzivnega modela Vir: Kaplan (2000, 17) 7.7 Zbiranje podatkov Preden začnemo načrtovati velikost vzorca, je treba upoštevati postopke, ki smo jih že opisali, za zagotovitev vsebinske veljavnosti merilne lestvice. O tem več v poglavju 4.2.1. 7 To dejstvo je še posebej prisotno, kadar uporabljamo subjektivne ocene, kar se nenehno izvaja v večini marketinških raziskav. 112 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. Tudi pri metodi CB-SEM upoštevamo velikost vzorca in vpliv velikosti ter značilnosti vzorca na rezultate, ki jih pridobimo. Največkrat pri odločanju o velikosti vzorca upoštevamo naslednje dejavnike (Thakkar, 2020, 26): − porazdelitev podatkov, − uporabljena metoda ocenjevanja modela, − kompleksnost modela, − obseg manjkajočih podatkov in − višina povprečne napake varianc pri reflektivnih manifestnih spremenljivkah oziroma zanesljivost konstruktov. Metoda SEM je sposobna rešiti kompleksne težave z multivariatnimi principi na velikih vzorcih. Čeprav velikost vzorca lahko vpliva tudi na rezultate (kot bomo videli predvsem na indekse globalne ustreznosti modela), načeloma velja, da je SEM metoda, ki zahteva velike vzorce, saj so lahko nekatere ocene (npr. rezidualov latentnih spremenljivk) napačne, če je vzorec premajhen (Kline, 2016, 14). Literatura največkrat z vidika primernosti vzorca omenja velikosti od 50 do 200 opazovanj oziroma vzorce, ki imajo več kot osemkrat opazovanj, kot je spremenljivk (Thakkar, 2020, 26). Načeloma so večji vzorci nujni v naslednjih primerih (Hair et al., 2012; Kline, 2016): − kadar so modeli bolj kompleksni in je število parametrov modela večje, − kadar spremenljivke niso razmernostne ali niso normalno porazdeljene, − kadar je zanesljivost konstrukta nižja, − kadar imamo v bazi veliko količino manjkajočih podatkov, − kadar imajo posamezne latentne spremenljivke v modelu manjše število indikatorjev oziroma manifestnih spremenljivk. 7.8 Identifikacija modela Pomemben pogoj za ocenjevanje parametrov v merskem in strukturnem modelu je ugotavljanje, ali model lahko identificiramo. Identifikacija je odgovor na vprašanje, ali lahko parametre v modelu glede na razpoložljive podatke sploh ocenjujemo. Če parametri v modelu niso identificirani, njihovo ocenjevanje ni mogoče (Kaplan, 7 Modeliranje strukturnih enačb (SEM) 113. 2000, 19). Identifikacija temelji na dejstvu, da je za rešitev sistema enačb število neznank najmanj enako številu enačb, ki določajo rešitev. Pri metodi SEM mora biti število neodvisnih parametrov, ki jih ocenjujemo, manjše ali enako številu varianc in kovarianc med manifestnimi spremenljivkami. To imenujemo minimalno pravilo za identifikacijo. Ugotavljamo ga z naslednjo enačbo (Diamantopoulos in Siguaw, 2000, 48): s t ≤ , 2 pri čemer je t število ocenjevanih parametrov, s pa število varianc in kovarianc med manifestnimi (opazovanimi) spremenljivkami. Tega izračunamo na naslednji način: s = ( p + q)( p + q + ) 1 . Označba p je označba za število endogenih ( y) spremenljivk, q pa za število eksogenih spremenljivk. Modeli in parametri so lahko podindentificirani (angl. underidentified), če je t > s/2, natanko identificirani (angl. just-identified), če je t = s/2, ali preidentificirani (angl. overidentified), če je t < s/2. V primeru natanko identificiranega modela obstaja le ena ustrezna rešitev, ki bo popolnoma reproducirala korelacijsko matriko. V primeru preidentificiranega modela je število rešitev večje, s SEM pa poiščemo takšno rešitev, ki najbolje ustreza podatkom (Kelloway, 1998, 14). 7.9 Ocenjevanje parametrov modela Pred ocenjevanjem modela mora biti, kot smo že ugotovili, model identificiran, saj je le tako možno ocenjevanje parametrov modela. Namen ocenjevanja je izračun vrednosti v modelu, ki se potrebuje za ocenjevanje razlik med vsemi elementi, ki so v matriki kovarianc opazovane populacije (S), in korespondenčnimi elementi v želeni matriki kovarianc ( Σˆ ). Cilj je minimiziranje tovrstnih razlik, kar pomeni, da mora biti ocenjena matrika kovarianc, ki jo izračunamo s postavljenim modelom ( Σˆ ), kar najbližje matriki S (Hoyle, 1995, 5). Funkcijo, s katero merimo razlike med Σîn S, 114 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. imenujemo funkcija ustreznosti (angl. fitting function). Funkcija F(S, Σˆ ) je skalarna funkcija, ki meri razliko med matriko kovariance vzorca S in ustreznostno matriko kovariance Σˆ (Kaplan, 2000, 24). Zaradi enostavnejšega ocenjevanja večina računalniških programov za ocenjevanje vse parametre zbere v vektor, ki ga označujemo z Ω. Ta vključuje: − variance in kovariance eksogenih spremenljivk v matriki Φ, − variance in kovariance napak v matriki Ψ in − regresijske koeficiente v matrikah B in Γ. Funkcija F(S, Σˆ ) lahko ima tako naslednje lastnosti: − F(S, Σˆ ) ≥ 0, − F(S, Σˆ ) = 0, kar se zgodi natanko takrat, kadar je Σênak S, − F(S, Σˆ ) je funkcija S in Σˆ . V nadaljevanju smo naredili pregled metod, ki jih uporabljamo za ocenjevanje parametrov modela. Naš namen ni podrobnejše opisovanje vsake posamezne metode, saj bi s tem presegli zastavljene okvirje. Hkrati naj omenimo, da so danes raziskovalcu v pomoč številni statistični in računalniški programi, ki učinkovito zajamejo večino navedenih metod. V okviru CB-SEM uporabljamo za ocenjevanje parametrov naslednje metode (Diamantopoulus in Suguaw, 2000, 55): − metodo instrumentalnih spremenljivk (angl. instrumental variables – IV), − metodo dvostopenjskih najmanjših kvadratov (angl. two-stage least squares – TSLS), − metodo neuravnoteženih najmanjših kvadratov (angl. unweighted least squares – ULS), − metodo splošnih najmanjših kvadratov (angl. generalized least squares – GLS), − metodo največjega verjetja (angl. maximum likelihood – ML), 7 Modeliranje strukturnih enačb (SEM) 115. − metodo splošno uravnoteženih najmanjših kvadratov (angl. general y weighted least squares – WLS) in − metodo diagonalno uravnoteženih najmanjših kvadratov (angl. Diagonaly weighted least squares –- DWLS). Pod predpostavko, da je model pravilen in da je vzorec ustrezno velik, lahko pričakujemo, da bomo s katero koli navedeno metodo pridobili ocene, ki so zelo blizu dejanskim vrednostim posameznih parametrov. V nadaljevanju navajamo nekaj osnovnih razlik in prednosti ter slabosti med posameznimi metodami. Podrobnejše razlike med ocenjevalnimi tehnikami so predstavljene v Long (1983), Jöreskog on Sörbom (1996) in Kaplan (2000). Metodi IV in TSLS sta neiterativni in od vseh najbolj omejeni informacijski tehniki (angl. limited-information techniques). Vsak parameter ocenjujeta posebej, ne da bi uporabljali informacije iz drugih enačb v modelu. Zato sta manj robustni in učinkoviti od drugih polnih informacijskih tehnik (angl. full information techniques), ki ocenjujejo celoten sistem enačb simultano. Za ocenjevanje posameznih parametrov polne informacijske tehnike namreč izkoriščajo informacije v celotnem sistemu (Long, 1983, 43). Zaradi tega sta metodi IV in TSLS največkrat uporabljeni samo za izračunavanje začetnih vrednosti drugih metod. Samostojno ju uporabimo le v primeru, ko je model eksperimentalen in je nastal na osnovi vpogledne raziskave. Druge navedene tehnike (ULS, GLS, ML, WLS in DWLS) sodijo v skupino polno informacijskih tehnik in so bolj statistično učinkovite. Zato so tudi bolj podvržene napakam, saj je ocenjevanje vsakega parametra odvisno od drugih posamičnih parametrov v modelu, nanje pa vplivajo tudi napačne specifikacije modela (Long, 1983, 43). ULS, GLS, ML, WLS in DWLS uporabljajo iterativne procese, kjer so končni parametri ocenjeni s pomočjo numeričnega iskalnega procesa, ki minimizira vrednosti funkcije ustreznosti s sukcesivnimi izboljšavami ocen. Najpogosteje uporabljamo metodo največjega verjetja (Baumgartner in Homburg, 1996, 149). Ta metoda je tudi največkrat uporabljena pri modeliranju strukturnih enačb s programom AMOS. Metoda ML podaja učinkovite ocene, ki pa veljajo pod predpostavko multivariatne normalne porazdelitve, pri čemer je metoda z nekaterimi prilagoditvami tudi relativno robustna v primerih manjših odstopanj. S to metodo izračunavamo statistične vrednosti, s katerimi, kot smo zapisali, ocenjujemo obseg, 116 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. do katerega je model konsistenten s podatki (vrednotenje ustreznosti modela). Čeprav ML ni najustreznejša metoda v vseh okoliščinah, večina raziskovalcev uporablja prav to metodo. Model lahko v matematični obliki zapišemo s pomočjo naslednje enačbe8 (Kaplan, 2000, 27):  S F  = log Σ(Ω) + (Ω) − log − ML tr S t   , Σ  pri čemer je t skupno število spremenljivk v η in ξ ( t = p + q). Če model popolnoma ustreza, je vsota prvega in tretjega člena enaka nič, podobno pa velja tudi za vsoto drugega in četrtega člena. Podobne rezultate kot metoda ML podaja tudi metoda splošnih najmanjših kvadratov (GLS). Ta metoda je dokaj robustna v primeru manjših kršitev predpostavke o multivariatni normalni porazdelitvi. Osnovna oblika funkcije ustreznosti GLS je naslednja (Kaplan, 2000, 29): F = 1 GLS [S −Σ(Ω)]' − W [S −Σ(Ω)], pri čemer je W–1 matrika, ki ocenjuje odklon S-Σ (Ω ) z vidika varianc in kovarianc. Podrobneje smo opisali metodi, ki se najpogosteje uporabljata. Metoda uravnoteženih najmanjših kvadratov (ULS) je edina metoda, ki je odvisna od uporabljene lestvice. To pomeni, da sprememba lestvice ene ali več opazovanih spremenljivk povzroči spremembo ocene. Te metode imajo torej v primerjavi z metodami, ki od lestvic niso odvisne (npr. ML in GLS), pomembne slabosti. Tudi pri metodah, ki niso odvisne od lestvic, se ob spremembi lestvice parametri sicer spremenijo, vendar odražajo zgolj spremembe v lestvicah opazovanih spremenljivk, ki jih ocenjujemo. Zaradi tega je uporaba metode ULS upravičena le v primerih, kadar vse opazovane spremenljivke merimo v istih enotah, in manj uporabna v marketinških raziskavah. 8 Podrobnejša izpeljava enačbe je na voljo v Kaplan (2000, 25–27). 7 Modeliranje strukturnih enačb (SEM) 117. Zadnji metodi, WLS in DWLS, sta robustni metodi in sta primerni tudi za uporabo v primeru, ko podatki niso porazdeljeni normalno (Flora in Curan, 2004; Yang-Wallentin, Jöreskog in Luo, 2010). Omejitvi pri obeh pa sta predvsem zahteva po zelo velikem vzorcu (več kot 1000) in visoka računska zahtevnost. Nekateri avtorji dvomijo o večji učinkovitosti tovrstnih pristopov v primerjavi z metodo ML, tudi ko porazdelitve spremenljivk niso normalne (Byrne, 1995, 147). Veliko računalniških programov za izvajanje modeliranja strukturnih enačb ponuja različna orodja ocenjevanja parametrov strukturnega modela s pomočjo različnih izvedenk metode ML. Na primer ocenjevanje po robustni metodi največjega verjetja (MLR) je smiselno takrat, ko so spremenljivke zvezne in niso normalno porazdeljene. V tem primeru so originalni podatki analizirani z metodo, ki predpostavlja normalno porazdelitev, izračunani pa so še robustni standardizirani reziduali in prilagojena preizkusna statistika (Savalei, 2014). Druga možnost je uporaba klasične metode ML z neparametričnim zankanjem (angl. Bootstrap). Ta metoda se izvaja pod predpostavko, da je porazdelitev v populaciji enaka porazdelitvi v vzorcu. Bollen in Stinovo (1993) zankanje generira prilagojene vrednosti statistične značilnosti (p). Nekatere študije z računalniškimi simulacijami so razkrile, da so bili modeli, ki so bili ocenjeni s pomočjo zankanja, manj pristranski od tistih, ki so bili ocenjeni le z metodo ML. To je bilo značilno predvsem v primerih, ko so bili vzorci veliki, porazdelitve pa niso bile normalne (Kline, 2016, 239). 7.10 Ocenjevanje ustreznosti modela Namen ocenjevanja celotne ustreznosti modela je ugotavljanje stopnje, do katere je model kot celota konsistenten z razpoložljivimi empiričnimi podatki. To je torej ocena, kakšna je stopnja veljavnosti in zanesljivosti izmerjenih vrednosti, ki sestavljajo posamezne konstrukte, ali ocena, kakšna je povezanost med endogenimi in eksogenimi spremenljivkami. Obstaja veliko število indeksov za ocenjevanje ustreznosti modela, nekateri računalniški programi jih izpišejo tudi več kot 30. Ker imajo posamezni indeksi različne funkcije, je pomembno razumevanje, s kakšnim namenom indeks uporabimo in kako ga interpretiramo. 118 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. Indeksi se med seboj razlikujejo glede na to, ali so občutljivi na velikost vzorca, na parsimoničnost modela (na večjo kompleksnost modela), in glede na to, ali ocenjujejo ustreznost relativnega ali primerjanega modela. Zato je pomembno, da ovrednotimo več indeksov hkrati, saj na tak način prejmemo celovito informacijo o tem, kako ustrezen oziroma dober model smo sestavili (Iacobucci, 2019, 90). Težko zapišemo, kateri indeks za ocenjevanje je najboljši ali najslabši, pomembni so namreč cilji, ki jih zasleduje raziskovalec. V osnovi ločimo naslednje vrste ocenjevanja ustreznosti modela (Diamantopoulus in Suguaw, 2000, 82): − ocenjevanje celotne (globalne) ustreznosti modela, − ocenjevanje ustreznosti merjenih delov modela in − ocenjevanje strukturnega modela. V nadaljevanju podrobneje opisujemo indekse posamezne skupine. 7.10.1 Ocenjevanje celotne (globalne) ustreznosti modela Ko govorimo o celotni ustreznosti modela, ugotavljamo stopnjo, do katere je model kot celota konsistenten z razpoložljivimi empiričnimi podatki. Z globalnimi indeksi ustreznosti lahko ustreznost modela primerjamo z osnovnim postavljenim modelom, ki po navadi določa popolno medsebojno odvisnost med opazovanimi spremenljivkami. Osnovni model popolne medsebojne odvisnosti je najbolj restriktiven model, ki lahko obstaja, zaradi česar so vrednosti ustreznosti, ki jih izmerimo v takšnem modelu, po navadi zelo visoke. Glede na ta model s spremembami v modelu iščemo tistega, ki je še ustreznejši od osnovnega. Indeksi odražajo razdaljo med matrikama S in Σˆ , pri čemer to razdaljo z različnimi indeksi merimo na različne načine (Kaplan, 2000, 107). Z različnimi indeksi lahko zajamemo stopnjo napačne opredelitve modela. Večina indeksov ima določen interval, ki se nahaja med nič in ena, pri čemer ena pomeni popolno ustreznost modela, nič pa popolno neustreznost. Ker je število indeksov izjemno veliko, se bomo v nadaljevanju omejili samo na najpomembnejše oziroma na tiste, ki so v literaturi najpogosteje zastopani. V skladu s tem (Diamantopoulus in 7 Modeliranje strukturnih enačb (SEM) 119. Siguawav, 2000, 83) poudarjata, da posamezni indeksi niso nujno boljši od drugih v vseh okoliščinah, saj so zasnovani tako, da so delno odvisni tudi od velikosti vzorca, procesa ocenjevanja, kompleksnosti modela, kršitve predpostavk multivariatne normalne porazdelitve in glede na kombinacijo navedenih dejavnikov. χ2 χ 2 je najpogostejše merilo ustreznosti. Njegovo vrednost izračunamo s pomočjo enačbe: (N – 1)Fmin, pri čemer je N velikost vzorca in Fmin vrednost funkcije ustreznosti pri konvergenci (glej poglavje 7.8). Ta statistika je merilo za ocenjevanje ustreznosti modela, pri čemer preverjamo ničelno hipotezo, da model popolnoma ustreza podatkom. Statistično značilen χ 2 zaradi tega pomeni zavrnitev ničelne hipoteze in nakazuje na neustrezen model. Skupaj z χ 2 lahko izračunamo tudi prostostne stopnje ( df – angl. degrees of freedom), ki jih prikažemo kot ½ k(k + 1) – t, pri čemer je k število opazovanih spremenljivk in t število parametrov, ki jih ocenjujemo. Neustreznost modela, ki jo pokaže test χ 2, ima lahko zelo različne vzroke. Poleg nepravilne specifikacije modela lahko te iščemo tudi v nenormalni porazdelitvi, manjkajočih podatkih in v velikosti vzorca (Kaplan, 2000, 32). Prostostne stopnje (df) prav tako niso nepomembne, saj jih uporabljamo kot standard, po katerem ocenjujemo velikost χ 2 (Jöreskog in Sörbom, 1989, 43). Idealna vrednost statistike χ 2 je tista, ki je kar najbolj približana faktorju df, avtorji pa uporabljajo različna razmerja, od vrednosti 2 do vrednosti 5. Prav zaradi tega nekateri opozarjajo (Sweeney et al., 1999, 91), da χ 2 ni najbolj priporočljiv kot edino merilo ustreznosti. RMSEA (angl. root mean square error of approximation) – koren povprečnih vrednosti približka kvadratov rezidualov Naslednji indeks za ocenjevanje celotne ustreznosti modela je RMSEA. RMSEA se največkrat omenja kot najbolj informativni indeks ustreznosti. Izračunamo ga z enačbo: 120 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. F RMSEA 0 = , df pri čemer je F0 ocenjena vrednost funkcije ustreznosti, kadar model ustreza populaciji matrike kovariance Σ. RMSEA kaže, kako dobro model z neznano, vendar optimalno izbrano vrednostjo parametrov ustreza populaciji matrike kovarianc, če bi seveda obstajal. Vrednosti, ki so bližje 0, kažejo večjo ustreznost modela. Kaplan (2000, 113–114) v povezavi s tem ugotavlja, da vrednosti RMSEA, ki so nižje ali enake 0,05, kažejo visoko raven ustreznosti. Vrednosti med 0,05 in 0,08 kažejo sprejemljivo ustreznost, vrednosti med 0,08 in 0,10 pa povprečno ustreznost. Za vrednosti RMSEA lahko oblikujemo tudi 90-% interval zaupanja, ki omogoča boljše ocenjevanje natančnosti. Indeks je občutljiv na manj kompleksne modele z manjšim številom spremenljivk, saj v tem primeru njegova vrednost narašča (Breivik in Olsson, 2001). Podobna indeksa kot RMSEA sta tudi indeksa RMR (povprečna vrednost kvadratov rezidualov) in standardiziran indeks RMR – SRMR9 (standardiziran koren povprečnih vrednosti kvadratov rezidualov). Ta lahko zajame vrednosti od 1 do 0, pri čemer vrednosti, ki so bližje 0, kažejo višjo ustreznost modela. Čeprav lahko ugotovimo, da sta oba indeksa zelo primerna za ocenjevanje globalne ustreznosti modela, v literaturi raziskovalci še vedno najpogosteje poročajo o indeksu RMSEA. NFI (angl. normed fit index) – normiran indeks ustreznosti, NNFI (angl. non-normed fit index) – nenormiran indeks ustreznosti in CFI (angl. comparative fit index) – primerjalni indeks ustreznosti Indeks, ki ga zelo pogosto uporabljamo za preverjanje ustreznosti modela, je NFI (Kaplan, 2000, 108). Indeks lahko zapišemo kot: 2 2 χ − χ b t NFI = , 2 χ b 9 Več o obeh indeksih in izračunih najdete v Iacobucci (2010). 7 Modeliranje strukturnih enačb (SEM) 121. kjer je χ b2 hi-kvadrat modela popolne medsebojne neodvisnosti (tako imenovan osnovni model) in χ t2 hi-kvadrat ciljnega modela, ki ga ocenjujemo. Prvi model je tipično povezan z zelo velikimi vrednostmi hi-kvadrata, saj ničelna hipoteza trdi, da med spremenljivkami v populaciji ni kovarianc. Zaradi tega vrednosti indeksa NFI, ki so blizu 0, kažejo, da ocenjevani model ni boljši od modela popolne neodvisnosti. Vrednosti, ki se bližajo številu 1, nakazujejo, da je model boljši od osnovnega modela. Vrednosti, večje od 0,9 ali 0,95, so po navadi v literaturi omenjene kot ustrezne (Byrne, 1994; Schumacker in Lomax, 2004; Kline, 2016, 277). Indeks ima nekaj slabosti, saj nanj vpliva velikost vzorca, zaradi česar so vrednosti pri majhnih vzorcih po navadi podcenjene, prav tako je indekse težko primerjati za dva različna niza podatkov. Indeks, ki je zelo podoben indeksu NFI in upošteva tudi pričakovano vrednost statistike hi-kvadrata, je nenormiran indeks ustreznosti (NNFI), imenovan tudi Tucker-Lewisov indeks (TLI). Od slednjega se razlikuje predvsem po tem, da vključuje tudi razmerje med hi-kvadratom in faktorjem df. ( 2 χ χ b / 2 df − b t / dft ) NNFI = ( 2 χ b / df − ) 1 Dodatno indeksu NNFI poznamo še relativni indeks necentralnosti (RNI – angl. relative noncentrality index), ki ga izračunamo z naslednjo enačbo: 2 [(χ − df ) − 2 (χ − df )] b b t t RNI = . 2 χ − df b b RNI lahko obsega vrednosti, ki so izven intervala med 0 in 1, zaradi česar po navadi navajamo prilagojen RNI, ki lahko zajema le vrednosti med 0 in 1 in ga je tudi lažje interpretirati. Tako prilagojen indeks imenujemo primerjalni indeks ustreznosti (CFI – angl. comparative fit index). 122 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. Za vse štiri opisane indekse velja, da vrednosti, ki so blizu 1, kažejo večjo ustreznost modela. Vrednosti, višje od 0,95, kažejo zelo dobro ustreznost, višje od 0,9 pa sprejemljivo ustreznost. GFI (angl. goodnes of fit index) – indeks ustreznosti GFI spada v skupino absolutnih indeksov ustreznosti. Ti primerjajo, kako dobro lahko kovariance ocen parametrov reproducirajo kovariance vzorca. Njihovo izračunavanje ne temelji na primerjavi z osnovnim modelom, kakor je bilo prikazano pri relativnih indeksih ustreznosti (imenovanih tudi primerjalni ali inkrementalni indeksi ustreznosti). To je kazalnik relevantne vrednosti varianc in kovarianc, ki jih lahko razložimo z modelom, zaradi česar kaže dejstvo, kako dobro lahko opazovani model reproducira opazovano kovariančno matriko. Poleg indeksa GFI poznamo še indeks AGFI (angl. adjusted goodness-of-fit index), ki je preprosto GFI, prilagojen s faktorjem df. PGFI (angl. pasimony goodnes-of-fit index) vključuje v ozir tudi kompleksnost modela. Vrednosti GFI, AGFI in PGFI lahko zavzamejo interval med 0 in 1, vrednosti GFI, ki so večje od 0,90, pa po navadi odražajo sprejemljivo ustreznost modela (Jöreskog in Sörbom, 1996). 7.10.2 Ocenjevanje merjenih delov modela Pri ocenjevanju merjenih delov modela preverjamo povezave med latentnimi spremenljivkami in pripadajočimi manifestnimi spremenljivkami oziroma vprašanji ali trditvami. Takšno ocenjevanje strukturnih modelov je posebej pomembno, saj lahko na tak način ugotavljajmo veljavnost in zanesljivost merskih lestvic, s katerimi smo merili posamezne konstrukte. (Diamantopoulus in Siguaw, 2000, 89). Opis preverjanja zanesljivosti in veljavnosti podajamo v naslednjem poglavju. 7.11 Preverjanje zanesljivosti in veljavnosti 7.11.1 Preverjanje zanesljivosti Pri SEM lahko izračunavamo zanesljivosti posameznih konstruktov za vsako latentno spremenljivko. Zanesljivost konstrukta (angl. composite reliability – CR) izračunamo s pomočjo naslednje enačbe (Fornell in Larcker, 1981, 45): 7 Modeliranje strukturnih enačb (SEM) 123. (∑ )2 λ ρ = c , (∑ )2 λ + ∑(Θ) pri čemer je ρ c zanesljivost konstrukta, λ faktorska utež, Θ pa varianca reziduala manifestne spremenljivke (variance δ in ε). Druga mera zanesljivosti je povprečje izločenih varianc (angl. average variance extracted – AVE). To kaže delež variance latentne spremenljivke v primerjavi z deležem variance, ki pripade rezidualu. Izračunamo jo z naslednjo enačbo: ∑ 2 λ ρ = v ∑ . 2 λ + ∑(Θ) Vrednosti ρ c (CR), ki so večje od 0,6, kažejo dejstvo, da manifestne spremenljivke omogočajo zanesljivo meritev konstrukta, vrednosti ρ v (AVE), ki so večje od 0,5, pa dejstvo, da lahko z varianco manifestnih spremenljivk razložimo večji delež latentne spremenljivke kot delež reziduala (Diamantopoulus in Siguaw, 2000, 91). Ta testa sta zelo pomembna, saj pričata o ustrezni zanesljivosti merjenih delov modela in ju moramo izvesti, preden nadaljujemo z ocenjevanjem strukturnega modela, torej z ocenjevanjem vpliva med latentnimi spremenljivkami. 7.11.2 Preverjanje konvergentne veljavnosti Za doseganje konvergentne veljavnosti mora biti model ustrezen, kar preverjamo z globalnimi indeksi ustreznosti, vrednosti ρ v (AVE) pa večje od 0,5. Hkrati morajo biti vse faktorske uteži manifestnih spremenljivk večje od 0,6 in statistično značilne. 7.11.3 Preverjanje diskriminantne veljavnosti Najbolj enostaven test preverjanja diskriminantne veljavnosti je opisal Kenny (1979), ki ga je zasnoval na razmišljanju, da je diskriminantna veljavnost dosežena takrat, ko lahko raziskovalec pokaže, da je enofaktorski model manj veljaven od večfaktorskega. V tem kontekstu je diskriminantna veljavnost dosežena takrat, ko 124 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. lahko dokažemo, da je večfaktorski model boljši. V praktičnem smislu preizkušamo dva modela, in sicer model, kjer predpostavimo (določimo), da obstajajo popolne korelacije med latentnimi spremenljivkami, in model, kjer korelacij ne predpostavimo (določimo), kar pomeni, da dopuščamo proste korelacije. Če je model proste korelacije ustreznejši od modela, kjer predpostavljamo popolno korelacijo, lahko trdimo, da je diskriminantna veljavnost dosežena. Ustreznost obeh modelov preverjamo z indeksi ustreznosti, pri čemer za ugotavljanje statistično značilnih razlik po navadi uporabljamo vrednosti χ 2 in prostostne stopnje (df), razlika v χ 2 glede na df (Δχ 2/df) pa mora biti statistično značilna. Ker ima takšno preverjanje svoje omejitve, sta Fornell in Larcker (1981) zasnovala test diskriminantne veljavnosti, ki preverja, ali z latentno spremenljivko pojasnimo več variance manifestnih spremenljivk, ki jo sestavljajo, v primerjavi z varianco, ki je skupna z drugimi latentnimi spremenljivkami v modelu. Da bi zadostili temu pogoju, avtorja poudarjata, da mora biti vrednost korena povprečja izločenih varianc AVE (pojasnili smo jo v predhodnem podpoglavju) za obe latentni spremenljivki, za kateri preverjamo diskriminantno veljavnost, višja od korelacij med istima latentnima spremenljivkama. Vendar po mnenju Henselerja et al. (2015) tudi ta metoda ni brez omejitve, zato avtorja predlagata v zadnjem obdobju najbolj razširjeno metodo za preverjanje diskriminantne veljavnosti, ki jo poimenujeta razmerje korelacij med in znotraj konstrukta (angl. heterotrait-monotrait ratio (HTMT) of the correlations). To je metoda, s pomočjo katere izračunamo povprečje korelacij med manifestnimi spremenljivkami različnih konstruktov v primerjavi s povprečjem korelacij med manifestnimi spremenljivkami istega konstrukta. Podrobnejše podatke o načinu izračuna najdete v Henseler et al. (2015). Naj omenimo, da danes večina statističnih programov za SEM in njihovih dodatkov omogoča izračun tovrstne statistike. Glede višine tega kazalnika, ki se giblje od 0 do 1, v literaturi ni enotnega mnenja, kakšna naj bi ta bila, priporočene pa so vrednosti, ki so nižje od 0,9 (Kline, 2016) ali nižje od 0,85 (Teo et al., 2008). Čeprav naj bi bil test HTMT strožji od Fornell-Larckerjevega testa, priporočamo, da raziskovalci izvedejo oba. 7 Modeliranje strukturnih enačb (SEM) 125. 7.12 Ocenjevanje strukturnega modela Pri ocenjevanju strukturnega modela preverjamo vplive med spremenljivkami, ki jih proučujemo (povezave med različnimi endogenimi in eksogenimi latentnimi spremenljivkami in med endogenimi spremenljivkami). To pomeni, da vse endogene latentne spremenljivke več ne korelirajo prosto. To velja le še za eksogene latentne spremenljivke, ki so določene izven modela. Na tak način preverjamo hipoteze, ki smo jih zasnovali na podlagi pregleda literature in jih empirično preizkusimo tudi s pomočjo dejanskih podatkov. Pri strukturnem modelu izračunavamo v nasprotju z merskim modelom še parametre, ki jih upoštevamo po naslednjih principih: − Predznaki ocenjenih parametrov predstavljajo vplive med latentnimi spremenljivkami, določajo smer povezave, bodisi pozitivno bodisi negativno povezavo. − Višina ocenjenih parametrov (beta in gama koeficientov) podaja informacije o moči vpliva povezav, ki smo jih določili s hipotezami. − Kvadrat koeficienta multiple korelacije (koeficient multiple determinacije) podobno kot pri regresijski analizi v strukturnih enačbah kaže delež variance endogenih latentnih spremenljivk, ki ga lahko razložimo z deležem varianc eksogenih ali endogenih latentnih spremenljivk (večja je vrednost tega kazalca, večja je tudi skupna razlagalna moč spremenljivke). Ustreznost strukturnega modela ocenjujemo na enak način in z istimi indeksi ustreznosti modela, kot smo jih opisali v poglavju 7.9. 7.13 Primer modeliranja strukturnih enačb v programu IBM AMOS SPSS V nadaljevanju podajamo primer modeliranja strukturnih enačb s programom IBM AMOS SPSS. Program temelji na grafičnem izrisu strukturnega modela in možnosti izpisa rezultatov ocenjevanja modela. Več o praktični uporabi programa lahko najdete v Byrne (2016). Na tem mestu pa navajamo samo ključne napotke, s pomočjo katerih lahko analiziramo merske in strukturne modele. Tako bomo najprej opisali principe analiziranja merskega modela in preverjanja konvergentne in 126 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. diskriminantne veljavnosti z omenjenim programom, nato pa bomo prikazali še analizo strukturnega modela. 7.13.1 Analiza merskega modela Analiza merskega modela je precej podobna raziskovalni faktorski analizi, ki smo jo prikazali v poglavju 5.3. Razlikuje se po tem, da je v primeru analiziranja merskega modela to potrjevalna faktorska analiza (angl. exploratory factor analysis – EFA). To pomeni, da raziskovalec sam vnaprej določi, katere manifestne spremenljivke odražajo posamezno latentno spremenljivko. Pri potrjevalni faktorski analizi smo v nasprotju s tem število latentnih spremenljivk ugotavljali na osnovi lastnih vrednosti, medtem ko pri potrjevalni faktorski analizi raziskovalec sam določi strukturo modela in nato na osnovi indeksov ustreznosti primerja alternativne modele z različnimi vključenimi manifestnimi spremenljivkami. Pri tem si pri spreminjanju modela lahko pomagamo s tako imenovanimi modifikacijskimi indeksi (angl. modification indices – MI), ki kažejo dele modela, ki niso ustrezno opredeljeni. Modifikacijske indekse bomo nekoliko natančneje predstavili v nadaljevanju. Analizo začnemo z definiranjem strukture latentnih spremenljivk. V našem primeru smo merili štiri koncepte, ki so se nanašali na e-bančne storitve, in sicer: možnost stika (spremenljivka: CONTA), varnost (spremenljivka: SECU), stališča do e-bančnih storitev (ATTIT) in zadovoljstvo z e-bančnimi storitvami (SATIS). Podatke smo zbrali na vzorcu 355 komitentov banke, kar pomeni, da je vzorec dovolj velik za izvedbo modeliranja strukturnih enačb. Oblikovali smo torej štiri konstrukte oziroma latentne spremenljivke, te pa smo merili s 15 trditvami (manifestnimi spremenljivkami) po Likertovi lestvici (od 1 – nikakor se ne strinjam do 5 – popolnoma se strinjam). Trditve in pripadajoči konstrukti so prikazani v Tabeli 15. Merski model v programu AMOS narišemo s pomočjo ikone 'Draw a latent variable'. Pomembno je, da vse latentne spremenljivke med seboj povežemo, torej, da predvidimo tudi korelacijo med vsemi latentnimi spremenljivkami. To naredimo s pomočjo ikone 'Draw covariances'. Nato določimo zbirko podatkov, iz katere bomo 7 Modeliranje strukturnih enačb (SEM) 127. zajemali podatke. To naredimo z izbiro ikone 'Select data files' in gumba 'File name', kjer izberemo datoteko s podatki v programu SPSS. Tabela 15: Seznam trditev (manifestnih spremenljivk) in konstruktov (latentnih spremenljivk) v merskem modelu Trditve Konstrukti Na tem e-bančnem mestu se nahaja telefonski stik banke. [Q9a] Na tem e-bančnem mestu lahko dostopam do spletne podpore strankam. [Q9b] Možnost stika Na tem e-bančnem mestu lahko hitro rešujem težave s spletnimi (CONTA) transakcijami. [Q9c] Na tem e-bančnem mestu lahko v primeru težav govorim z resnično osebo. [Q9d] Moji osebni podatki na tem e-bančnem mestu so varni. [Q10a] Moji finančni podatki na tem e-bančnem mestu so varni. [Q10b] Varnost (SECU) Poslovanje po tem e-bančnem mestu je varno. [Q10c] Čutim, da so moji računi na tem e-bančnem mestu varni. [Q10d] Po mojem mnenju je uporaba e-bančnih storitev dobrodošla. [Q4a] Stališče do e-bančnih Menim, da je uporaba e-bančnih storitev prijetna. [Q4b] storitev (ATTIT) Uporaba e-bančnih storitev je premišljena ideja. [Q4c] S procesiranjem transakcij po tem e-bančnem mestu sem zadovoljen. [Q14a] Zadovoljstvo z e- Mislim, da sem sprejel pravilno odločitev, da uporabljam to e-bančno bančnimi storitvami mesto. [Q14b] (SATIS) Moje zadovoljstvo s tem e-bančnim mestom je visoko. [Q14c] Na splošno so e-bančne storitve boljše, kot sem pričakoval. [Q14d] Slika 23: Programsko okno za določanje zbirke podatkov 'Data files' Vir: zajem zaslona, lasten. Manifestne spremenljivke določimo z ikono 'List variables in data set' tako, da posamezno spremenljivko potegnemo v kvadratek, ki prikazuje manifestno spremenljivko, ali vnesemo naziv spremenljivke v polje 'Object properties – Variable 128 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. name'. Polje se pojavi, če dvakrat izberemo kvadratek oziroma posamezno manifestno spremenljivko. Slika 24: Začetni merski model v programu AMOS Vir: lasten. Na sliki 24 prikazujemo merski model, ki smo ga sestavili na osnovi latentnih in manifestnih spremenljivk, ki smo jih opisali v tabeli 15. Ne pozabimo, da pri potrjevalni faktorski analizi predvidimo, da je vsaka manifestna spremenljivka odraz le ene latentne spremenljivke, torej je povezana s pripadajočo latentno spremenljivko. Naš model ima 15 manifestnih spremenljivk in štiri latentne spremenljivke. V naslednjem koraku bomo določili značilnosti analize tako, da izberemo ikono 'Analysis properties'. Na zavihku 'Estimate' lahko izbiramo med različnimi metodami ocenjevanja parametrov modela. Kot smo zapisali v poglavju 7.8, največkrat izberemo metodo največjega verjetja (angl. maximum likelihood). Na 7 Modeliranje strukturnih enačb (SEM) 129. zavihku 'Output' označimo še 'Standardized estimates' in 'Modification indices'. Na tak način bo program izračunal še standardizirane vrednosti faktorskih uteži in izpisal modifikacijske indekse, ki so pomembni pri odločitvah glede sprememb modela. Slika 25: Programsko okno za definiranje značilnosti analize 'Analysis Properties – Output' Vir: zajem zaslona, lasten. Analizo oziroma ocenjevanje parametrov modela začnemo z izbiro ikone 'Calculate Estimates'. V AMOSU lahko rezultate prikažemo v grafičnem in besedilnem načinu. V grafičnem načinu jih prikažemo z izbiro gumba 'View the output Path diagram', v besedilnem pa z izbiro gumba 'View Text'. V nadaljevanju bomo najprej razložili rezultate, ki so prikazani v besedilni obliki. Z izbiro gumba 'View text' se odpre okno 'Amos Output'. Na levi strani lahko z izbiro posameznih podoken prikazujemo izpise. V podoknu 'Analysis Summary' in 'Notes for the Group' so prikazani osnovni podatki o izvedeni analizi in o vrsti modela (rekurziven ali nerekurziven) ter o velikosti vzorca. Podokno 'Variable Summary' je namenjeno izpisu vseh spremenljivk, vključno s številom vseh opazovanih spremenljivk, endogenih in eksogenih spremenljivk. Opazimo, da imamo v modelu skupaj 34 spremenljivk, štiri latentne in 15 manifestnih, 19 eksogenih spremenljivk in 15 endogenih. 130 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. Slika 26: Izpis 'Amos Output', ki je namenjeno prikazovanju rezultatov Vir: zajem zaslona, lasten. V podoknu 'Parameter Summary' so podatki o številu parametrov, ki se ocenjujejo. Pomembnejši pa so podatki v podoknu 'Notes for model'. Naveden je pregled modela, ki vključuje podatke, ki se potrebujejo za identifikacijo modela. Opazimo lahko, da imamo v našem primeru 120 elementov v kovariančni matriki (angl. distinct sample moments) in 36 parametrov, ki jih je treba oceniti, kar pomeni, da nam ostane 84 prostih parametrov oziroma prostostnih stopenj (angl. degrees of freedom). Naš model je torej preidentificiran z vrednostjo χ2 = 205,189 pri 84 prostostnih stopnjah, kar pomeni, da je model statistično značilen pri p < 0,001 (angl. probability level). Zaradi pomembnosti ovrednotenja celotne (globalne) ustreznosti modela se v izpisu rezultatov najprej posvetimo podoknu 'Model fit' . Preden začnemo z ovrednotenjem merjenih delov modela (faktorskih uteži, kovarianc in korelacij), se moramo najprej prepričati, ali model ustreza podatkom. Če s pregledom indeksov celotne ustreznosti modela ugotovimo, da ni tako, to pomeni, da indeksi niso ustrezni, so pred nadaljevanjem nujne spremembe strukture merskega modela na način, da podobno kot pri raziskovalni faktorski analizi izločimo neustrezne manifestne spremenljivke. Na naslednji sliki je prikazan izpis rezultatov v podoknu 'Model Fit', tako imenovan povzetek različnih indeksov globalne ustreznosti modela. V preteklih letih so številni raziskovalci razvijali številne indekse ustreznosti. Najpomembnejše indekse in njihove mejne vrednosti, ki kažejo ustrezen model, smo predstavili v poglavju 7.9.1, 7 Modeliranje strukturnih enačb (SEM) 131. zato jih ne bomo posebej razlagali. Na podlagi izpisa ugotovimo, da je vrednost χ2 = 205,189 pri 84 prostostnih stopnjah (tabela CMIN na sliki 27), kar pomeni, da je χ2 statistično značilen. Kot smo zapisali, to pravzaprav kaže na neustrezen model. Ker pa smo že poudarili, da je ta indeks zelo občutljiv na velikost vzorca, se najprej prepričamo o zvezi z razmerjem med χ2 in df (CMIN/DF), ki je v našem modelu ustrezno, saj je med dva in tri, torej nižje od pet. Model Fit Summary CMIN Model NPAR CMIN DF P CMIN/DF Default model 36 205,189 84 ,000 2,443 Saturated model 120 ,000 0 Independence model 15 4534,222 105 ,000 43,183 RMR, GFI Model RMR GFI AGFI PGFI Default model ,026 ,924 ,892 ,647 Saturated model ,000 1,000 Independence model ,301 ,204 ,090 ,178 Baseline Comparisons Model NFI RFI IFI TLI CFI Delta1 rho1 Delta2 rho2 Default model ,955 ,943 ,973 ,966 ,973 Saturated model 1,000 1,000 1,000 Independence model ,000 ,000 ,000 ,000 ,000 Parsimony-Adjusted Measures Model PRATIO PNFI PCFI Default model ,800 ,764 ,778 Saturated model ,000 ,000 ,000 Independence model 1,000 ,000 ,000 NCP Model NCP LO 90 HI 90 Default model 121,189 82,958 167,118 Saturated model ,000 ,000 ,000 Independence model 4429,222 4212,528 4653,167 132 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. FMIN Model FMIN F0 LO 90 HI 90 Default model ,614 ,363 ,248 ,500 Saturated model ,000 ,000 ,000 ,000 Independence model 13,576 13,261 12,612 13,932 RMSEA Model RMSEA LO 90 HI 90 PCLOSE Default model ,066 ,054 ,077 ,012 Independence model ,355 ,347 ,364 ,000 AIC Model AIC BCC BIC CAIC Default model 277,189 280,811 414,497 450,497 Saturated model 240,000 252,075 697,696 817,696 Independence model 4564,222 4565,732 4621,434 4636,434 ECVI Model ECVI LO 90 HI 90 MECVI Default model ,830 ,715 ,967 ,841 Saturated model ,719 ,719 ,719 ,755 Independence model 13,665 13,017 14,336 13,670 HOELTER Model HOELTER HOELTER .05 .01 Default model 174 191 Independence model 10 11 Slika 27: Izpis rezultatov v oknu 'Model Fit' Vir: lasten. Analizo nadaljujemo s preverjanjem vrednosti dodatnih indeksov. Najprej so to RMR, GFI in AGFI (tabela 'RMR; GFI'). Vidimo, da je vrednost GFI večja od 0,9, kar pomeni, da lahko naš model dobro reproducira opazovano kovariančno matriko. AGFI je pravzaprav indeks GFI prilagojen s prostostnimi stopnjami in zato težko določimo spodnjo mejo, so pa višje vrednosti tega indeksa boljše. Indeks RMR kaže, kako model z optimalno vrednostjo parametrov ustreza populaciji matrike kovarianc. Ker je ta indeks nestandardiziran, težko določimo sprejemljive mere. Bolj je bližje 0, bolj je model ustrezen. Je pa zato pomemben interval indeksa RMSEA, ki ga najdemo v tabeli 'RMSEA'. Tudi v tem primeru nižje vrednosti kažejo večjo ustreznost modela, in sicer vrednost indeksa, nižja od 0,08, kaže sprejemljivo 7 Modeliranje strukturnih enačb (SEM) 133. ustreznost, vrednosti, nižje od 0,05, pa dobro ustreznost, pri čemer je treba upoštevati, da je ta indeks občutljiv na število spremenljivk in kompleksnost modela. V našem primeru je vrednost RMSEA enaka 0,066, torej je to sprejemljiva ustreznost modela. Analizo nadaljujemo z ovrednotenjem indeksov NFI, NNFI (TLI) in CFI. Kot smo že zapisali, naj bi bile vrednosti teh indeksov višje od 0,95 oziroma vsaj od 0,90. V našem primeru je iz tabele 'Baseline Comparisons' razvidno, da so vsi trije indeksi višji od 0,95, kar pomeni, da lahko potrdimo, da je model ustrezen. Pri vrednotenju modela z globalnimi indeksi ustreznosti naj posebej opozorimo na to, da so predlagane vrednosti namenjene zgolj orientaciji. Kot smo zapisali v poglavju 7.9.1, je vrednost indeksov vedno odvisna od različnih dejavnikov, zato jim moramo v tem kontekstu tudi razumeti. Pri nekaterih modelih je tako težko pričakovati, da bi bili vsi indeksi ustreznosti v priporočenih intervalih. Kot smo opazili v našem primeru, se pogosto zgodi, da dosežemo statistično neznačilno vrednost χ2. Ta indeks je tudi najbolj občutljiv in je pogosto statistično značilen. Kadar ugotovimo, da večje število indeksov ni v priporočenih intervalih, to najverjetneje pomeni, da smo napačno opredelili model. Napake v specifikaciji modela lahko odpravimo s tako imenovanimi modifikacijskimi indeksi, ki jih najdemo v izpisu AMOS, v podoknu 'Modification indices'. Pri tem je pomembno, da to funkcijo vklopimo na zavihku 'Output' pri izpisovanju rezultatov. Raziskovalci si pomagajo z modifikacijskimi indeksi, saj ti precej natančno pokažejo parametre, ki so lahko napačno opredeljeni. Modifikacijski indeksi (MI) kažejo podatke za vse parametre modela in so izračunani kot statistike χ2 z eno prostostno stopnjo (Jöreskog in Sörbom, 1993) in kažejo pričakovan padec χ2, če je določen parameter v modelu prosto ocenjen ali če ga izločimo iz modela. Načeloma vrednosti MI, ki so manjše od 10, kažejo, da prosto določanje posameznega parametra ne bo imelo velikega vpliva na padec χ2 in s tem na izboljšanje ustreznosti modela. Če pogledamo sliko 25, je opaziti, da je v oknu 'Analysis Properties – Output' ta vrednost v programu načeloma nastavljena na 20, kar je prav tako popolnoma ustrezno z vidika zaznavanja pomembnejših napačnih specifikacij modela. 134 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. Modification Indices (Group number 1 – Default model) Covariances: (Group number 1 – Default model) M.I. Par Change e8 <--> SATIS 28,952 ,064 Variances: (Group number 1 – Default model) M.I. Par Change Regression Weights: (Group number 1 – Default model) M.I. Par Change Q10d <--- Q14b 25,173 ,185 Slika 28: Izpis rezultatov v oknu 'Modification Indices' Vir: lasten. Na sliki je prikazan izpis rezultatov v podoknu 'Modification indices'. V razdelku 'Covariances' opazimo, da bi vrednost χ2, če bi povezali rezidual e8 (pri spremenljivki Q10d) z latentno spremenljivko SATIS, padla za 28,95. V razdelku 'Regression Weights' bi v primeru, če bi predvideli vpliv Q14b na Q10d, vrednost χ2 padla. Očitno je, da je spremenljivka Q14d (Čutim, da so moji računi na tem e-bančnem mestu varni) bolj povezana z latentno spremenljivko SATIS (zadovoljstvom) in ne toliko z latentno spremenljivko SECU (varnost). V takšnih primerih lahko spremenljivko izločimo in ponovno naredimo analizo in preverimo globalne indekse ustreznosti. Posebej opozarjamo, da modifikacijski indeksi pogosto pokažejo večje padce χ2, če povežemo reziduale manifestnih spremenljivk. Pri tovrstnem povezovanju moramo biti zelo previdni. Dovoljeno je le takrat, ko imamo za to logično razlago ali teoretično podlago. V takšnih primerih, podobno kot pri raziskovalni faktorski analizi, raje razmislimo o izločanju manifestnih spremenljivk, še posebej takrat, ko ugotovimo, da so MI visoki, če manifestno spremenljivko povežemo z latentno spremenljivko drugega konstrukta, česar v modelu nismo predvideli. V našem primeru smo izločili spremenljivko Q10d in ponovno naredili analizo z izbiro gumba 'Calculate Estimates'. Končni merski model je prikazan na sliki 29, koeficiente pa smo prikazali z izbiro gumba 'View output path diagram' in 'Standardized estimates'. Pregled indeksov ustreznosti je pokazal, da kažejo višjo 7 Modeliranje strukturnih enačb (SEM) 135. globalno ustreznost modela. Razlika v χ2 med obema modeloma je enaka 67,08 pri 13 prostostnih stopnjah (df) razlike, kar kaže statistično značilno razliko med modeloma. Vrednost indeksa GFI se je povečala na 0,945 (prej 0,924), RMR padla na 0,022 (prej 0,26) in RMSEA padla na 0,053 (prej 0,066). Prav tako se je povečala vrednost indeksov NFI (0,966; prej 0,955), TLI (0,979; prej 0,966) in CFI (0,983; prej 0,973). Nedvomno lahko trdimo, da je ta model ustreznejši od predhodnega modela. V našem primeru lahko ocenimo, da ustreznejšega modela ne moremo opredeliti. Postopek lahko ponovimo večkrat in spreminjamo model tako dolgo, dokler ne dosežemo ciljnih vrednosti globalne ustreznosti modela. Slika 29: Končni merski model v programu AMOS Vir: lasten. 136 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. Po specifikaciji sprejemljivega končnega modela analizo nadaljujemo z ocenjevanjem merjenih delov modela. To je ocenjevanje povezav med manifestnimi spremenljivkami (trditvami, vprašanji) in latentnimi spremenljivkami (konstrukti) ter ocenjevanje povezav med konstrukti. Te podatke odčitamo iz podokna 'Estimates'. V prvi tabeli 'Regression Weights' so izpisani nestandardizirani regresijski koeficienti. V našem modelu smo predvideli le vplive latentnih spremenljivk na manifestne spremenljivke, kar so pravzaprav faktorske uteži. Prva tabela je pomembna predvsem, da ocenimo, ali so faktorske uteži statistično značilne, kar kažejo oznake v stolpcu P. Oznaka *** pomeni, da je povezava statistično značilna pri p < 0,001. Za višino faktorskih uteži vedno uporabimo tabelo 'Standardized Regression Weights', kjer so ocene faktorskih uteži in regresijskih koeficientov standardizirane in lahko zajamejo interval med –1 in +1, zato jih je tudi lažje interpretirati. V našem primeru vidimo, da so vse faktorske uteži višje od 0,6. Kot smo razložili že pri raziskovalni faktorski analizi, je ta meja pomembna tudi pri potrjevalni faktorski analizi. Razlika je predvsem ta, tako kot smo predvideli s puščicami, da ocenimo le faktorske uteži tistih manifestnih spremenljivk, kjer smo predvideli vpliv latentne spremenljivke na manifestno, ne pa faktorske uteži za vse latentne spremenljivke. Če ugotovimo, da so faktorske uteži prenizke, lahko znova pristopimo k spremembi modela, torej izločimo manifestno spremenljivko ali z njo povežemo drugo manifestno spremenljivko v modelu. Seveda ne pozabimo, da moramo vedno interpretirati standardizirane faktorske uteži. Naslednji tabeli, 'Covariances' in 'Correlations', prikazujeta povezave med latentnimi spremenljivkami. Tabela 'Covariances' prikazuje kovariance med latentnimi spremenljivkami in statistično značilnost povezav, tabela 'Correlations' pa prav tako korelacije med latentnimi spremenljivkami. Spomnimo, da smo te korelacije predvideli v modelu na sliki 29. Tabela je zelo uporabna za interpretacijo moči povezav med posameznimi latentnimi spremenljivkami. V našem primeru tako opazimo, da sta varnost in zadovoljstvo bolj močno povezana kot stališča in varnost. Korelacije interpretiramo na enak način, kot smo že prikazali, koeficient pa lahko prav tako zajame interval med –1 in +1. V zadnji tabeli 'Variances' so še podatki o varianci latentnih spremenljivk in rezidualov. 7 Modeliranje strukturnih enačb (SEM) 137. Scalar Estimates (Group number 1 – Default model) Maximum Likelihood Estimates Regression Weights: (Group number 1 – Default model) Estimate S.E. C.R. P Label Q4c <--- ATTIT 1,000 Q4a <--- ATTIT 1,000 ,054 18,469 *** Q4b <--- ATTIT ,998 ,054 18,570 *** Q9b <--- CONTA 1,000 Q9a <--- CONTA ,733 ,056 13,203 *** Q9c <--- CONTA ,872 ,057 15,286 *** Q9d <--- CONTA 1,050 ,067 15,780 *** Q10c <--- SECU ,949 ,027 35,744 *** Q10b <--- SECU 1,029 ,021 48,631 *** Q10a <--- SECU 1,000 Q14c <--- SATIS 1,103 ,047 23,454 *** Q14d <--- SATIS ,968 ,054 17,791 *** Q14a <--- SATIS ,904 ,041 22,108 *** Q14b <--- SATIS 1,000 Standardized Regression Weights: (Group number 1 – Default model) Estimate Q4c <--- ATTIT ,871 Q4a <--- ATTIT ,840 Q4b <--- ATTIT ,843 Q9b <--- CONTA ,836 Q9a <--- CONTA ,685 Q9c <--- CONTA ,770 Q9d <--- CONTA ,790 Q10c <--- SECU ,932 Q10b <--- SECU ,990 Q10a <--- SECU ,951 Q14c <--- SATIS ,897 Q14d <--- SATIS ,773 Q14a <--- SATIS ,870 Q14b <--- SATIS ,885 Covariances: (Group number 1 – Default model) Estimate S.E. C.R. P Label ATTIT <--> CONTA ,218 ,030 7,171 *** ATTIT <--> SECU ,225 ,030 7,532 *** ATTIT <--> SATIS ,219 ,027 8,196 *** CONTA <--> SECU ,364 ,041 8,921 *** CONTA <--> SATIS ,293 ,035 8,452 *** SECU <--> SATIS ,339 ,035 9,638 *** 138 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. Correlations: (Group number 1 – Default model) Estimate ATTIT <--> CONTA ,517 ATTIT <--> SECU ,503 ATTIT <--> SATIS ,591 CONTA <--> SECU ,655 CONTA <--> SATIS ,636 SECU <--> SATIS ,695 Variances: (Group number 1 – Default model) Estimate S.E. C.R. P L abel ATTIT ,339 ,035 9,591 *** CONTA ,523 ,059 8,935 *** SECU ,590 ,050 11,696 *** SATIS ,404 ,040 10,150 *** e1 ,348 ,035 9,866 *** e2 ,274 ,027 10,257 *** e3 ,318 ,028 11,326 *** e4 ,226 ,026 8,666 *** e5 ,063 ,006 9,656 *** e6 ,012 ,005 2,702 ,007 e7 ,080 ,007 10,898 *** e9 ,137 ,015 8,900 *** e10 ,142 ,016 9,029 *** e11 ,108 ,014 7,822 *** e12 ,111 ,012 9,325 *** e13 ,106 ,011 9,854 *** e14 ,256 ,022 11,492 *** e15 ,120 ,014 8,863 *** Slika 30: Izpis rezultatov v oknu 'Estimates' za merski model Vir: lasten. Standardizirane faktorske uteži in korelacije lahko prikažemo tudi v grafičnem prikazu, in sicer tako, da izberemo ikono 'View the output path diagram', v četrtem oknu pa določimo, ali želimo standardizirano ali nestandardizirano rešitev. 7.13.2 Preverjanje zanesljivosti in veljavnosti konstruktov v merskem modelu Naj na začetku poudarimo, da program AMOS zaenkrat ne omogoča neposrednega izračuna koeficientov, ki jih bomo uporabljali za preverjanje zanesljivosti in veljavnosti konstruktov. Te si lahko raziskovalec izračuna sam, in sicer po enačbah in virih, ki smo jih podali in podrobneje opisali v poglavju 7.10, ali pa uporabi 7 Modeliranje strukturnih enačb (SEM) 139. nekatere odprtokodne dodatke, ki so jih razvili neodvisni razvijalci. V našem primeru smo tako uporabili vtičnik za preverjanje veljavnosti s spletne strani: http://statwiki.gaskination.com/index.php?title=Main_Page. Na osnovi razlag, ki smo jih zapisali v poglavju 7.10.1 in 7.10.2, lahko preverimo zanesljivost in konvergentno veljavnost lestvice. Vrednosti zanesljivosti kompozita (CR) in povprečja izločenih varianc (AVE), ki so prikazane v drugem in tretjem stolpcu tabele X, kažejo ustrezno zanesljivost merjenih konstruktov. Kot lahko opazimo, so vse vrednosti CR večje od predpisane meje 0,6, prav tako pa so vse vrednosti AVE večje od 0,5. Konvergentno veljavnost potrjujemo, kot smo opisali s pomočjo globalnih indeksov modela, za katere smo že ugotovili, da so v priporočljivih intervalih. Prav tako na osnovi slike 30 ugotovimo, da so faktorske uteži večje od 0,6 in statistično značilne, kar pomeni, da vse latentne spremenljivke ustrezno odražajo manifestne spremenljivke in so z njimi tudi ustrezno močno povezane. V skladu s tem lahko potrdimo tudi konvergentno veljavnost lestvice. Tabela 16: Izračunani koeficienti zanesljivosti kompozita (CR), povprečje izločenih varianc (AVE), kvadrati AVE in korelacije med latentnimi spremenljivkami CR AVE ATTIT CONTA SECU SATIS ATTIT 0,888 0,725 0,851 CONTA 0,855 0,596 0,517*** 0,772 SECU 0,971 0,918 0,503*** 0,655*** 0,958 SATIS 0,917 0,735 0,591*** 0,636*** 0,695*** 0,858 Odebeljene vrednosti prikazujejo korene koeficienta AVE. Ležeče vrednosti prikazujejo korelacije med latentnimi spremenljivkami *** – p < .001 S primerom bomo prikazali načina preverjanja diskriminantne veljavnosti, ki sta v znanstveni literaturi tudi največkrat uporabljena, in sicer Fornell-Larckerjev (1981) test in metodo, ki so jo razvili Henseler et al. (2015). V tabeli 16 so prikazani podatki, s katerimi si pomagamo pri preverjanju diskriminantne veljavnosti. Fornell-Larckerjev test izvedemo tako, da preverimo, ali so vrednosti korena povprečij izločenih varianc (AVE) za pare latentnih spremenljivki, za kateri preverjamo diskriminantno veljavnost, višje od korelacij med istima latentnima spremenljivkama. Če primerjamo odebeljene vrednosti v tabeli 16, opazimo, da so 140 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. vse višje od korelacij med latentnimi spremenljivkami, kar pomeni, da lahko potrdimo diskriminantno veljavnost lestvice. Tabela 17: Razmerje korelacij med in znotraj konstruktov (matrika HTMT) ATTIT CONTA SECU ATTIT CONTA 0,525 SECU 0,518 0,661 SATIS 0,599 0,654 0,701 Kot smo zapisali v poglavju 7.10.3, še bolj restriktivni test diskriminantne veljavnosti lahko izvedemo s pomočjo matrike razmerja korelacij med in znotraj konstrukti oziroma tako imenovane matrike HTMT. Razmerje korelacij med vsemi pari latentnih spremenljivk mora biti manjše od 0,85, saj v tem primeru lahko trdimo, da je razmerje povprečja korelacij med manifestnimi spremenljivkami različnih konstruktov v primerjavi s povprečjem korelacij med manifestnimi spremenljivkami istega konstrukta ustrezno. V našem primeru opazimo, da so vse vrednosti v tabeli nižje od priporočene mere, zato lahko tudi na podlagi tovrstnega testa potrdimo diskriminantno veljavnost merilne lestvice. 7.14 Analiza strukturnega modela Kot smo zapisali v poglavju 7.11, v strukturnem modelu ne predpostavljamo več proste korelacije med vsemi latentnimi spremenljivkami, temveč preverjamo vplive neodvisnih latentnih spremenljivk na odvisne. V našem primeru smo na osnovi pregleda literature najprej postavili tri hipoteze. V njih domnevamo naslednje: − H1: Možnost stika ima pozitiven vpliv na zadovoljstvo z e-bančnimi storitvami. − H2: Varnost ima pozitiven vpliv na zadovoljstvo z e-bančnimi storitvami. − H3: Stališča do e-bančnih storitev imajo pozitiven vpliv na zadovoljstvo z e-bančnimi storitvami. Na osnovi zapisanih hipotez smo strukturni model oblikovali tako, da smo potegnili puščice od možnosti stika, varnosti in stališč do zadovoljstva z e-bančnimi storitvami. To v programu AMOS naredimo tako, da izberemo gumb 'Draw paths' 7 Modeliranje strukturnih enačb (SEM) 141. in potegnemo puščico od neodvisnih v smeri proti odvisnim spremenljivkam. Pri tem je pomembno, da med eksogenimi spremenljivkami v modelu predvidimo povezave. Ne pozabimo, da so eksogene spremenljivke tiste, na katere ne vpliva nobena druga latentna spremenljivka. Podobno, kot smo opisali za merski model, povezave narišemo s pomočjo gumba 'Draw covariances'. Ker latentnih spremenljivk v modelu, ki so odvisne, torej vseh tistih, do katerih smo potegnili puščice, nikoli ne moremo v celoti razložiti, moramo tem spremenljivkam dodati še reziduale. Dodamo jih z gumbom 'Add unique variable to an existing variable' in jih poimenujemo. Izberemo še okno 'Analysis properties', kjer označimo 'Squared Multiple Correlations'. Če želimo izvesti še analizo posrednih vplivov, izberemo še 'Indirect, Direct & Total Effects'. V našem primeru nimamo predvidenih neposrednih vplivov med spremenljivkami, zato tega polja nismo označili. Analizo znova zaženemo z gumbom 'Calculate estimates', rezultate pa preverimo z izbiro gumba 'Analysis properties', ki prikaže izpise v oknu 'Amos Output'. Slika 31: Strukturni model v programu AMOS Vir: lasten. Na sliki 31 prikazujemo strukturni model. V grafičnem prikazu rezultate na sliki prikažemo z izbiro gumba 'View the output path diagram' in v tretjem oknu označimo 'Standardized estimates'. Enako kot pri merskem modelu za interpretacijo uporabljamo standardizirane regresijske koeficiente. Rezultate z izbiro gumba 'View text' preverimo tudi v oknu 'Amos Output'. 142 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. Analizo znova začnemo v podoknu 'Estimates'. Iz tega razberemo, da je vrednost indeksa GFI 0,945, RMR 0,022 in RMSEA 0,053. Vrednost NFI = 0,966, TLI = 0,979 in CFI = 0,983. Del izpisa je prikazan na sliki 32. Preverimo še podokno 'Modification indices', ki lahko pokaže morebitne MI med latentnimi spremenljivkami. Ti so posebej koristni takrat, ko lahko dodan vpliv med latentnima spremenljivkama, ki ga v modelu nismo predvideli, izboljša ustreznost modela. Model Fit Summary CMIN Model NPAR CMIN DF P CMIN/DF Default model 34 138,105 71 ,000 1,945 Saturated model 105 ,000 0 Independence model 14 4119,787 91 ,000 45,272 RMR, GFI Model RMR GFI AGFI PGFI Default model ,022 ,945 ,919 ,639 Saturated model ,000 1,000 Independence model ,292 ,221 ,102 ,192 Baseline Comparisons Model NFI RFI IFI TLI CFI Delta1 rho1 Delta2 rho2 Default model ,966 ,957 ,983 ,979 ,983 Saturated model 1,000 1,000 1,000 Independence model ,000 ,000 ,000 ,000 ,000 RMSEA Model RMSEA LO 90 HI 90 PCLOSE Default model ,053 ,040 ,066 ,330 Independence model ,364 ,355 ,374 ,000 Slika 32: Del izpisa iz podokna 'Model fit' za strukturni model Vir: lasten. Nadaljujemo še z analizo vplivov med latentnimi spremenljivkami. Te najdemo v podoknu 'Estimatest'. V izpisu na sliki 33 opazimo, da imamo za strukturni model v prvih treh vrsticah tabele 'Regression Weights' in 'Standardized Regression Weights' izpisane vplive, ki smo jih predvideli za tri latentne spremenljivke. Interpretacija tabel je podobna, kot smo jo opisali pri merskem modelu. Iz prve tabele na sliki 33, kjer 7 Modeliranje strukturnih enačb (SEM) 143. so izpisani nestandardizirani regresijski koeficienti, razberemo, da so vsi vplivi med latentnimi spremenljivkami statistično značilni pri p < 0,001. Ključna za interpretacijo rezultatov je tabela 'Standardized reression weights'. Vpliv možnosti stika na zadovoljstvo je pozitiven, regresijski koeficient pa je enak 0,229. Oba vpliva varnosti in stališč do e-bančnih storitev sta prav tako pozitivna, in sicer varnosti 0,411, stališč pa 0,256. V skladu s tem rezultatom lahko potrdimo vse tri hipoteze. V tabeli 'Correlations' so znova prikazani korelacijski koeficienti med eksogenimi spremenljivkami, ki smo jih predvideli v modelu, v tabeli 'Variances' pa variance vseh neodvisnih latentnih spremenljivk in manifestnih spremenljivk. Estimates (Group number 1 – Default model) Scalar Estimates (Group number 1 – Default model) Maximum Likelihood Estimates Regression Weights: (Group number 1 – Default model) Estimate S.E. C.R. P Label SATIS <--- CONTA ,202 ,056 3,627 *** SATIS <--- SECURE ,341 ,048 7,051 *** SATIS <--- ATTIT ,290 ,058 4,996 *** Q4c <--- ATTIT 1,000 Q4a <--- ATTIT 1,000 ,054 18,469 *** Q4b <--- ATTIT ,998 ,054 18,570 *** Q9b <--- CONTA 1,000 Q9a <--- CONTA ,733 ,056 13,203 *** Q9c <--- CONTA ,872 ,057 15,286 *** Q9d <--- CONTA 1,050 ,067 15,780 *** Q10c <--- SECURE ,949 ,027 35,744 *** Q10b <--- SECURE 1,029 ,021 48,631 *** Q10a <--- SECURE 1,000 Q14c <--- SATIS 1,103 ,047 23,454 *** Q14d <--- SATIS ,968 ,054 17,791 *** Q14a <--- SATIS ,904 ,041 22,108 *** Q14b <--- SATIS 1,000 Standardized Regression Weights: (Group number 1 – Default model) Estimate SATIS <--- CONTA ,229 SATIS <--- SECURE ,411 SATIS <--- ATTIT ,265 Q4c <--- ATTIT ,871 Q4a <--- ATTIT ,840 Q4b <--- ATTIT ,843 Q9b <--- CONTA ,836 Q9a <--- CONTA ,685 Q9c <--- CONTA ,770 144 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. Estimate Q9d <--- CONTA ,790 Q10c <--- SECURE ,932 Q10b <--- SECURE ,990 Q10a <--- SECURE ,951 Q14c <--- SATIS ,897 Q14d <--- SATIS ,773 Q14a <--- SATIS ,870 Q14b <--- SATIS ,885 Covariances: (Group number 1 – Default model) Estimate S.E. C.R. P Label CONTA <--> SECURE ,364 ,041 8,921 *** ATTIT <--> SECURE ,225 ,030 7,532 *** ATTIT <--> CONTA ,218 ,030 7,171 *** Correlations: (Group number 1 – Default model) Estimate CONTA <--> SECURE ,655 ATTIT <--> SECURE ,503 ATTIT <--> CONTA ,517 Variances: (Group number 1 – Default model) Estimate S.E. C.R. P Label ATTIT ,339 ,035 9,591 *** CONTA ,523 ,059 8,935 *** SECURE ,590 ,050 11,696 *** f1 ,166 ,018 9,098 *** e1 ,108 ,014 7,822 *** e2 ,142 ,016 9,029 *** e3 ,137 ,015 8,900 *** e4 ,226 ,026 8,666 *** e5 ,318 ,028 11,326 *** e6 ,274 ,027 10,257 *** e7 ,348 ,035 9,866 *** e8 ,080 ,007 10,898 *** e9 ,012 ,005 2,702 ,007 e10 ,063 ,006 9,656 *** e11 ,120 ,014 8,863 *** e12 ,256 ,022 11,492 *** e13 ,106 ,011 9,854 *** e14 ,111 ,012 9,325 *** 7 Modeliranje strukturnih enačb (SEM) 145. Squared Multiple Correlations: (Group number 1 – Default model) Estimate SATIS ,589 Q14b ,784 Q14a ,757 Q14d ,597 Q14c ,804 Q10a ,904 Q10b ,981 Q10c ,869 Q9d ,624 Q9c ,593 Q9a ,469 Q9b ,698 Q4b ,711 Q4a ,705 Q4c ,758 Slika 33: Izpis rezultatov v oknu 'Estimates' za strukturni model Vir: lasten. Pomembna je še tabela 'Squared multiple correlations', ki prikazuje delež variance odvisne spremenljivke. Le-to lahko razložimo z neodvisnimi spremenljivkami. V našem primeru je koeficient enak 0,589, kar pomeni, da lahko z varianco neodvisnih spremenljivk ATTIT, CONTA in SECURE razložimo 58,9% variance odvisne spremenljivke SATIS. 146 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU B. Milfelner Literatura Aaker, D. A. (1988). Strategic Marketing Management (2nd ed.). New York: John Wiley and Sons. Aaker, D. A., Kumar, V., & Day, G. S. (2001). Essentials of Marketing Research. New York: John Wiley & Sons. Artenjak, J. (1997). Poslovna statistika. Maribor: Ekonomsko-poslovna fakulteta. Bagozzi, R. P., & Yi, Y. (2012). Specification, evaluation, and interpretation of structural equation models. Journal of the Academy of Marketing Science 40(1), 8–34. Baker, M. J., Black, S. D., & Hart, S. J. (1994). Competitive success in sunrise and sunset industries. V. J. Sunders (ur.), The Marketing Initiative. London: Prentice Hal . Barksdale, H. C., & Darden, B. (1971). Marketers' attitude toward the marketing concept. Journal of Marketing, 35(Oct), 29–36. Barney, J. B. (1986). Types of competition and the theory of strategy: toward an integrative framework. Academy of Management Review, 11(4), 791–800. Baumgartner, H., & Homburg, C. (1996). Applications of Structural Equation Modeling in Marketing Consumer Research. A Review. International Journal of Research Marketing. 13: 139–161. Bollen, K. A. (1989). Structural equations with latent variables. New York: John Wiley & Sons. Bol en, K. A., & Stine, R. A. (1993). Bootstrapping goodness-of-fit measures in structural equation models. V K. A. Bol en & J. S. Long (ur.), Testing structural equation models (pp. 111–135). Newbury Park, CA: Sage. Breivik, E., & Olsson, U. H. (2001). Adding variables to improve fit: The effect of model size on fitassessment in LISREL. V R. Cudeck, S. Du Toit, & D. Sörbom (UR.), Structural equation modeling: Present and future. A Festschrift in honor of Karl Jöreskog (pp. 169–194). Lincolnwood, IL: Scientific Software International. Burns, A. C., & Veeck, A. (2017). Marketing research. Harlow: Pearson. Byrne, B. M. (1994). Structural equation modeling with EQS and EQS/Windows: Basic concepts, applications, and programming. Thousand Oaks, CA: Sage. Byrne, B. M. (2016). Structural Equation Modeling with Amos. Basic Concepts, Applications, and Programming. New York: Routledge. Byrne, B. M. (1995). One Application of Structural Equation Modeling for Two Perspectives: Exploring the EQS and LISREL Strategies. V R. H. Hoylev (ur.), Structural Equation Modeling: Concepts, Issues and Applications (ed.). Thousand oaks: Sage Publications. Cheng, E. W. L. (2001). SEM Being More Effective than Multiple Regression in Parsimonious Model testing for Management development Research. Journal of Management Development. 20(7): 650– 667. Churchill, G. A. (1999). Marketing Research: Methodological Foundations. Orlando: The Dryden Press. Cortina, J. M. (1993). What is coefficient alpha? An examination of theory and applications. Journal of Applied Psychology, 78(1), 98–104. Cramer, D. (2000). Fundamental statistics for social research: step-by-step calculations and computer techniques using SPSS for Windows. London: Routledge. Day, G. S., & Wensley, R. (1983). Marketing theory with a strategic orientation. Journal of Marketing, 47(Fall), 79–89. Deng, S., & Dart, J. (1994). Measuring market orientation: a multi-factor, multi-item approach. Journal of Marketing Management, 10, 725–742. 148 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. Deshpande, R., & Kohli, A. K. (1989). Knowledge disavowal: Structural determinants of information processing breakdown in organizations, Knowledge, 11(2), 155–169. Deshpande, R., & Webster, Jr. F. E. Jr. (1989). Organizational culture and marketing: Defining the research agenda. Journal of Marketing, (Jan), 3–15. Diamantopoulos, A., & Hart, S. (1993). Linking market orientation and company performance: preliminary evidence on Kohli and Jaworski’s framework. Journal of Strategic Marketing, 1, 93– 121. Diamantopoulos, A., & Siguaw, J. A. (2000). Introducing Lisrel. Thousand Oaks: Sage Publications. Diamantopoulos, A., & Winklhofer, H. M. (2001). Index construction with formative indicators: An alternative to scale development. Journal of marketing research, 38(2), 269–277. Diamantopoulos, A., & Siguaw, J. A. (2000). Introducing Lisrel. Thousand Oaks: Sage Publications. Drucker, P. (1954). The practice of Management. New York: Harper and Row Publishers. Dwyer, L., Edwards, D., Mistilis, N., Roman, C., & Scott, N. (2009). Destination and enterprise management for a tourism future. Tourism Management, 30(1), 63–74. Flora, D. B., & Curran, P. J. (2004). An empirical evaluation of alternative methods of estimation for confirmatory factor analysis with ordinal data. Psychological methods, 9(4), 466. Fornell, C., & Larcker, D. F. (1981). Evaluating structural equation models with unobservable variables and measurement error. Journal of Marketing Research, 18, 39–50. Fornell, C., & Larcker, D. F. (1981). Structural Equation Models with Unobservable variables and Measurement Error. Journal of Marketing Research 18(1): 39–50. Gabrijan, V., Milfelner, B., Snoj, B., & Gaber, B. (2005). Vpliv marketinških virov na delovanje organizacij. Naše gospodarstvo, 51(5/6), 92–103. Gerbing, D. W., & Anderson, C. J. (1988). An updated paradigm for scale development incorporating unidimensionality and its assessment. Journal of Marketing Research, 25, 186–192. Grapentine, T. (2015). How to think about constructs in marketing research. Pridobljeno na: https://www.quirks.com/articles/how-to-think-about-constructs-in-marketing-research. Gray, B., Matear, S., Boshoff, C., & Matheson, P. (1998). Developing a better measure of market orientation. European Journal of Marketing, 32(9/10), 884–903. Gujarathi, D. M. (1995). Basic Econometrics. New York: McGraw-Hill. Hair Jr, J. F., Matthews, L. M., Matthews, R. L., & Sarstedt, M. (2017). PLS-SEM or CB-SEM: updated guidelines on which method to use. International Journal of Multivariate Data Analysis, 1(2), 107–123. Hair, J. F., Black, W. C., Babin, B. J., & Anderson, R. E. (2014). Multivariate data analysis. Harlow. UK: Pearson Education Limited. Hair, J. F., Black, W. C., Babin, B. J., Anderson, R. E., & Tatham, R. L. (2012). Multivariate data analysis. London: Pearson. Hair, J. F., Anderson, R. E., Tatham, R. L., & Black, W. C. (1998). Multivariate Data Analysis, 5th ed. New Jersey: Prentice Hal . Hair, J. F., Sarstedt, M., Ringle, C. M., & Mena, J. A. (2012). An assessment of the use of partial least squares structural equation modeling in marketing research, Journal of the Academy of Marketing Science 40(3), pp. 414–433. Hair, J. F., Hult, G. T. M., Ringle, C. M., & Sarstedt, M. A. (2016). Primer on Partial Least Squares Structural Equation Modeling (PLS-SEM), Thousand Oaks: Sage. Hair, Joseph F. (2009). Multivariate Data Analysis: A Global Perspective. Upper Saddle River: Prentice Hall. Hall, W. K. (1980). Survival strategies in the hostile environment. Harvard Business Review 58(5), 75–85. Han, J. K., Kim, N., & Srivastava, R. K. (1998). Market orientation and organizational performance: is innovation a missing link? Journal of marketing 62(4), 30–45. Henseler, J., Ringle, C. M., & Sarstedt, M. (2015). A new criterion for assessing discriminant validity in variance-based structural equation modeling. Journal of the academy of marketing science, 43(1), 115–135. Henseler, J., Ringle, C. M., & Sinkovics, R. R. (2009). The use of partial least squares path modeling in international marketing. Advances in International Marketing, 20, 277–319. Literatura 149. Homburg, C., & Pflesser, C. (2000). A multiple-layer model of market oriented organizational culture: measurement issues and performance outcomes. Journal of Marketing Research, 37(Nov), 449– 462. Hunt, S. D., & Morgan, R. M. (1995). The competitive advantage theory of competition. Journal of Marketing, 59(2), 1–15. Iacobucci, D. (2010). Structural equations modeling: Fit indices, sample size, and advanced topics. Journal of consumer psychology, 20(1), 90–98. Ittner, D., & Larcker, D. F. (1997). Product Development cycle Time and Organizational Performance, Journal of Marketing Research 34(Feb), 13–23. Jaccard, J., & Jacoby, J. (2009). Theory construction and model-building skil s: A practical guide for social scientists. Guilford Press. Janssens, W., De Pelsmacker, P., Wijnen, K., & Van Kenhove, P. (2008). Marketing research with SPSS. Prentice-Hall: Pearson Education. Jöreskog, K. G. (1969). A general approach to confirmatory maximum likelihood factor analysis. Psychometrika, 34, 182–302. Jöreskog, K. G. (1993). Testing structural equation models. V K. A. Bol en & J. S. Long (ur.), Testing structural equation models (pp. 294–316). Newbury Park, CA: Sage. Jöreskog, K. G., & Sörbom, D. (1989). LISREL 7: A Guide to Program and Application. Chicago: SPSS Inc. Jöreskog, K. G., & Sörbom, D. (1996). Lisrel 8: User’s Reference Guide. Chicago: Scientific Software International. Kaplan, D. (2000). Structural Equation Modeling. Fundations and Extensions. London: Sage Publications. Keesling, J. W. (1972). Maximum likelihood approaches to causal flow analysis. Unpublished doctoral dissertation. Chicago: University of Chicago. Kelloway, E. K. (1998). Using Lisrel for Structural Equation Modeling: A Researcher’s Guide. Thousand Oaks: Sage Publications. Kenny, D. A. (1979). Correlation and causality. New York: Wiley. Kline, R. B. (2015). Principles and practice of structural equation modeling. New York: The Guilford Press. Kline, R. B. (2016). Principles and practice of structural equation modeling. New York: Guilford publications. Kohli, A. K., & Jaworski, B. J. (1990). Market orientation: the construct, research propositions, and managerial implications, Journal of Marketing, 54(2), 1–18. Kumar, V. Aaker, D. A., & Day, G. S. (1999). Essentials of Marketing Research. New York: Wiley. Laroche, M., & Sadokierski, R. (1994). Role of Confidence in a Multi-Brand Model of Intensions for a High-Involvement Service. Journal of Business Research, 29(Jan), 1–12. Lehmann, D. R. (1988). An alternative procedure for assessing convergent and discriminant validity. Applied Psychological Measurement, 12(4), 411–423. Levitt, T. (1960). Marketing myopia. Harvard Business Review, 48(4), 45–56. Levitt, T. (1980). Marketing success through differentiation of anything. Harvard Business Review, 58(Jan), 83–91. Long, J. S. (1983). Covariance Structure Models: An Introduction to Lisrel. Beverly Hills: Sage Publication. Malhotra, N., & Birks, D. (2017). Marketing Research: an applied approach: Fifth edition. Harlow: Pearson education. Malhotra, N., Nunan, D., & Birks, D. (2017). Marketing research: An applied approach. Pearson. Malhotra, N. K., & Birks, D. F. (2003). Marketing Research: An Applied Approach. New York: Prentice Hall. Maruyama, G. M. (1998). Basics of Structural Equation Modeling. Thousand Oaks: Sage Publicatons. McIntyre, S. H., Montgomery, D. B., Srinivasan, V., & Weitz, B. A. (1983). Evaluating the Statistical Significance of Models Developed by Stepwise Regression. Journal of Marketing Research 20(Feb), 1–11. Myers, H. J., & Mul et, G. M. (2003). Managerial Applications of Multivariate Analysis in Marketing. Chicago: American Marketing Association. 150 TEHNIKE ZA ZAGOTAVLJANJE VELJAVNOSTI IN ZANESLJIVOSTI PODATKOV V. MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU. Narver, J. C., & Slater S. F. (1990). The Effect of a Market Orientation on Business Performance. Journal of Marketing, 54, 20–35. Narver, J. C., Slater S. F., & MacLachlan, D. L. (2004). Responsive and proactive market orientation and new-product success. Journal of Product Innovation Managament, 21, 334–347. Ozkaya, H. E., Droge, C., Hult, G. T. M., Calantone, R., & Ozkaya, E. (2015). Market orientation, knowledge competence, and innovation. International Journal of Research in Marketing 32(3), 309– 318. Porter, M. E. (1985). Competitive Advantage: Creating and Sustaining Superior Performance. New York: The Free Press. Zaltman, B. S. (1974). Broadening the concept of consumer behavior. ACR North American Advances 1, 488–496. Radonjič, D., & Iršič, M. (2006). Raziskava marketinga. Ljubljana: GV Založba. Rust, R., & Schmittlein, D. (1985). A Bayesian Cross-Validated Likelihood Method for Comparing Alternative Specifications of Quantitative Models. Marketing Science. 4: 20–40. Sarstedt, M., & Mooi, E. (2014 ). A Concise Guide to Market Research. The Process, Data, and Methods Using IBM SPSS Statistics. Berlin Heidelberg: Springer-Verlag. Savalei, V. (2014). Understanding robust corrections in structural equation modeling. Structural Equation Modeling, 21, 149–160. Saxe, R., & Weitz, B. A. (1982). The SOCO scale: A measure of customer orientation of salespeople. Journal of Marketing Research, 19(Aug.), 343–351. Schumacker, E., & Lomax, G. (2016). A Beginner’s Guide to Structural Equation Model ing. New York, Routhledge. Schumacker, R. E., & Lomax, R. G. (2004). A beginner's guide to structural equation modeling. Mahwah: Lawrence Erlbaum Associates, Publishers. Shukla, P. (2008). Essentials of marketing research. Bookboon. Sloan, P., Legrand, W., & Chen, J. S. (2009), Sustainability in the Hospitality Industry: Principle of Sustainable Operation. Oxford: Butterworth-Heinemann. Solomon, M. R., Marshal , G. W., & Stuart, E. W. (2012). Marketing: Real People. Real Choices. Boston: Prentice Hall. Srivastava, M. S. (2002). Methods of Multivariate Statistics. New York: Wiley-Interscience. Sweeney, J. C., Soutar G. N., & Johnson, L. W. (1999). The Role of Perceived Risk in the Quality-Value Relationship: A Study in a Retail Environment. Journal of Retailing. 75(1): 77–-105. Teo, T. S. H., Srivastava, S. C., & Jiang, L. (2008). Trust and electronic government success: a nempirical study. Journal of Management Information Systems, 25(3), 99–132. Thakkar, J. J. (2020). Structural equation modelling. Application for Research and Practice (with AMOS and R). Singapore: Springer. Udo-Akang, D. (2012). Theoretical constructs, concepts, and applications. American International Journal of Contemporary Research, 2(9), 89–97. Wacker, J. (1998). A definition of theory: Research guidelines for different theory-building research methods in operations management. Journal of Operations Management, 16(4), 361–385. Weaver, D. B., & Lawton, L. J. (2007). Twenty years on: The state of contemporary ecotourism research. Tourism management, 28(5), 1168–1179. Wiley, D. E. (1973). The identification problem for structural equation models with unmeasured variables. V A. S. Duncan (ur.), Structural equation models in the social sciences (pp. 69–83). New York: Seminar. Yang-Wal entin, F., Jöreskog, K. G., & Luo, H. (2010). Confirmatory factor analysis of ordinal variables with misspecified models. Structural Equation Modeling, 17(3), 392–423. Zaltman, G., Pinson, C. R. A., & Angelmar, R. (1973), Metatheory and Consumer Research. Holt, Rinehart and Winston, New York, p. 22. Zikmund, W. G. (1999). Essentials of Marketing Research. Fort Worth: The Dryden Press. TEHNIKE ZA ZAGOTAVLJANJE DOI https://doi.org/ 10.18690/um.epf.9.2023 VELJAVNOSTI IN ZANESLJIVOSTI ISBN 978-961-286-785-0 PODATKOV V MARKETINŠKIH RAZISKAVAH IN ANALIZA PODATKOV V MARKETINGU BORUT MILFELNER Univerza v Mariboru, Ekonomsko-poslovna fakulteta, Maribor, Slovenija borut.milfelner@um.si Znanstvena monografija »Tehnike za zagotavljanje veljavnosti in Ključne besede: veljavnost merjenja, zanesljivosti podatkov v marketinških raziskavah in analiza zanesljivost merjenja, podatkov v marketingu« se osredotoča na zbiranje informacij za faktorska analiza, analiza podatkov v marketinške namene v organizacijah in zagovarja znanstveni marketingu, pristop pri merjenju marketinških konceptov. Utemeljuje modeliranje strukturnih enačb znanstvene principe kvantitativnega merjenja v marketingu za zagotavljanje natančnih in zanesljivih podatkov ter metode za analizo podatkov v marketingu. Obravnavane so tudi napredne tehnike analiziranja podatkov, kot so modeliranje strukturnih enačb, s katerimi merimo vplive latentnih spremenljivk, ki lahko so v vlogi odvisne, kot tudi neodvisne spremenljivke. Monografija vsebuje sedem poglavij, ki obsegajo razumevanje informacijskega sistema v marketingu, tržne naravnanosti, teorije merjenja v marketingu, veljavnosti in zanesljivosti merilnih lestvic, metode za preverjanje povezav med parametričnimi in neparametričnimi spremenljivkami ter modeliranje strukturnih enačb. DOI https://doi.org/ METHODS FOR ENSURING THE 10.18690/um.epf.9.2023 ISBN VALIDITY AND RELIABILITY OF 978-961-286-785-0 DATA IN MARKETING RESEARCH AND MARKETING DATA ANALITICS BORUT MILFELNER University of Maribor, Faculty of Economics and Business, Maribor, Slovenia borut.milfelner@um.si Keywords: The scientific monograph »Methods for ensuring the validity and measurement validity, measurement reliability, reliability of data in marketing research and marketing data factor analysis, analitics« focuses on the collection of data for marketing purposes marketing data analitics, structural equation in organisations and advocates a scientific approach to the modeling measurement of marketing concepts. It justifies the scientific principles of quantitative measurement in marketing to ensure accurate and reliable data and methods for data analysis in marketing. Advanced data analysis techniques such as structural equation model ing, which measure the effects of latent variables that can act as dependent as wel as independent variables, are also discussed. The monograph contains seven chapters covering understanding the marketing information system, market orientation, measurement theory in marketing, validity and reliability of measurement scales, methods for testing relationships between parametric and non-parametric variables, and structural equation modelling. Document Outline Predgovor 1 Marketinški informacijski sistem 1.1 Informacije 1.2 Sestavine marketinškega informacijskega sistema 1.2.1 Notranje informacije 1.2.2 Marketinško obveščanje 1.2.3 Raziskovanje v marketingu0F 1.2.4 Pridobljene baze podatkov 2 Tržna naravnanost 2.1 Pomen tržne naravnanosti za pridobivanje podatkov v marketingu 2.2 Koncept marketinga 2.3 Opredelitev tržne naravnanosti 2.3.1 Tržna naravnanost kot aktivnost oziroma proces 2.3.2 Tržna naravnanost kot sestavina organizacijske kulture 2.4 Podobnosti in razlike med opredelitvami tržne naravnanosti 3 Teorija merjenja v marketingu 3.1 Koncepti 3.2 Osnove kvantitativnega merjenja v marketingu 3.3 Osnovne vrste merilnih lestvic 3.3.1 Nominalna lestvica 3.3.2 Vrstna (ordinalna) lestvica 3.3.3 Intervalna lestvica 3.3.4 Razmernostna (proporcionalna) lestvica 3.4 Merski modeli z latentnimi in manifestnimi spremenljivkami 4 Veljavnost in zanesljivost merilnih lestvic 4.1 Proces razvoja merilne lestvice 4.2 Natančnost merjenja 4.2.1 Veljavnost merjenja 4.2.2 Zanesljivost merjenja 5 Preverjanje veljavnosti in zanesljivosti lestvice 5.1 Raziskovalna faktorska analiza in preverjanje veljavnosti merilne lestvice 5.2 Faktorski model 5.3 Potek faktorske analize pri preverjanju veljavnosti merilne lestvice 5.3.1 Priprava niza vprašanj 5.3.2 Zbiranje podatkov na preizkusnem ali reprezentativnem (končnem) vzorcu 5.3.3 Metoda ekstrakcije faktorjev 5.3.4 Izvedba faktorske analize 5.3.5 Interpretacija faktorske rešitve 5.3.6 Zmanjševanje števila spremenljivk 5.3.7 Poimenovanje faktorjev 5.3.8 Ocenjevanje veljavnosti konstrukta lestvice 5.4 Preverjanje zanesljivosti merilne lestvice 6 Klasične metode za preverjanje povezav med spremenljivkami in konstrukti 6.1 Najpogostejši neparametrični za merjenje povezav 6.1.1 Koeficient φ 6.1.2 Kontingenčni koeficient 6.1.3 Cramerjev V 6.2 Najpogostejši parametrični testi za merjenje povezav 6.2.1 Korelacijska analiza 6.2.2 Regresijska analiza 7 Modeliranje strukturnih enačb (SEM) 7.1 Osnovne značilnosti modeliranja strukturnih enačb 7.2 Razlika med modeliranjem strukturnih enačb in multivariatno regresijsko analizo 7.3 Razlogi za uporabo metode modeliranja strukturnih enačb 7.4 Vrste modeliranja strukturnih enačb 7.5 Zaporedje korakov pri izvajanju modeliranja strukturnih enačb 7.6 Oblikovanje konceptualnega modela 7.7 Zbiranje podatkov 7.8 Identifikacija modela 7.9 Ocenjevanje parametrov modela 7.10 Ocenjevanje ustreznosti modela 7.10.1 Ocenjevanje celotne (globalne) ustreznosti modela 7.10.2 Ocenjevanje merjenih delov modela 7.11 Preverjanje zanesljivosti in veljavnosti 7.11.1 Preverjanje zanesljivosti 7.11.2 Preverjanje konvergentne veljavnosti 7.11.3 Preverjanje diskriminantne veljavnosti 7.12 Ocenjevanje strukturnega modela 7.13 Primer modeliranja strukturnih enačb v programu IBM AMOS SPSS 7.13.1 Analiza merskega modela 7.13.2 Preverjanje zanesljivosti in veljavnosti konstruktov v merskem modelu 7.14 Analiza strukturnega modela Literatura