POSLOVNA STATISTIKA Avtorici Polona Tominc Maja Rožman Maj 2023 Naslov Poslovna statistika Title Business Statistics Avtorici Polona Tominc Authors (Univerza v Mariboru, Ekonomsko-poslovna fakulteta) Maja Rožman (Univerza v Mariboru, Ekonomsko-poslovna fakulteta) Recenzija Vesna Čančer Review (Univerza v Mariboru, Ekonomsko-poslovna fakulteta) Dijana Oreški (Univerza v Zagrebu, Fakulteta organizacije in informatike v Varaždinu) Blaž Frešer (Univerza v Mariboru, Ekonomsko-poslovna fakulteta) Jezikovni pregled Alenka Plos Language edeting (Univerza v Mariboru, Ekonomsko-poslovna fakulteta) Tehnična urednika Dunja Legat Technical editors (Univerza v Mariboru, Univerzitetna založba) Jan Perša (Univerza v Mariboru, Univerzitetna založba) Oblikovanje ovitka Jan Perša Cover designer (Univerza v Mariboru, Univerzitetna založba) Grafične priloge Graphic material Tominc, Rožman, 2023 Grtafika na ovitku Cover graphics Analytics Statistics, avtor: madartzgraphics, CC0, Pixabay.com, 2023 Založnik Univerza v Mariboru Izdajatelj Univerza v Mariboru Published by Univerzitetna založba Issued by Ekonomsko-poslovna fakulteta Slomškov trg 15, Razlagova ulica 14, 2000Maribor, Slovenija 2000 Maribor, Slovenija https://press.um.si, zalozba@um.si https://www.epf.um.si, epf@um.si Izdaja Edition Prva izdaja Izdano Published at Maribor, maj 2023 Vrsta publikacije Publication type E-knjiga Dostopno na Available at https://press.um.si/index.php/ump/catalog/book/782 CIP - Kataložni zapis o publikaciji © Univerza v Mariboru, Univerzitetna založba Univerzitetna knjižnica Maribor / University of Maribor, University Press 311.42(075.8)(076.5)(0.034.2) Besedilo / Text © Tomic, Rožman, 2023 TOMINC, Polona To delo je objavljeno pod licenco Creative Commons Priznanje avtorstva-Nekomercialno-Deljenje Poslovna statistika [Elektronski vir] / pod enakimi pogoji 4.0 Mednarodna. / This work is licensed under the Creative Commons At ribution-avtorici Polona Tominc, Maja Rožman. - 1. izd. NonCommercial-ShareAlike 4.0 International License. - E-knjiga. - Maribor : Univerza v Mariboru, Univerzitetna založba, 2023 Uporabnikom se dovoli reproduciranje, distribuiranje, dajanje v najem, javno priobcitev in predelavo avtorskega dela, ce navedejo avtorja in širijo avtorsko delo/predelavo naprej pod istimi Način dostopa (URL): pogoji. Za nova dela, ki bodo nastala s predelavo, ni dovoljena komercialna uporaba. https://press.um.si/index.php/ump/catalog/ book/782 Vsa gradiva tretjih oseb v tej knjigi so objavljena pod licenco Creative Commons, razen če to ni ISBN 978-961-286-741-6 (PDF) navedeno drugače. Če želite ponovno uporabiti gradivo tretjih oseb, ki ni zajeto v licenci Creative Commons, boste morali pridobiti dovoljenje neposredno od imetnika avtorskih pravic. doi: 10.18690/um.epf.6.2023 COBISS.SI-ID 152596995 https://creativecommons.org/licenses/by-nc-sa/4.0/ ISBN 978-961-286-741-6 (pdf) DOI https://doi.org/10.18690/um.epf.6.2023 Cena prof. dr. Zdravko Kačič, Price Brezplačni izvod Odgovorna oseba založnika For publisher rektor Univerze v Mariboru Citiranje Tominc, P., Rožman, M. (2023). Poslovna statistika. Univerza v Mariboru, Univerzitetna založba. doi: Attribution 10.18690/um.epf.6.2023 POSLOVNA STATISTIKA P. Tominc, M. Rožman Kazalo Uvod ........................................................................................................................................................... 1 1 UREJANJE IN PRIKAZOVANJE PODATKOV ............................................................................. 3 Naloga 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 Naloga 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 Naloga 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 Naloga 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 Naloga 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 Naloga 6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 Naloga 7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 Naloga 8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 Naloga 9 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 Naloga 10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 Naloga 11 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 2 DESKRIPTIVNA STATISTIKA ..................................................................................................... 23 Naloga 12 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 Naloga 13 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 Naloga 14 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 Naloga 15 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 Naloga 16 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 Naloga 17 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 Naloga 18 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 Naloga 19 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 Naloga 20 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 Naloga 21 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 3 TEORETIČNA NORMALNA PORAZDELITEV ....................................................................... 41 Naloga 22 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 Naloga 23 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 Naloga 24 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 Naloga 25 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 Naloga 26 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 Naloga 27 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 Naloga 28 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 Naloga 29 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 4 ENOSTAVNA REGRESIJSKA ANALIZA .................................................................................... 53 Naloga 30 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 Naloga 31 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 Naloga 32 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 Naloga 33 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 Naloga 34 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 Naloga 35 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 Naloga 36 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 Naloga 37 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 Naloga 38 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 ii KAZALO 5 OSNOVE VZORČENJA ................................................................................................................ 69 Naloga 39 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 Naloga 40 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 Naloga 41 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 Naloga 42 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 Naloga 43 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 Naloga 44 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 Naloga 45 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 Naloga 46 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 Naloga 47 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 Naloga 48 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 Naloga 49 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 Naloga 50 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 Naloga 51 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 Naloga 52 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 Naloga 53 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 6 ČASOVNE VRSTE ......................................................................................................................... 83 Naloga 54 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 Naloga 55 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 Naloga 56 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 Naloga 57 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 Naloga 58 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90 Naloga 59 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 Naloga 60 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92 Naloga 61 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 Naloga 62 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 Naloga 63 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 Naloga 64 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 Naloga 65 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 Naloga 66 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 7 REŠITVE NALOG.......................................................................................................................... 99 7.1 Urejanje in prikazovanje podatkov . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 7.2 Deskriptivna statistika . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 7.3 Teoretične porazdelitve . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120 7.4 Enostavna regresijska analiza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 7.5 Osnove vzorčenja . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138 7.6 Časovne vrste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148 OBRAZCI ............................................................................................................................................... 159 1. del: Urejanje, prikazovanje in analiza podatkov . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159 2. del: Korelacija in regresija . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163 3. del: Časovne vrste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164 4. del: Osnovni pojmi statističnega sklepanja . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165 LITERATURA ........................................................................................................................................ 169 POSLOVNA STATISTIKA P. Tominc, M. Rožman Uvod Pri izvedbi statističnega raziskovanja se običajno srečamo z množico podatkov različnega izvora in različnih tipov. Ti podatki, pretvorjeni v ustrezne statistične rezultate, naj bi čim natančneje opisovali proučevani pojav (na primer, ekonomski, družbeni itd.) ali ponujali uporabniku čim natančnejšo statistično sliko tega pojava. Tako je statistika znanstvena disciplina, ki se ukvarja z zbiranjem podatkov in njihovim prikazovanjem, z obdelavo podatkov ter analizo dobljenih rezultatov na vseh področjih raziskovanja množičnih pojavov. Pri vsaki statistični raziskavi moramo v skladu s postavljenim ciljem in namenom raziskave pridobiti ustrezne podatke. Podatke delimo na primarne, to so tisti, ki jih moramo pridobiti posebej za raziskavo, ter sekundarne, to so podatki, ki so že zbrani in jih lahko uporabimo brez dodatnega zbiranja (že zbrane podatke na primer lahko dobimo na Statističnem uradu RS). O deskriptivni ali opisni statistiki govorimo takrat, kadar opisujemo dani podatkovni niz in predstavljamo npr. velikost vzorca (N), odstotke števila statističnih enot z določeno lastnostjo (%), frekvence (fk), minimalne (Min) in maksimalne (Max) vrednosti spremenljivk, srednje vrednosti, standardni odklon, varianco itd. Inferenčna statistika se nanaša na ocenjevanje parametrov in preverjanje domnev z ustreznimi statističnimi metodami (na primer regresijska analiza, t-test, ANOVA itd). Parameter je številska ali opisna vrednost, ki opisuje neko značilnost statistične množice ali populacije. Statistika pa je številska ali opisna vrednost, ki ocenjuje neko značilnost statistične množice in jo dobimo iz vzorca. 2 POSLOVNA STATISTIKA Zato je predmet Poslovna statistika, za katerega je namenjena ta zbirka vaj, pomemben za razvijanje sposobnosti razumevanja informacij v podatkih. Predmet Poslovna statistika vsebuje naslednje vsebinske sklope: a) prikazovanje podatkov v tabelah in grafih, b) relativna števila, c) srednje vrednosti, mere variabilnosti, asimetrije in sploščenosti, d) intervalno ocenjevanje vrednosti statističnih parametrov in osnove preizkušanja domnev o statističnih parametrih, e) osnove enostavne regresije, f) osnove analize in napovedovanja vrednosti v časovnih vrstah. Študenti v okviru predmeta spoznajo uporabnost statističnih metod pri reševanju poslovnih problemov ter utrdijo in nadgradijo teoretično znanje na področju statističnih tehnik in metod, ki omogočajo spremeniti različne podatke v uporabne informacije za poslovno odločanje. Študenti usvojijo analitičen matematično statističen pristop k preučevanju poslovnih problemov, ki se sestoji iz naslednjih korakov: (1) formulacija problema na statističen način, (2) izbira ustrezne statistične metode, (3) reševanje problema in (4) interpretacija rezultatov v smislu možnih rešitev problema. POSLOVNA STATISTIKA P. Tominc, M. Rožman 1 UREJANJE IN PRIKAZOVANJE PODATKOV Statistika je veda, ki kvantitativno proučuje pojave v naravi in družbi ter tako z različnimi statističnimi metodami odkriva zakonitosti teh pojavov (Moore idr., 2016; Selvamuthu in Das, 2018, Ghauri idr., 2020). Statistično raziskavo opravimo na statistični množici. Statistična množica je možica statističnih enot, ki izpolnjujejo določene opredeljujoče lastnosti. Statistično množico lahko imenujemo populacija. Vsak posamezni element statistične množice imenujemo statistična enota (na primer en študent, eno podjetje). Če je statistična množica ali populacija prevelika, raziskavo opravimo na vzorcu (Moore idr., 2016; Holmes idr., 2018) . Vzorec je del celotne populacije, na osnovi katerega izvedemo sklepanje o celotni populaciji, in mora imeti določene lastnosti, ki jih bomo opisali v nadaljevanju. Pri tem je pomembno zagotoviti reprezentativnost vzorca. Vzorec je reprezentativen, če omogoča, da lahko rezultate, ki smo jih dobili na osnovi vzorca, posplošimo na celotno statistično množico. Temeljno načelo pa je, da mora biti vzorec slučajen. Za slučajni vzorec velja, da ima vsaka statistična enota v statistični množici ali populaciji znano in neničelno verjetnost (ta verjetnost je vnaprej znana), da je izbrana v slučajni vzorec (Tominc in Kramberger, 2007; Lind idr., 2021). Število statističnih enot, ki jih zajamemo v raziskavi, označujemo s črko N (število statističnih enot v statistični množici označimo z N in število statističnih enot v vzorcu označimo z n). 4 POSLOVNA STATISTIKA Lastnost, ki jo preučujemo pri posamezni statistični enoti, je statistična spremenljivka. Statistične spremenljivke so lahko opisne (atributne) ali številske (numerične). Za opisne spremenljivke velja, da lahko njihove vrednosti izražamo le z besedami (na primer spol, rojstni kraj, izobrazba). Številske spremenljivke so tiste spremenljivke, katerih vrednosti lahko izražamo s števili (na primer starost, prihodek). Med številskimi spremenljivkami pa ločimo zvezne in nezvezne spremenljivke. Zvezne spremenljivke so številske spremenljivke, ki lahko zavzamejo katerokoli vrednost na intervalu (na primer teža izdelka, dolžina, čas). Nezvezne spremenljivke (diskretne spremenljivke) pa so tiste številske spremenljivke, ki lahko zavzamejo le določene končne, največkrat celoštevilčne vrednosti (na primer število podjetij, število članov v gospodinjstvu). Primer razvrščanja statističnih spremenljivk: Statistična spremenljivka Vrednost statistične spremenljivke Vrsta statistične spremenljivke Število članov v gospodinjstvu 2; 3; 4; 5 numerična, nezvezna Število članov v gospodinjstvu manj kot 3; 3 ali več Opisna Mesečna neto plača v d.e. 900; 1.200,80; 2.100; 2.530,55 numerična, zvezna Dolžina izdelka v cm 8,5; 10; 15,8; 13,4; 16 numerična, zvezna Spol moški, ženski Opisna Velikost podjetja malo, srednje veliko, veliko Opisna Najosnovnejšo obliko statističnih podatkov predstavljajo statistične vrste, ki jih delimo na tri skupine: časovne, krajevne in stvarne statistične vrste (Tominc in Kramberger, 2007). Tabelarično urejene podatke statistične vrste lahko grafično prikažemo z ustreznim grafom, ki še bolj nazorno prikazuje značilnosti statistične vrste. Tako je najpomembnejša značilnost časovne statistične vrste, ki jo želimo običajno spoznati, dinamika, kar pomeni spreminjanje vrednosti opazovane spremenljivke skozi čas. Za prikaz dinamike v časovni vrsti je tako zelo pogosto uporabljan grafični prikaz, ki ga imenujemo linijski grafikon. V raziskavah so podatki o vrednosti številske statistične spremenljivke za posamične statistične enote, kadar jih enostavno zapisujemo enega za drugim, nepregledni ali neurejeni, zato jih je smiselno urediti po velikosti v ranžirno vrsto ali jih združiti v skupine v frekvenčne razrede (vse podatke, s katerimi razpolagamo, razdelimo v določeno število frekvenčnih razredov, ki so lahko enako ali različno široki – širino k-tega frekvenčnega razreda označimo z ik in predstavlja pri zvezno opredeljenih mejah razredov razliko med zgornjo in spodnjo mejo k-tega razreda: yk, max in yk, min). Vrednosti številske spremenljivke lahko uredimo v razrede frekvenčne porazdelitve, ki jih grafično prikazujemo s frekvenčnimi histogrami ali poligoni. Če analiziramo vrednosti opisne spremenljivke, pa le-te uredimo v skupine na osnovi možnih vrednosti opisne spremenljivke (Tominc in Kramberger, 2007). Frekvenca (fk) nam pove, kako pogosto se pojavlja vrednost spremenljivke, ki je po 1 Urejanje in prikazovanje podatkov 5. vrednosti znotraj mej k-tega razreda (med spodnjo in zgornjo mejo k-tega razreda). Na primer, 8 študentov je doseglo na izpitu iz Poslovne statistike med 90 in 100 točk, 10 študentov je doseglo med 85 in manj kot 90 točk, 15 študentov je doseglo med 70 in manj kot 85 točk ipd. V navedenem primeru je število študentov frekvenca. Kumulativna frekvenca (Fk) k-tega frekvenčnega razreda pove, pri koliko statističnih enotah je vrednost statistične spremenljivke enaka ali manjša od zgornje meje tega k-tega frekvenčnega razreda. Torej če seštejemo frekvenco k-tega razreda in frekvence vseh razredov pred tem, dobimo kumulativno frekvenco k-tega razreda. Relativna frekvenca je razmerje (ali delež) med številom statističnih enot z določeno vrednostjo spremenljivke (ali vrednostjo spremenljivke v opredeljenem intervalu za vrednosti spremenljivke) in skupnim številom statističnih enot v podatkovnem nizu. Relativne frekvence so lahko izražene v deležu ali v odstotku. Relativno strukturo podatkovnega niza (vzorca ali statistične množice), bodisi glede na število statističnih enot v posameznih skupinah ali razredih frekvenčne porazdelitve v primerjavi z vsemi statističnimi enotami podatkovnega niza bodisi glede na vsoto vrednosti spremenljivke v posameznih skupinah v primerjavi s celotno vsoto vseh vrednosti spremenljivke ( total), grafično najpogosteje prikazujemo s strukturnim stolpcem (Tominc in Kramberger, 2007), v katerem prikažemo strukturne odstotke. Drugi grafični prikazi so še strukturni krog, strukturni polkrog, strukturni kvadrat. Primer rešene naloge: V preglednici so podatki o študentih terciarnega izobraževanja, ki so vpisani v visokošolski univerzitetni študij po občini stalnega prebivališča v študijskem letu 2021/2022. Občina Ajdovščina Bled Brežice Celje Ormož Ptuj Laško Sežana Vpis študentov 250 93 193 485 102 237 116 121 Statistično vrsto za število vpisa študentov, ki so vpisani v visokošolski univerzitetni študij v študijskem letu 2021/2022, prikažite grafično. 6 POSLOVNA STATISTIKA Grafični prikaz: 600 V 500 TON 400 ED 300 TU 200 PIS Š 100 V 0 Ajdovščina Bled Brežice Celje Ormož Ptuj Laško Sežana OBČINA STALNEGA PREBIVALIŠČA ŠTUDENTA Prikazana je krajevna statistična vrsta, saj so vrednosti spremenljivke urejene po geografskih enotah (občinah). Primer rešene naloge: Študenti podiplomskega študijskega programa na Ekonomsko-poslovni fakulteti v Mariboru pri določenem predmetu na izpitu za rešitev testa porabijo različno količino časa (čas je merjen v minutah). Podatki so podani v preglednici: Čas reševanja testa v minutah Število študentov Od 10 do pod 20 5 Od 20 do pod 30 14 Od 30 do pod 40 23 Od 40 do pod 50 38 Od 50 do pod 60 60 Skupaj 140 a) Opredelite statistično enoto ter spremenljivko. Statistična enota je vsak posamezen element statistične množice, kar pomeni, da je v našem primeru statistična enota en študent podiplomskega študijskega programa na Ekonomsko-poslovni fakulteti v Mariboru. Statistična spremenljivka opisuje lastnost statistične enote in je v našem primeru čas reševanja testa v minutah (številska, zvezna spremenljivka). b) Izračunajte kumulativne člene frekvenčne porazdelitve. Kumulativni členi frekvenčne porazdelitve F1 = f1, Fk = Fk-1 + fk za k = 2,3, ⋅ ⋅ , r r = število razredov v frekvenčni porazdelitvi 1 Urejanje in prikazovanje podatkov 7. Čas reševanja testa Število študentov Kumulativna frekvenčna porazdelitev v minutah (fk) (Fk) Od 10 do pod 20 5 5 Od 20 do pod 30 14 5 + 14 = 19 Od 30 do pod 40 23 19 + 23 = 42 Od 40 do pod 50 38 42 + 38 = 80 Od 50 do pod 60 60 80 + 60 = 140 Skupaj 140 c) Frekvenčno porazdelitev prikažite grafično. Grafični prikaz: 70 V 60 TON 50 E 40 TUD Š 30 ILO 20 V 10 ŠTE 0 Od 10 do pod 20 Od 20 do pod 30 Od 30 do pod 40 Od 40 do pod 50 Od 50 do pod 60 ČAS REŠEVANJA TESTA V MINUTAH Naloga 1 V preglednici so podatki o številu trgovin neke trgovske verige, v šestih slovenskih regijah, v nekem časovnem obdobju ter podatki o višini investicij v trgovske objekte te trgovske verige (v d.e.): Regija Gorenjska Goriška Primorska Koroška Pomurska Posavska Zasavska Št. trgovin 21 25 14 17 25 12 18 Investicije (v d.e.) 314 100 100 300 260 175 250 a) Kako imenujemo statistični vrsti v preglednici? b) Statistično vrsto za število trgovin prikažite grafično. c) Za podatke o višini investicij po regijah prikažite relativno strukturo skupno porabljenih sredstev po regijah. 8 POSLOVNA STATISTIKA 1 Urejanje in prikazovanje podatkov 9. Naloga 2 Analizirati želimo najvišjo dnevno temperaturo (°C) v Mariboru od januarja do decembra v določenem letu. Podatki so podani v preglednici: Mesec Jan. Feb. Mar. Apr. Maj Jun. Jul. Avg. Sep. Nov. Okt. Dec. Temp. 3,6 4,6 11,2 15,4 20,6 23.6 25,7 25,4 21,2 15,5 8,6 4,5 a) Kako imenujemo statistični vrsti v preglednici? b) Statistično vrsto za število trgovin prikažite grafično. 10 POSLOVNA STATISTIKA Naloga 3 V preglednici so podani podatki o skupni količini padavin (v mm) po vremenskih postajah, ki so bile izmerjene 17. septembra 2022: Vremenska postaja Količina padavin (v mm) Leskovec pri Krškem 72,6 Krško 75,9 Lisca 126,6 Bučerca 58,6 Cerklje ob Krki 91,4 Birna vas 96,6 Sevnica 140,5 Pišece 89,4 a) Kako imenujemo statistični vrsti v preglednici? b) Statistično vrsto prikažite grafično. 1 Urejanje in prikazovanje podatkov 11. Naloga 4 V tovarni porabijo zaposleni za izdelavo določenega izdelka različno količino časa (čas je merjen v minutah). Podatki so podani v preglednici: Izdelava določenega izdelka v minutah Število zaposlenih Od 11 do 20 12 Od 21 do 30 16 Od 31 do 40 10 Od 41 do 50 8 Od 51 do 60 4 Skupaj 50 a) Opredelite statistično množico, statistično enoto ter spremenljivko. b) Izračunajte kumulativne člene frekvenčne porazdelitve. c) Frekvenčno porazdelitev ter kumulativno frekvenčno porazdelitev prikažite grafično. 12 POSLOVNA STATISTIKA 1 Urejanje in prikazovanje podatkov 13. Naloga 5 V vzorec smo zajeli naključno izbranih 190 malih podjetij v Sloveniji, ki smo jih razvrstili glede na število zaposlenih. Podatki za 190 malih podjetij glede na število zaposlenih: Število zaposlenih Število podjetij Od 1 do 10 16 Od 11 do 20 27 Od 21 do 30 42 Od 31 do 40 55 Od 41 do 50 50 a) Opredelite statistično množico, statistično enoto ter spremenljivko ter njene značilnosti. b) Določite spodnje in zgornje meje razredov ter določite širino razredov. c) Prikažite strukturo podjetij glede na število zaposlenih v strukturnem stolpcu in strukturnem krogu. d) Frekvenčno porazdelitev prikažite grafično. 14 POSLOVNA STATISTIKA 1 Urejanje in prikazovanje podatkov 15. Naloga 6 Razpolagamo s podatki o oceni zadovoljstva zaposlenih (na lestvici od 1 do 100) za 50 zaposlenih: 15 17 18 18 18 18 19 19 19 20 23 24 25 25 26 27 29 29 29 29 30 30 35 37 38 36 39 39 39 39 41 45 42 46 46 48 48 48 46 49 55 62 65 72 72 85 91 95 91 95 a) Opredelite statistično množico, statistično enoto ter spremenljivko, njene značilnosti in zalogo vrednosti spremenjivke. b) Sestavite frekvenčno porazdelitev pri pogojih: y1,min = ymin ; r = 8, i1 = 10, i2-8 = 9; meje razredov so podane nezvezno. c) Frekvenčno porazdelitev ter kumulativno frekvenčno porazdelitev prikažite grafično. 16 POSLOVNA STATISTIKA Naloga 7 Za 300 študentov, ki smo jih opazovali glede na število ur študija (zvezna spremenljivka) za izpit iz predmeta Statistika, imate na razpolago naslednje podatke: ymin = 41 ur ymax = 97 ur y1,min = 40 ur y6,max = 100 ur r = 6 ik = i = 10 za k = 1,2,…,r F1 = 25 F2 = 75 F3 = 175 F4 = 250 F5 = 290 F6 = 300 a) Na osnovi danih podatkov sestavite frekvenčno porazdelitev in jo grafično prikažite. 1 Urejanje in prikazovanje podatkov 17. b) Koliko odstotkov študentov je porabilo od 60 do 70 ur študija? c) Koliko odstotkov študentov je porabilo od 60 do 70 ur študija? Naloga 8 Podatki za 500 kupcev glede na porabljen znesek za nakup v neki trgovini, na dan 31.12. preteklega leta, v eni od slovenskih regij so: Znesek za nakup Število kupcev Od 1 do pod 50 80 Od 50 do pod 100 125 Od 100 do pod 150 148 Od 150 do pod 200 112 Od 200 do pod 250 35 a) Opredelite statistično enoto, statistično množico, statistično spremenljivko ter njene vrednosti. b) Prikažite relativno strukturo statistične množice s strukturnim stolpcem. 18 POSLOVNA STATISTIKA Naloga 9 V trgovinah so pričeli s prodajo novega izdelka. Število kosov prodanega izdelka v enem tednu je podano v preglednici. Število trgovin Število kosov prodanega izdelka Od 0 do 5 7 Od 6 do 11 14 Od 12 do 17 19 Od 18 do 23 26 Od 24 do 29 35 Od 30 do 35 42 a) Pojasnite statistično enoto, statistično množico, statistično spremenljivko in njene vrednosti. b) Izračunajte in pojasnite člene kumulativne frekvenčne porazdelitve in jo prikažite grafično. c) Izračunajte in pojasnite relativne frekvence ter grafično prikažite strukturo statistične množice glede na skupno število kosov prodanega izdelka v enem dnevu v posameznih razredih. 1 Urejanje in prikazovanje podatkov 19. 20 POSLOVNA STATISTIKA Naloga 10 Izbruh novega virusa COVID-19 je spremenil način poslovanja številnih podjetij. V preglednici so podatki za 137 podjetij in številu zaposlenih, ki so prešli na delo na daljavo v letu 2021. Število zaposlenih Število podjetij Od 5 do 15 38 Od 16 do 26 35 Od 27 do 37 27 Od 38 do 48 20 Od 49 do 59 17 Skupaj 137 a) Pojasnite statistično enoto, statistično množico, statistično spremenljivko in njene vrednosti. b) Frekvenčno porazdelitev prikažite grafično. c) Izračunajte in pojasnite člene kumulativne frekvenčne porazdelitve. d) Izračunajte in pojasnite relativne frekvence ter grafično prikažite relativno strukturo statistične množice. 1 Urejanje in prikazovanje podatkov 21. 22 POSLOVNA STATISTIKA Naloga 11 Za 450 zaposlenih, ki smo jih opazovali glede na število ur bolniških izostankov (zvezna spremenljivka) v podjetju X, so na razpolago naslednji podatki: y1,min = 10 ur y7,max = 73 ur r = 7 i = 9 F1 = 13 F2 = 38 F3 = 154 F4 = 188 F5 = 244 F6 = 282 F7 = 450 a) Opredelite statistično enoto in spremenljivko ter njene značilnosti. b) Na osnovi danih podatkov sestavite frekvenčno porazdelitev in jo grafično prikažite. c) Koliko odstotkov zaposlenih je imelo od 37 do 46 ur bolniških izostankov? d) Koliko odstotkov zaposlenih je imelo do 64 ur bolniških izostankov? POSLOVNA STATISTIKA P. Tominc, M. Rožman 2 DESKRIPTIVNA STATISTIKA V okviru deskriptivne ali opisne statistike običajno opredeljujemo kvantile, mere osrednje tendence, mere variabilnosti ter mere asimetrije in sploščenosti. Kvantili so mere, ki opredeljujejo položaj posamezne statistične enote glede na ostale po vrednosti obravnavane statistične spremenljivke. Najpomembnejši kvantili so kvartili in decili, ki razdelijo vse vrednosti spremenljivke, urejene po velikosti, na četrtine oziroma na deset enakih delov, ter mediana, ki je tista vrednost spremenljivke, ki razdeli vse statistične enote na dve enaki skupini. Med najpomembnejše mere osrednje tendence uvrščamo aritmetično sredino, modus (najpogostejša vrednost) in mediano, ki smo jo že omenili. Najpomembnejše mere variabilnosti zajemajo variacijski razmik, kvartilni in decilni razmik, varianco in standardni odklon ter koeficient variabilnosti. Med mere asimetrije in sploščenosti uvrščamo koeficient asimetrije in koeficient sploščenosti (Holmes idr., 2018; Heumann idr., 2016). Za izračun kvantilov je treba statistične enote razvrstiti po vrednosti obravnavane spremenljivke od najmanjše do največje ( ranžirna vrsta pri manjšem številu statističnih enot ali frekvenčna porazdelitev pri večjem številu statističnih enot). Pri ranžirni vrsti rang Ri izraža i-to mesto, ki pripada določeni vrednosti obravnavane spremenljivke (yi). Kvantilni rang Pi pa nam pove (v deležu), kolikšen delež (ali preračunano v odstotek) statističnih enot ima vrednost spremenljivke – manjšo ali največ enako obravnavani vrednosti spremenljivke yi, ki ji pripada rang Ri. 24 POSLOVNA STATISTIKA Kvartili (Q) razdelijo urejene podatke na četrtine (po 25 %), decili (D) pa na desetine (po 10 %). Mediana (Me) je enaka drugemu kvartilu, pa tudi petemu decilu, kot smo omenili že zgoraj. Aritmetična sredina je srednja vrednost, ki jo izračunamo tako, da vsoto vseh vrednosti obravnavane spremenljivke delimo s številom statističnih enot v podatkovnem nizu. Aritmetično sredino označimo kot 𝑦𝑦, če obravnavamo podatke statistične množice ( N), in kot 𝑌𝑌, če obravnavamo podatke iz vzorca ( n). Modus je enak tisti vrednosti spremenljivke, ki se najpogosteje pojavlja (označimo ga z Mo). Mediana je srednja vrednost, od katere ima 50 % enot manjše ali enake vrednosti, 50 % enot pa večje vrednosti (označimo jo z Me), in sodi v skupino kvantilov, kot je bilo že omenjeno. Variacijski razmik ( VR) je razlika med največjo (ymax) in najmanjšo (ymin) vrednostjo spremenljivke. Kvartilni razmik je mera variabilnosti, ki označuje razpon srednje velikih vrednosti (50 % podatkov na sredini ranžirne vrste ali frekvenčne porazdelitve. To je razlika med tretjim kvartilom (Q3) in prvim kvartilom (Q1). Decilni razmik pa je razlika med devetim (D9) in prvim decilom (D1) (srednjih 80 % vrednosti). Varianca meri povprečno kvadratno odstopanje posameznih vrednosti spremenljivke od aritmetične sredine. Definirana je kot povprečje kvadratov odklonov posameznih vrednosti od aritmetične sredine. Varianco pri podatkih statistične množice označimo kot σ2, pri podatki iz vzorca pa jo označimo kot s2 ( nepristranska ocena variance). Standardni odklon je definiran kot kvadratni koren iz variance. S standardnim odklonom lahko merimo, kako so razpršene vrednosti okoli aritmetične sredine zbranih podatkov (standardni odklon pri podatkih statistične množice označimo kot σ, pri podatkih iz vzorca pa kot označimo s) (Tominc in Kramberger, 2007). Koeficient variabilnosti, izražen v % (KV %), pove, koliko odstotkov aritmetične sredine predstavlja standardni odklon za dani podatkovni niz. Vsako porazdelitev je mogoče standardizirati oziroma je mogoče vsaki vrednosti spremenljivke poiskati njeno standardizirano vrednost, kar bomo podrobneje obravnavali v naslednjem poglavju o teoretični normalni porazdelitvi. Med mere asimetrije in sploščenosti uvrščamo koeficient asimetrije in koeficient sploščenosti. Asimetrične porazdelitve (slika 1) so lahko asimetrične v desno (pozitivna asimetrična porazdelitev), zanje je značilna večja gostitev pri manjših vrednostih spremenljivke, ali asimetrične v levo (negativna asimetrična porazdelitev) in je zanje značilna večja gostitev vrednosti pri večjih vrednostih spremenljivke. Koeficient asimetrije je manjši od 0, če je za porazdelitev spremenljivke značilna asimetrija v levo, pri asimetriji v desno je koeficient 2 Deskriptivna statistika 25. asimetrije večji od 0. Bolj kot se koeficient asimetrije razlikuje od vrednosti 0, večja je jakost asimetrije, koeficient asimetrije pa pri večini empiričnih porazdelitev lahko zavzame vrednost med –3 in +3 (Artenjak, 2003). Sploščenost porazdelitve (slika 2) primerjamo z normalno porazdelitvijo, za katero rečemo, da je normalno sploščena. Če je porazdelitev bolj koničasta od normalne porazdelitve, rečemo, da je porazdelitev koničasta (ima daljša repa in ožji osrednji del). Če je porazdelitev bolj sploščena od normalne, rečemo, da je porazdelitev sploščena. Za koeficient sploščenosti je značilno, da kadar je le-ta večji od 0, nakazuje na koničasto porazdelitev in v primeru, ko je koeficient sploščenosti manjši od 0, na sploščeno porazdelitev. Pri teoretični normalni porazdelitvi, ki jo bomo obravnavali v nadaljevanju, sta tako koeficienta asimetričnosti in sploščenosti enaka 0 (Freedman idr., 2007; Evans idr., 2010). Slika 1: Asimetričnost porazdelitve (Vir: Freedman idr., 2007; Evans idr., 2010) Slika 2: Sploščenost porazdelitve (Vir: Freedman idr., 2007; Evans idr., 2010) 26 POSLOVNA STATISTIKA Primer rešene naloge: Mesečno število izposojenih knjig v knjižnici X za šest študentov je bilo sledeče: 4, 6, 8, 2, 5, 7. a) Izračunajte in pojasnite povprečno vrednost za mesečno število izposojenih knjig v knjižnici. b) Izračunajte in pojasnite standardni odklon za mesečno število izposojenih knjig v knjižnici. c) Pojasnite mero variabilnosti, ki upošteva variabilnost za 80 % študentov, ki se glede na mesečno število izposojenih knjig razvrščajo na sredino ranžirne vrste. a) Za izračun povprečnega števila izposojenih knjig uporabimo enačbo (aritmetična sredina iz nerazvrščenih vrednosti – v obrazcih št. 1.24): N 1 1 y = ( ) 1 2 ∑ N y + y + ⋅ ⋅ ⋅ + y = N N yi i= 1 ȳ = 1 · (4+6+8+2+5+7) = 5,3 knjig 6 Odg.: Povprečna vrednost za mesečno število izposojenih knjig v knjižnici šestih študentov znaša 5,3 knjig. b) Izračunamo varianco po enačbi ( varianca iz nerazvrščenih vrednosti – v obrazcih št. 1.34): N 1 VAR = σ 2 = ∑ 2 N ( y − ) i y i= 1 σ2 = 1 · [(4 – 5,3)2 + (6 – 5,3)2+ (8 – 5,3)2+ (2 – 5,3)2 + (5 – 5,3)2 + (7 – 5,3)2] = 3,89 6 knjig2 Izračunamo standardni odklon (v obrazcih št. 1.38): SD = σ = VAR = σ 2 , σ = √3,89 = 1,97 knjig c) Podatke uredimo v ranžirno vrsto: 2 Deskriptivna statistika 27. Ri 1 2 3 4 5 6 yi 2 4 5 6 7 8 Decilni razmik (v obrazcih št. 1.33): D = D9 – D1 D1: 10 % Uporabimo skupino enačb z naslovom kvantili iz nerazvrščenih vrednosti (v obrazcih št. 1.18, 1.19 in 1.20): Pi = 0,1 Ri = N · Pi + 0,5 Ri = 6 · 0,1 + 0,5 = 1,1 R0 ≤ Ri < R1 R0 = 1 ≤ Ri = 1,1 < R1 = 2 y0 ≤ yi < y1 y0 = 2 ≤ yi < y1 = 4 − y i 0 i = y0 + R R R − ( ) 1 0 1 R × y − y 0 yi = 2 + 1,1−1 · (4 – 2) = 2,2 knjig 2−1 10 % študentov si je v knjižnici izposodilo 2,2 knjig ali manj. D9: 90 % Pi = 0,9 Ri = 6 · 0,9 + 0,5 = 5,9 R0 ≤ Ri < R1 R0 = 5 ≤ Ri = 5,9 < R1 = 6 y0 ≤ yi < y1 y0 = 7 ≤ yi < y1 = 8 yi = 7 + 5,9−5 · (8 – 7) = 7,9 knjig 6−5 28 POSLOVNA STATISTIKA 90 % študentov si je v knjižnici izposodilo 7,9 knjig ali manj. D = 7,9–2,2 = 5,7 knjig 80 % študentov, ki se glede na mesečno število izposojenih knjig razvrščajo na sredino ranžirne vrste, se med seboj razlikujejo za največ 5,7 izposojenih knjig. Naloga 12 Definirajte oziroma pojasnite naslednje pojme: ranžirna vrsta, kvartili, decili, mediana, modus, aritmetična sredina, variacijski razmik, kvartilni oziroma decilni razmik, varianca, standardni odklon, koeficient variabilnosti, koeficient asimetrije, koeficient sploščenosti. 2 Deskriptivna statistika 29. Naloga 13 V 20 poslovalnicah trgovskega podjetja X je bilo v opazovanem letu naslednje število pritožb kupcev: 16, 8, 32, 18, 4, 26, 10, 12, 34, 14, 25, 19, 5, 9, 17, 33, 27, 22, 7, 20 a) Izračunajte, koliko odstotkov poslovalnic je imelo število pritožb manjše od 13. b) Izračunajte, koliko odstotkov poslovalnic je imelo število pritožb večje od 23. c) Izračunajte kvartilni razmik. d) Izračunajte povprečno število pritožb. e) Izračunajte število pritožb v 50 % poslovalnic z največjim številom pritožb. f) Izračunajte mero variabilnosti, ki upošteva število pritožb v 80 % poslovalnic, ki se glede na število pritožb razvrščajo na sredino ranžirne vrste. g) V konkurenčnem trgovskem podjetju Y je povprečno število pritožb v njihovih poslovalnicah osem, standardni odklon pa dve pritožbi. V katerem trgovskem podjetju se poslovalnice glede na število pritožb kupcev med seboj bolj razlikujejo? 30 POSLOVNA STATISTIKA 2 Deskriptivna statistika 31. Naloga 14 V dveh organizacijah smo opazovali zaposlene glede na čas (v minutah), ki so ga porabili za izdelavo enega izdelka. Podatki so: Organizacija A: N = 12 yi = 26, 38, 45, 22, 33, 29, 34, 41, 40, 39, 43, 30 minut Organizacija B: N = 730 Organizacija B Poraba časa v minutah Število zaposlenih Nad 22 do 26 76 Nad 26 do 30 123 Nad 30 do 34 235 Nad 34 do 38 162 Nad 38 do 42 98 Nad 42 do 46 36 Skupaj 730 Izračunajte in pojasnite: a) kvartilni razmik in mediano (za organizacijo A), b) povprečno porabljeni čas za en izdelek v organizaciji A in v organizaciji B, c) variacijski razmik za podatke organizacije A, d) varianco in standardni odklon za podatke organizacij A in B, e) koeficient variabilnosti za podatke organizacij A in B. 32 POSLOVNA STATISTIKA 2 Deskriptivna statistika 33. Naloga 15 Na nekem področju smo opazovali 260 sodnikov okrajnih sodišč po številu obravnavanih zadev v določenem časovnem razdobju. Podatki so v preglednici: Število obravnavanih zadev Število sodnikov Od 31 do 60 35 Od 61 do 90 52 Od 91 do 120 74 Od 121 do 150 41 Od 151 do 180 32 Od 181 do 210 26 Skupaj 260 a) Navedite statistično množico, enoto, spremenljivko in vrednosti spremenljivke. b) Grafično ocenite asimetrijo gornje porazdelitve. c) Izračunajte delež standardnega odklona v aritmetični sredini. 34 POSLOVNA STATISTIKA Naloga 16 Na nekem cestnem odseku so v 45 zaporednih dneh našteli takšno število osebnih vozil: Število osebnih vozil Število dni Od 1 do 10 6 Od 11 do 20 14 Od 21 do 30 15 Od 31 do 40 5 Od 41 do 50 5 SKUPAJ 45 a) Izračunajte in pojasnite variacijski razmik za število osebnih vozil. b) Grafično prikažite frekvenčno porazdelitev. c) Izračunajte in pojasnite aritmetično sredino za število osebnih vozil v opazovanih 45 dnevih. 2 Deskriptivna statistika 35. Naloga 17 Donosi desetih delnic (v d.e.) so bili v opazovanem obdobju sledeči: 10 40 50 50 71 82 800 850 1000 1100 a) Opredelite statistično enoto, statistično spremenljivko in statistično množico. b) Kolikšne donose je doseglo 25 % najmanj donosnih delnic in kolikšne 25 % najbolj donosnih delnic? Naloga 18 V banki "X" so opazovali 1451 varčevalcev glede na višino vloženih sredstev (v 102 evrov). Podatki so v preglednici: Vložena sredstva v 102 evrov Število vlagateljev Od 1 do manj kot 10 223 Od 10 do manj kot 20 356 Od 20 do manj kot 50 439 Od 50 do manj kot 100 245 Od 100 do manj kot 500 188 a) V banki "Y" je višina povprečno vloženih sredstev 456 vlagateljev 7530 evrov, varianca pa 7.022.500 evrov2. V kateri banki se vlagatelji glede na vložena sredstva med seboj bolj razlikujejo? b) Porazdelitev vlagateljev banke "X" prikažite grafično. 36 POSLOVNA STATISTIKA 2 Deskriptivna statistika 37. Naloga 19 Tedensko število nadur za osem zaposlenih v podjetju X je sledeče: 5, 6, 9, 11, 4, 8, 7, 3. a) Izračunajte povprečno tedensko število nadur zaposlenih. b) Izračunajte delež standardnega odklona v aritmetični sredini. c) Kolikšno je tedensko število nadur 50 % zaposlenih, ki so imeli najmanj nadur? d) Pojasnite mero variabilnosti, ki upošteva variabilnost za 50 % zaposlenih, ki se glede na tedensko število nadur razvrščajo na sredino ranžirne vrste. 38 POSLOVNA STATISTIKA Naloga 20 V podjetju X so za deset zaposlenih zabeležili število dni, ko so bili odsotni zaradi bolniškega staleža: Zaposlen 1 2 3 4 5 6 7 8 9 10 Število bolniških dni 3 5 8 8 12 15 20 24 24 30 a) Za spremenljivko število bolniških dni izpišite modus. b) Pojasnite mero variabilnosti, ki upošteva variabilnost za 80 % zaposlenih, ki se glede na število bolniških dni razvrščajo na sredino ranžirne vrste. c) Kolikšno število bolniških dni so imeli tisti zaposleni, ki spadajo med 30 % zaposlenih z najmanj bolniških dni v podjetju? d) Kolikšno število bolniških dni so imeli tisti zaposleni, ki spadajo med 30 % zaposlenih z največ bolniških dni v podjetju? 2 Deskriptivna statistika 39. Naloga 21 Devet študentov je za nakup študijskega gradiva pri različnih predmetih porabilo določene zneske (v d.e.): 160 220 75 246 98 180 290 260 195 a) Opredelite statistično enoto in statistično spremenljivko. b) Izračunajte in pojasnite koeficient asimetrije na podlagi mediane ter vse parametre, ki ste jih pri tem izračunali. 40 POSLOVNA STATISTIKA POSLOVNA STATISTIKA P. Tominc, M. Rožman 3 TEORETIČNA NORMALNA PORAZDELITEV Normalna porazdelitev je definirana z dvema parametroma, aritmetično sredino (𝑦𝑦 , velikokrat pa se za aritmetično sredino v statistični množici uporablja tudi oznaka μ), in standardnim odklonom (σ) (Holmes idr., 2018). Normalna porazdelitev je simetrična glede na aritmetično sredino, aritmetična sredina pa je po vrednosti hkrati tudi enaka mediani in modusu. Krivulja normalne porazdelitve je unimodalna, zvonasta, simetrična in se asimptotično približuje osi x. Večina lastnosti se v naravi razporeja v obliki normalne porazdelitve (Evans idr., 2010). Sprememba standardnega odklona σ povzroči spremembo oblike normalne krivulje, krivulja postane bolj sploščena ali pa bolj koničasta, odvisno od σ. Sprememba aritmetične sredine pa povzroči, da se graf premakne v levo ali desno. To pomeni, da obstaja neskončno število normalnih porazdelitev. Pri uporabi v statistiki je pomembna porazdelitev standardizirana normalna porazdelitev. Standardizirana normalna porazdelitev je normalna porazdelitev standardiziranih vrednosti, imenovanih tudi z-vrednosti, vsaki vrednosti y spremenljivke, porazdeljeni po poljubni normalni porazdelitvi, je mogoče izračunati njeno standardizirano z-vrednost (Holmes idr., 2018) z upoštevanjem transformacijske enačbe (v obrazcih). 42 POSLOVNA STATISTIKA Povprečje za standardizirano normalno porazdelitev je enako 0, standardni odklon in varianca pa sta enaka 1. Slika 3 prikazuje normalno porazdelitev. Slika 3: Normalna porazdelitev (Vir: Balakrishnan in Nevzorov, 2003) Kasneje se bomo srečali še z drugo teoretično porazdelitvijo – t-porazdelitev, v poglavju o vzorčenju. Studentova t-porazdelitev je zelo podobna normalni porazdelitvi. Glavna razlika je v tem, da nima enotne oblike. Njeno obliko določa število stopinj prostosti (n–1). Pri manjšem številu stopinj prostosti je t­porazdelitev bolj razvlečena od normalne (sploščena), z naraščanjem števila stopinj prostosti pa se po obliki vse bolj približuje normalni porazdelitvi. Primer rešene naloge: Izračunajte verjetnost, da normalno porazdeljena spremenljivka y zavzame vrednost, ki je večja od 16 enot. Upoštevajte, da aritmetična sredina znaša 19 enot in standardni odklon 6 enot. Prikaz normalne porazdelitve: 4 Enostavna regresijska analiza 43. Standardizirana normalna porazdelitev: zi = 𝑦𝑦−ȳ = 16−19 = –0,5 𝜎𝜎 6 P (y > 16 enot) = 0,5 + H (–0,5) = 0,5 + 0,1915 = 0,6915 = 69,15 % Vrednost H (zi) odčitamo iz tabele ploščine H(z) za standardizirano normalno porazdelitev. Verjetnost, da normalno porazdeljena spremenljivka y zavzame vrednost, ki je večja od 16 enot, je 69,15 %. Primer rešene naloge: Dolžina minut pisanja testa pri določenem predmetu pri študentih se porazdeljuje po normalni porazdelitvi, z aritmetično sredino 40 minut in standardnim odklonom 15 minut. Izračunajte, koliko minut porabijo tisti študenti za pisanje testa pri določenem predmetu, ki spadajo med 20 % študentov, ki so pisali test najmanj časa. Standardizirana normalna porazdelitev: 44 POSLOVNA STATISTIKA P(y < yi) = 20 % H (zi) = 0,3 Vrednost H(zi) poiščemo v tabeli ploščine H(z) za standardizirano normalno porazdelitev, kjer poiščemo ploščino, ki je po vrednosti najbližje (tj. 0,2995), ter odčitamo pripadajočo standardizirano vrednost v prvem stolpcu ter prvi vrstici tabele, kar pomeni, da je zi = 0,84, ki ji dodamo negativni predznak, saj leži iskana vrednost na levo od aritmetične sredine. yi = ȳ + zi · σ yi = 40 – 0,84 ·15 = 27,4 minut Študenti, ki spadajo med 20 % tistih, ki so za test porabili najmanj časa, so za pisanje porabili 27,4 minut. Naloga 22 V gospodinjstvih v neki družbi je čas uporabe družinskega računalnika v gospodinjstvu za igranje igric porazdeljen po normalni porazdelitvi, z aritmetično sredino dve uri in standardnim odklonom 0,5 ure. a) Izračunajte verjetnost, da je v naključno izbranem gospodinjstvu družinski računalnik v uporabi za igranje igric med 1,8 in 2,75 urami na dan. b) V koliko odstotkih gospodinjstev se družinski računalnik uporablja več kot pet ur dnevno za igranje igric? c) Koliko časa je družinski računalnik v uporabi za igranje igric pri tistih 25 odstotkih gospodinjstev, kjer je ta čas najkrajši? 4 Enostavna regresijska analiza 45. 46 POSLOVNA STATISTIKA Naloga 23 Število minut učenja en dan pred izpitom pri študentih pri predmetu Poslovna statistika se porazdeljuje po normalni porazdelitvi, z aritmetično sredino 240 minut in standardnim odklonom 80 minut. Izračunajte, kolikšna je verjetnost, da bo naključno izbran študent študiral en dan pred izpitom več kot 210 minut. 4 Enostavna regresijska analiza 47. Naloga 24 Izračunajte verjetnost, da normalno porazdeljena spremenljivka y zavzame vrednost, ki je večja od 14 enot. Upoštevajte, da aritmetična sredina znaša 17 enot in standardni odklon 5 enot. 48 POSLOVNA STATISTIKA Naloga 25 Podjetje preučuje tri alternativne investicijske možnosti. Pričakovan donos v vseh primerih je porazdeljen po normalni porazdelitvi. Pri prvi alternativni investicijski možnosti povprečna vrednost donosa znaša 1780 € in standardni odklon 115 €. Pri drugi alternativni investicijski možnosti povprečna vrednost donosa znaša 2168 € in standardni odklon 425 €. Pri tretji alternativni investicijski možnosti povprečna vrednost donosa znaša 3000 € in standardni odklon 515 €. Pri kateri investicijski možnosti je manjša verjetnost, da bo donos večji od 1500 €? Naloga 26 V tovarni je 600 zaposlenih, ki jih proučujemo po odstotku dosežene norme (spremenljivka je normalno porazdeljena). Aritmetična sredina za odstotek dosežene norme v zadnjem delovnem mesecu je bila 102 %, standardni odklon pa 4 %. a) Kolikšna je verjetnost, da bo naključno izbran zaposleni dosegel normo največ 98 %? b) Kolikšna je verjetnost, da bo naključno izbran zaposleni dosegel normo med 97 in 105 %? c) Določite mejne vrednosti za razmik, v katerem se nahaja 80 % zaposlenih, ki po doseženi normi ležijo simetrično na povprečno vrednost. Kako se imenuje izračunani razmik? 4 Enostavna regresijska analiza 49. Naloga 27 Višina vloženih denarnih sredstev varčevalcev opazovane banke se porazdeljuje po normalni porazdelitvi z aritmetično sredino 1500 evrov in standardnim odklonom 400 evrov. Na osnovi standardizirane normalne porazdelitve izračunajte verjetnost, da je vloženi znesek naključno izbranega varčevalca od 600 do 1200 evrov. 50 POSLOVNA STATISTIKA Naloga 28 Dolžina minut izdelave enega izdelka pri zaposlenih v podjetju X se porazdeljuje po normalni porazdelitvi, z aritmetično sredino 90 minut in standardnim odklonom 35 minut. a) Izračunajte, koliko minut porabijo za izdelavo enega izdelka tisti zaposleni, ki spadajo med 40 % tistih, pri katerih je poraba minut za izdelavo izdelka najvišja? b) Izračunajte, koliko minut porabijo za izdelavo enega izdelka tisti zaposleni, ki spadajo med 30 % tistih, pri katerih je poraba minut za izdelavo izdelka najnižja? 4 Enostavna regresijska analiza 51. c) Izračunajte, koliko odstotkov zaposlenih je porabilo za izdelavo enega izdelka med 50 in 105 minut za izdelavo enega izdelka? d) Izračunajte, koliko odstotkov zaposlenih je porabilo za izdelavo enega izdelka med 100 in 130 minut za izdelavo enega izdelka? 52 POSLOVNA STATISTIKA Naloga 29 Ocena študentov na izpitu pri predmetu Poslovna statistika se porazdeljuje po normalni porazdelitvi, z aritmetično sredino 5,5 in varianco 2. Izračunajte P(D3 < y < Q3) = γ. POSLOVNA STATISTIKA P. Tominc, M. Rožman 4 ENOSTAVNA REGRESIJSKA ANALIZA S pomočjo enostavne linearne regresije analiziramo odvisnost med odvisno ( y) in eno neodvisno ali pojasnjevalno spremenljivko ( x) oziroma utemeljeno domnevamo, da neodvisna spremenljivka (x) vpliva na odvisno spremenljivko (y). Grafični prikaz, ki ga uporabljamo pri enostavni regresijski analizi, se imenuje razsevni grafikon. Razsevni grafikon je grafični prikaz povezanosti med dvema spremenljivkama (slika 4). Slika 4: Povezanost med odvisno in neodvisno spremenljivko (Vir: Montgomery idr., 2021) Kazalci enostavne linearne regresije Regresijski model predvideva, da je vrednost odvisne spremenljivke odvisna od vrednosti pojasnjevalne spremenljivke ter od drugih spremenljivk in slučajnih vplivov, ki jih nismo eksplicitno vključili v model: y = f(x) + e. Pri tem e označuje t.i. preostanek modela (Montgomery idr., 2021). Vrednost f(x) lahko opredelimo z linearno funkcijo in v tem primeru govorimo o linearni regresijski funkciji: y� = 𝑎𝑎 + 𝑏𝑏 ∙ 𝑥𝑥 (Montgomery idr., 2021). 54 POSLOVNA STATISTIKA Kovarianca (Cxy) pove, ali sta spremenljivki povezani ter kakšna je smer njune povezanosti. Kadar je kovarianca različna od 0, pomeni, da sta spremenljivki medsebojno povezani. V primeru, ko je kovarianca večja od 0, prevladuje pozitivna smer povezanosti med spremenljivkama, in kadar je kovarianca manjša od 0, prevladuje negativna smer povezanosti (Aickin, 2010). Ocenjeni vrednosti obeh regresijskih koeficientov (pri regresijski konstanti in koeficienta pri neodvisni spremenljivki): regresijska konstanta (a) pove povprečno vrednost odvisne spremenljivke ( y), ko je neodvisna spremenljivka x enaka 0, regresijski koeficient pri neodvisni spremenljivki (b) pa izraža, za koliko enot se v povprečju spremeni vrednost odvisne spremenljivke, če se neodvisna spremenljivka spremeni za eno enoto (Holmes, 2018). Determinacijski koeficient ( r2xy) pove, kolikšen % celotne variance spremenljivke y (odvisna spremenljivka) je pojasnjen z regresijsko funkcijo oz. s spremenljivko x (neodvisna spremenljivka). Opredeljuje jakost linearne povezanosti med spremenljivkama. Vrednost determinacijskega koeficienta se giblje med 0 in 1 (0 ≤ r2xy ≤ 1) (Holmes, 2018). Korelacijski koeficient ( rxy) opredeljuje jakost in smer linearne povezanosti med odvisno in neodvisno spremenljivko. Vrednost korelacijskega koeficienta se giblje med –1 in 1 (–1 ≤ rxy ≤1) (Holmes, 2018, Montgomery idr., 2021). Standardna napaka ocene odvisne spremenljivke ( σey) pokaže, ali na variabilnost spremenljivke y, razen spremenljivke x, vplivajo še druge spremenljivke in slučajni vplivi (Seber in Lee, 2003). Točkovna ocena vrednosti spremenljivke y pri izbrani vrednosti spremenljivke x = x0 je pridobljena tako, da vrednost spremenljivke x0 vstavimo v regresijsko enačbo. Pri intervalni oceni vrednosti spremenljivke y pri izbrani vrednosti spremenljivke x pa upoštevamo, da na odvisno spremenljivko vplivajo še druge spremenljivke in slučajni vplivi (Tebachnick in Fidel, 2013). Intervalna ocena pomeni, da z določeno stopnjo verjetnosti ocenimo, kakšno vrednost spremenljivke y lahko v povprečju pričakujemo pri izbrani vrednosti spremenljivke x = x0 , če upoštevamo tudi standardno napako ocene odvisne spremenljivke (Tominc in Kramberger, 2007). Primer rešene naloge: V preglednici so podatki o povprečni porabi časa za točenje goriva v minutah (x) in povprečnem znesku za gorivo v d.e. (y): 4 Enostavna regresijska analiza 55. Povprečen čas v minutah (x) 5,6 7,4 6,8 9,3 10,4 8,5 Povprečen znesek v d.e. (y) 12,4 33,8 20,8 45,8 55,7 50,3 a) Izračunajte in pojasnite vse kazalce linearne korelacije in regresije. b) Z verjetnostjo 95,4 % ocenite povprečen znesek za gorivo pri povprečni porabi časa 10 minut. a) Izračun kazalcev linearne korelacije in regresije (v obrazcih št. 2.2. ali 2.3, 2.4, 2.5, 2.6, 2.8 ali 2.9, 2.10): Obe oceni regresijskih koeficientov izračunamo na osnovi obrazcev sistema normalnih enačb za izračun regresijskih koeficientov oziroma enačb, ki so iz tega sistema izpeljane. Preden se lotimo izračuna kazalcev linearne korelacije in regresije, izračunamo: Σ xi = 5,6 + 7,4 + 6,8 + 9,3 + 10,4 + 8,5 = 48 Σ x 2 i= 5,62 + 7,42 + 6,82 + 9,32 + 10,42 + 8,52 = 399,26 Σ yi = 12,4 + 33,8 + 20,8 + 45,8 + 55,7 + 50,3 = 218,8 Σ y 2 i= 12,42 + 33,82 + 20,82 + 45,82 + 55,72 + 50,32 = 9459,06 Σ xi · yi = (5,6·12,4) + (7,4·33,8) + (6,8·20,8) +…+ (8,5·50,3) = 1893,77 x = 48 = 8 6 y = 218,8 = 36,47 6 Izračun kovariance (v obrazcih št. 3.5): N 1 c = ∑ − ⋅ xy N xi yi x y i= 1 Cxy = 1 · 1893,77 – 8 · 36,47 = 23,868 6 Oba regresijska koeficienta a in b izračunamo tako (v obrazcih št. 2.2 ali 2.3 in 2.4): cxy b = σ 2x N N 1 ∑ 1 ( − )( − ) ∑ − ⋅ i i i i b N x x y y i= 1 N x y x y i = = = 1 N N 1 ∑ 2 1 ( ) ∑ 2 2 N x − − i x i i= 1 N x x i= 1 56 POSLOVNA STATISTIKA 1 b · 1893,77 − 8 · 36,47 6 = 1 = 9,38 · 399,26 −82 6 a = y − bx a = 36,47 – 9,38 · 8 = –38,57 Izračunana regresijska koeficienta vstavimo v enačbo regresijske premice: y� = 𝑎𝑎 + 𝑏𝑏 · x y� = −38,57 + 9,38 x Pomen regresijskega koeficienta a: Regresijska konstanta a nima vedno smiselnega vsebinskega pomena. Tako je tudi v tem primeru, saj pri času točenja 0 minut povprečni znesek za plačilo goriva ne bo negativna vrednost, pač pa bo enak 0. Pomen regresijskega koeficienta b: Če se povprečna poraba časa za točenje goriva (x) poveča za eno enoto (v minutah), se povprečen znesek goriva (y) v povprečju poveča za 9,38 d.e. Korelacijski koeficient izračunamo po obrazcu (v obrazcih št. 2.9): σ r x = ⋅ xy b σ y Za izračun σx in σy uporabimo enačbo za varianco iz nerazvrščenih vrednosti (v obrazcih št. 1.34): N σ 1 2 2 = ∑ ( − ) y i N y y i= 1 σ 2x = 1 · [(5,6 – 8)2 + (7,4 – 8)2 +…+ (8,5 – 8)2] = 15,26 6 σx = �15,26 = 3,91 σ 2 y = 1 · [(12,4 – 36,47)2 + (33,8 – 36,47)2 + …+ (50,3 – 36,47)2] = 1480,1534 6 σy = �1480,1534 = 38,47 rxy = 9,38 · 3,91 = 0,953 38,47 Na osnovi rezultata (rxy = 0,953) vidimo, da obstaja močna povezanost med odvisno (povprečen znesek za gorivo) in neodvisno spremenljivko (povprečna poraba časa za točenje goriva). Smer povezanosti je pozitivna. 4 Enostavna regresijska analiza 57. Izračun determinacijskega koeficienta: r 2xy = 0,9532 = 0,908 oz. 90,8 % Delež pojasnjene variance v skupni varianci za odvisno spremenljivko znaša 90,8 %. Standardno napako ocene odvisne spremenljivke izračunamo po obrazcu (v obrazcih št. 2.10): σ = σ 1 − r2 ey y xy σey = 38,47 · √1 − 0,908 = 11,67 Standardna napaka ocene odvisne spremenljivke je različna od 0, kar pomeni, da na povprečen znesek za gorivo (odvisna spremenljivka) poleg povprečne porabe časa za točenje goriva (neodvisna spremenljivka) vplivajo še druge spremenljivke in slučajni vplivi. b) Izračun povprečnega zneska za gorivo pri povprečni porabi časa 10 minut z verjetnostjo 95,4 %: x = 10 y� = −38,57 + 9,38 x y�x=10 = −38,57 + 9,38 · 10 y�x=10 = 55,29 d.e. P(55,29 – 2 · 11,67 < y x=10 < 55,29 + 2 · 11,67) = 95,4 % Pri domnevi o normalni porazdelitvi na primer velja, da se v razmiku 𝐲𝐲�x + 2·σey nahaja 95,4 % vseh vrednosti. P(𝐲𝐲�x – 2·σey Me pomeni, da je porazdelitev asimetrična v desno (več kot polovica vrednosti je manjših od aritmetične sredine). ȳ < Me pomeni, da je porazdelitev asimetrična v levo (manj kot polovica vrednosti je manjših od aritmetične sredine). ȳ = Me pomeni, da je porazdelitev simetrična. 7.3 Teoretične porazdelitve Naloga 22 a) 7 Rešitve nalog 121. Standardizirana normalna porazdelitev z1 = 𝑦𝑦−ȳ = 1,8−2 = –0,4 𝜎𝜎 0,5 z2= 2,75−2 = 1,5 0,5 P (1,8 ure < y < 2,75 ure) = H (–0,4) + H (1,5) = 0,1554 + 0,4332 = 0,5886 = 58,86 % Vrednost H (zi) odčitamo iz tabele ploščine H(z) za standardizirano normalno porazdelitev. Verjetnost, da je v naključno izbranem gospodinjstvu družinski računalnik v uporabi za igranje igric med 1,8 in 2,75 urami na dan, je enaka 58,86 %. Naloga 22 b) zi = 6; H(6) = 0,5 P(y > 5) = 0,5 – H(6) = 0,5 – 0,5 = 0 Naloga 22 c) V tem primeru je podana verjetnost: P(y < zi) = 0,25 122 POSLOVNA STATISTIKA H(zi) = 0,25 Iz tabele ploščine H(z) za standardizirano normalno porazdelitev odčitamo vrednost zi: H(–0,67) = 0,2486 = 0,25 Uporabimo enačbo: yi = zi · σ + ȳ yi = −0,67 · 0,5 + 2 = 1,7 ure V 25 % gospodinjstev, kjer je čas uporabe družinskega računalnika za igranje igric najkrajši, znaša ta čas do 1,7 ure dnevno. Naloga 23 zi = 𝑦𝑦−ȳ = 210−240 = –0,38 𝜎𝜎 80 P(y > 210 minut) = 0,5 + H(–0,38) = 0,5 + 0,1480 = 0,648 = 64,8 % Naloga 24 zi = 𝑦𝑦−ȳ = 14−17 = -0,6 𝜎𝜎 5 P(y > 14 enot) = 0,5 + H (–0,6) = 0,5 + 0,2257 = 0,7257 = 72,57 % Naloga 25 1. Alternativna investicijska možnost: zi = 𝑦𝑦−ȳ = 1500−1780 = –2,43 𝜎𝜎 115 P(y > 1500 €) = H (–2,43) + 0,5 = 0,4925 + 0,5 = 0,9925 = 99,25 % 7 Rešitve nalog 123. 2. Alternativna investicijska možnost: zi = 𝑦𝑦−ȳ = 1500−2168 = –1,57 𝜎𝜎 425 P(y > 1500 €) = H (–1,57) + 0,5 = 0,4418 + 0,5 = 0,9418 = 94,18 % 3. Alternativna investicijska možnost: zi = 𝑦𝑦−ȳ = 1500−3000 = –2,91 𝜎𝜎 515 P(y > 1500 €) = H (–2,91) + 0,5 = 0,4982 + 0,5 = 0,9982 = 99,82 % Odgovor: Pri drugi alternativni investiciji je verjetnost manjša, da bo donos večji od 1500 €. Naloga 26 a) Dosežena norma največ 98 %: zi = 𝑦𝑦−ȳ = 98−102 = –1 𝜎𝜎 4 P(y ≤ 98 %) = 0,5 – H (–1) = 0,5 – 0,3413 = 0,1587 = 15,87 % Odgovor: Verjetnost, da bo naključno izbran zaposleni dosegel normo največ 98 %, je enaka 0,1587 oziroma 15,87 %. Naloga 26 b) z1 = 𝑦𝑦−ȳ = 97−102 = –1,25 𝜎𝜎 4 z2 = 𝑦𝑦−ȳ = 105−102 = 0,75 𝜎𝜎 4 P(97 % ≤ y ≤ 105 %) = H (–1,25) + H (0,75) = 0,3944 + 0,2734 = 0,6678 = 66,78 % Odgovor: Verjetnost, da bo naključno izbran zaposleni dosegel normo med 97 in 105 %, je 0,6678 oziroma 66,78 %. Naloga 26 c) P(y1 ≤ y ≤ y2) = 80 % H (zi) = 0,80 = 0,4 2 124 POSLOVNA STATISTIKA Vrednost H (zi) odčitamo iz tabele ploščine H(z) za standardizirano normalno porazdelitev, kjer poiščemo najbližje število 0,4 (tj. 0,3997), kar pomeni, da je zi = + 1,28. Uporabimo enačbo: yi = ȳ + zi · σ y1 = 102 – 1,28 · 4 = 96,88 y2 = 102 + 1,28 · 4 = 107,12 Naloga 27 z1 = 𝑦𝑦−ȳ = 600−1500 = –2,25 𝜎𝜎 400 z2 = 𝑦𝑦−ȳ = 1200−1500 = –0,75 𝜎𝜎 400 P(600€ ≤ y ≤ 1200€) = H (–2,25) – H (–0,75) = 0,4878 – 0,2734 = 0,2144 = 21,44 % Naloga 28 a) P(y > yi) = 40 % H (zi) = 0,1 Vrednost H (zi) odčitamo iz tabele ploščine H(z) za standardizirano normalno porazdelitev, kjer poiščemo najbližje število 0,1 (tj. 0,0987), kar pomeni, da je zi = 0,25. Uporabimo enačbo: yi = ȳ + zi · σ yi = 90+0,25 · 35=98,75 minut Naloga 28 b) P(y < yi) = 30 % H (zi) = 0,2 Vrednost H (zi) odčitamo iz tabele ploščine H(z) za standardizirano normalno porazdelitev kjer poiščemo najbližje število 0,2 (tj. 0,1985), kar pomeni, da je zi = –0,52. yi = ȳ + zi · σ yi = 90–0,52 · 35=71,8 minut 7 Rešitve nalog 125. Naloga 28 c) z1 = 𝑦𝑦−ȳ = 50−90 = –1,14 𝜎𝜎 35 z2= 105−90 = 0,43 35 P (50 minut < y < 105 minut) = H (–1,14) + H (0,43) = 0,3729 + 0,1664 = 0,5393 = 53,93 % Naloga 28 d) z1 = 𝑦𝑦−ȳ = 100−90 = 0,29 𝜎𝜎 35 z2= 130−90 = 1,14 35 P (100 minut < y < 130 minut) = H (z2) – H (z1) = H (1,14) – H (0,29) = 0,3729 – 0,1141 = 0,2588 = 25,88 % Naloga 29 P(D3 < y < Q3) = γ. ȳ = 5,5 σ2 = 2 σ = 1,41 D3 = 30 %, Pi = 0,30 – 0,5 = –0,2 (poiščemo najbližje število 0,2; tj. 0,1985) z1 = –0,52 yi = ȳ + zi · σ = 5,5 – 0,52 · 1,41 = 4,77 Q3 = 75 %, Pi = 0,75 – 0,5 = 0,25 (poiščemo najbližje število 0,25; tj. 0,2486) z2 = 0,67 yi= ȳ + zi · σ = 5,5 + 0,67 · 1,41 = 6,44 P(D3 < y < Q3) = 0,2 + 0,25 = 0,45 = 45 % P( 4,77 < y < 6,44) = 45 % 7.4 Enostavna regresijska analiza Naloga 30 a) Oblika: Linearna oblika 126 POSLOVNA STATISTIKA Smer med spremenljivkama: Pozitivna smer, kar pomeni, da z naraščanjem investicij v tehnologijo (x) v povprečju narašča ustvarjen dobiček (y). Jakost povezanosti med spremenljivkama: Obstaja močna povezanost med odvisno (ustvarjen dobiček) in neodvisno spremenljivko (investicije v tehnologijo). Naloga 30 b) Izračun parametrov regresijske premice: Preden se lotimo izračuna regresijskih koeficientov a in b, izračunamo: Σ xi = 115 + 130 + 140 + 149 + 160 + 171 = 865 Σ x 2 i = 1152 + 1302 + 1402 + 1492 + 1602 + 1712 = 126.767 Σ yi = 328 + 330 + 390 + 361 + 421 + 400 = 2.230 Σ y 2 i= 3282 + 3302 + 3902 + 3612 + 4212 + 4002 = 836.146 Σ xi · yi = (115 · 328) + (130 · 330) + (140 · 390) +…+ (171 · 400) = 324.769 x = 865 = 144,1667 6 y = 2230 = 371,6667 6 Oba regresijska koeficienta izračunamo po enačbi (v obrazcih št. 2.3 in 2.4): N N 1 ∑ 1 ( − )( − ) ∑ − ⋅ i i i i b N x x y y i= 1 N x y x y i = = = 1 N N 1 ∑ 2 1 ( ) ∑ 2 2 N x − − i x i i= 1 N x x i= 1 1 b · (324769) − 144,1667 • 371,6667 6 = 1 = 1,5887 · (126767)−144,16672 6 a = y − bx a = 371,6667 – 1,5887 · 144,1667 = 142,6291 Izračunana regresijska koeficienta vstavimo v enačbo regresijske premice: y� = 𝑎𝑎 + 𝑏𝑏 · xi y� = 142,6291 + 1,5887 · xi Pomen regresijskega koeficienta a: Pri investicijah v tehnologijo x = 0 lahko v povprečju pričakujemo, da bo ustvarjen dobiček podjetja 142,6291 (v 103 EUR). Pomen regresijskega koeficienta b: Če se investicije v tehnologijo (x) povečajo za eno enoto (v 106 EUR), se ustvarjen dobiček (y) v povprečju poveča za 1,5887 (v 103 EUR). 7 Rešitve nalog 127. Naloga 30 c) x = 180 (v 106 EUR) y� = 142,6291 + 1,5887 · xi y�x=180 = 142,6291 + 1,5887 · 180 y�x=180 = 428,649 (v 103 EUR) Višina dobička za podjetje, ki bi investiralo v tehnologijo x = 180 (v 106 evrov), znaša 428,649 (v 103 EUR). Naloga 30 d) Parameter, na osnovi katerega določimo smer in jakost linearne korelacijske odvisnosti, je korelacijski koeficient. Izračunamo ga po enačbi (v obrazcih št. 2.9): σ r x = ⋅ xy b σ y Za izračun σx in σy uporabimo enačbo za skupno varianco (v obrazcih št. 2.7): N σ 1 2 2 = ∑ ( − ) y i N y y i= 1 σ 2x = 1 · [(115 – 144,1667)2 + (130 – 144,1667)2 +…+ (171 – 144,1667)2] = 343,806 6 σx = √343,806 = 18,543 σ 2 y = 1 · [(328 – 371,6667)2 + (330 – 371,6667)2 + …+ (400 – 371,6667)2] = 1221,556 6 σy = �1221,556 = 34,950 rxy = 1,5887 · 18,542 = 0,843 34,950 Na osnovi rezultata (rxy = 0,8428) vidimo, da obstaja močna povezanost med odvisno (ustvarjen dobiček) in neodvisno spremenljivko (investicije v tehnologijo). Smer povezanosti je pozitivna. Naloga 30 e) Izračunati moramo delež pojasnjene variance v skupni varianci za odvisno spremenljivko – determinacijski koeficient: r 2 xy = 0,84282 = 0,7103 oz. 71,03 % Delež pojasnjene variance v skupni varianci za odvisno spremenljivko znaša 71,03 %. 128 POSLOVNA STATISTIKA Naloga 30 f) Standardno napako ocene odvisne spremenljivke izračunamo po enačbi (v obrazcih št. 2.10): σ = σ 1 − r2 ey y xy σey = 34,950 · √1 − 0,7103 = 18,811 Standardna napaka ocene odvisne spremenljivke je različna od 0, kar pomeni, da na ustvarjen dobiček (odvisna spremenljivka) poleg investicij v tehnologijo (neodvisna spremenljivka) vplivajo še druge spremenljivke in slučajni vplivi. Naloga 30 g) Pri domnevi o normalni porazdelitvi ocen na primer velja, da se v razmiku y�x + 2·σey nahaja 95,4 % vseh vrednosti. P(y�x – 2·σey Y − z (4.15) n σ Y > Y − z ⋅ N ⋅ (4.16) n p(100 − π p) > p − z ⋅ (4.17) n σ y < Y + z (4.18) n σ Y < Y + z ⋅ N ⋅ (4.19) n p(100 − π p) < p + z ⋅ (4.20) n Dvostransko ocenjevanje aritmetične sredine iz malih vzorcev s s Y − t < 2 2 , / y < Y + α t (4.21) n α / n Preizkušanje domneve o aritmetični sredini Y − y z D = (4.22) SEy σ s SE = ≈ (4.23) y n n Obrazci 167. Y D y t − = (4.24) SEy Kritične vrednosti standardizirane spremenljivke z = − 1645 , < < = + 1645 , ⇒ α = 0 10 , s z zz z = − 1 96 , < < = + 1 96 , ⇒ α = 0 05 , s z zz z = − 2 58 , < < = + 2 58 , ⇒ α = 0 01 , s z zz Kritične vrednosti spremenljivke y = y ± ⋅ D z SEy 168 POSLOVNA STATISTIKA POSLOVNA STATISTIKA P. Tominc, M. Rožman LITERATURA Aickin, M. (2010). Variance and Covariance, Reliability and Regression: A Brief Companion of Formulas and Methods for Data Analysis. ZDA: CreateSpace Independent Publishing Platform. Artenjak, J. (2003). Poslovna statistika. Prenovljena in dopolnjena izdaja. Maribor: UM Ekonomsko-poslovna fakulteta. Balakrishnan, N., Nevzorov V. B. (2003). A Primer on Statistical Distributions. ZDA: Wiley-Interscience Brockwell, P. J., Davis, R. A. (2016). Introduction to Time Series and Forecasting. Springer Nature. Evans, M., Hastings, N., Peacock, B., Forbes, C. (2010). Statistical Distributions. ZDA: Wiley Freedman, D., Pisani, R., Purves, R. (2007). Statistics. New York: W.W. Norton & Company Ghauri, P., Grønhaug, K., Strange, R. (2020). Research Methods in Business Studies. United Kingdom: University Printing House. Heumann, C., Schomaker, M., Shalabh, S. (2016). Introduction to Statistics and Data Analysis. Singapore: Springer Holmes, A., Illowsky, B., Dean, S. (2018). Introductory Business Statistics. Houston: Rice University. Lind, D. A, Marchal, W. G., Wathen, S. A. (2021). Basic Statistics in Business and Economics. New York: McGraw-Hill Education Mišić, E. (2019). Indeksna števila. RS: Statistični urad. Montgomery, D. C., Peck, E. A., Vining, G. G. (2021). Introduction to Linear Regression Analysis. ZDA: Wiley Moore, D. S., McCabe, G. P., Craig, B. A. (2016). Introduction to the Practice of Statistics. USA: W. H. Freeman Ralph, J., O'Neill, R., Winton, J. (2015). A Practical Introduction to Index Numbers. ZDA: Wiley Seber, G. A. F., Lee, A. J. (2003). Linear Regression Analysis. ZDA: Wiley Selvamuthu, D., Das, D. (2018). Introduction to Statistical Methods, Design of Experiments and Statistical Quality Control. Singapore: Springer Tabachnick, B. G., Fidell, L. S. (2013). Using multivariate statistics. Boston: Pearson. Tominc, P. (2016). Statistika (2. del predmeta). Učno gradivo pri predmetu Statistika (2. del predmeta), interno gradivo. Maribor: EPF. Tominc, P., Kramberger, T. (2007). Statistične metode v logistiki. Celje: UM Fakulteta za logistiko. 170 POSLOVNA STATISTIKA POSLOVNA STATISTIKA: POLONA TOMIC, MAJA ROŽMAN Univerza v Mariboru, Ekonomsko-poslovna fakulteta, Maribor, Slovenija polona.tominc@um.si, maja.rozman@um.si Predmet Poslovna statistika, za katerega je namenjena ta zbirka vaj, je pomemben za to, da študenti razvijejo sposobnost razumevanja informacij v podatkih. Gradivo obravnava naslednje vsebinske sklope: Ključne besede: prikazovanje podatkov v tabelah in grafih, relativna števila, mere urejanje in prikazovanje centralne tendence, mere variabilnosti, asimetrije in sploščenosti, podatkov, intervalno ocenjevanje vrednosti statističnih parametrov in osnove deskriptivna statistika, preizkušanja domnev o statističnih parametrih, osnove enostavne enostavna regresijska analiza, regresije ter osnove analize in napovedovanja vrednosti v časovnih osnove vzorčenja, vrstah. časovne vrste DOI https://doi.org/10.18690/um.epf.6.2023 ISBN 978-961-286-741-6 BUSINESS STATISTICS: POLONA TOMIC, MAJA ROŽMAN University of Maribor, Faculty of Economics and Business, Maribor, Slovenia polona.tominc@um.si, maja.rozman@um.si The course Business Statistics, for which this collection of exercises/tutorials is intended, is important for students to develop the ability to understand the information in data. These tutorials contain the fol owing chapters: data visualisation using tables and graphs, Keywords: relative numbers, measures of central tendency, measures of data visualisation, dispersion, skewness and kurtosis, confidence intervals for statistical descriptive statistics, simple regression parameters and the basis of hypothesis testing of statistical parameters, analysis, basics of simple regression and basics of time series analysis and basics of sampling, time series forecasting. https://doi.org/10.18690/um.epf.6.2023 DOI 978-961-286-741-6 ISBN Document Outline Kazalo Uvod 1 UREJANJE IN PRIKAZOVANJE PODATKOV Naloga 1 Naloga 2 Naloga 3 Naloga 4 Naloga 5 Naloga 6 Naloga 7 Naloga 8 Naloga 9 Naloga 10 Naloga 11 2 DESKRIPTIVNA STATISTIKA Naloga 12 Naloga 13 Naloga 14 Naloga 15 Naloga 16 Naloga 18 Naloga 19 Naloga 20 Naloga 21 3 TEORETIČNA NORMALNA PORAZDELITEV Naloga 22 Naloga 23 Naloga 24 Naloga 25 Naloga 26 Naloga 27 Naloga 28 Naloga 29 4 ENOSTAVNA REGRESIJSKA ANALIZA Naloga 30 Naloga 31 Naloga 32 Naloga 33 Naloga 34 Naloga 35 Naloga 36 Naloga 37 Naloga 38 5 OSNOVE VZORČENJA Naloga 39 Naloga 40 Naloga 41 Naloga 42 Naloga 43 Naloga 44 Naloga 45 Naloga 46 Naloga 47 Naloga 48 Naloga 49 Naloga 50 Naloga 51 Naloga 52 Naloga 53 6 ČASOVNE VRSTE Naloga 54 Naloga 55 Naloga 56 Naloga 57 Naloga 58 Naloga 59 Naloga 60 Naloga 61 Naloga 62 Naloga 63 Naloga 64 Naloga 65 Naloga 66 7 REŠITVE NALOG 7.1 Urejanje in prikazovanje podatkov 7.2 Deskriptivna statistika 7.3 Teoretične porazdelitve 7.4 Enostavna regresijska analiza 7.5 Osnove vzorčenja 7.6 Časovne vrste OBRAZCI0F 1. del: Urejanje, prikazovanje in analiza podatkov 2. del: Korelacija in regresija 3. del: Časovne vrste 4. del: Osnovni pojmi statističnega sklepanja LITERATURA