Zoran Skoda
statistika jedne slučajne veličine

U vjerojatnosti ne gledamo samo vjerojatnost nego i prosječne vrijednosti slučajnih veličina. Veličina je neki broj, u pripadnim mjernim jedinicama, koji zavisi od nečega, a to nešto nazivamo parametrom. Npr. temperatura ovisi o mjestu i vremenu gdje je mjerimo. Npr. jutros u Zadru na Novom Kampusu je izmjereno 7 stupnjeva Celzijusa. Dakle, temperatura je neka veličina koja zavisi o mjestu i vremenu.

Slučajna veličina (engl. random quantity) je veličina kod koje je barem jedan parametar slučajan, tj. to je veličina koja, između ostalog, zavisi o ishodu nekog slučajnog događaja. Npr. ako u eksperimentu mjerimo visine h 1,h 2,h 3,h 4,h 5h_1,h_2,h_3,h_4,h_5 uzorka od petero djece u centimentrima, tada je recimo njihov zbroj x=h 1+h 2+h 3+h 4+h 5x = h_1 +h_2+h_3 +h_4+h_5 u centimetrima primjer jedne slučajne veličine; taj zbroj ovisi o (jednom) uzorku pa je slučajan. Drugi primjer je zbroj y=h 1 2+h 2 2+h 3 2+h 4 2+h 5 2y = h_1^2+h_2^2+h_3^2+h_4^2+h_5^2 kvadrata mjera djece u centimetrima kvadratnim. xx slučajna veličina koja može poprimiti vrijednosti x 1,x 2,,x nx_1, x_2, \ldots, x_n s nekim vjerojatnostima p 1,p 2,,p np_1, p_2,\ldots, p_n. Barem neka vrijednost se desi pa je ukupna vjerojatnost da se jedna od vrijednosti desi p 1+p 2++p n=1p_1+p_2+\ldots+p_n = 1.

Slučajna veličina je zadana kao pravilo kojim dobijamo broj u nekim jedinicima, a koji zavisi od ishoda eksperimenta. Dakle, slučajna veličina je apstraktno pravilo, a za konkretni eksperiment daje konkretnu vrijednost slučajne veličine. Npr. slučajna veličina “zbroj brojeva na kocki u svih 5 bacanja” za eksperiment 5 bacanje kocke u nekom konkretnom eksperimentu poprima konkretne vrijednosti od 5 (za svih 5 jedinica) do najviše 30 (svih 5 šestica).

Očekivanje E(x)E(x) slučajne veličine xx je definirano kao

E(x)=x 1p 1+x 2p 2++x np n= i=1 nx ip i. E(x) = x_1\cdot p_1 + x_2\cdot p_2 + \ldots + x_n\cdot p_n = \sum_{i=1}^n x_i \cdot p_i.

Simbol EE se uvriježio zbog engleske riječi expectation.

Očekivanje je konstantna, radije nego zaista slučajna, veličina – ona je točno određena vrijednost koju gledamo kao svojstvo (karakteristiku) te veličine. Očekivanje konstantne veličine je jednako toj konstanti jer je vjerojatnost jedine njene vrijednost 11. Dakle je i E(E(x))=E(x)E(E(x)) = E(x),

Očekivanju slučajne veličine se približava srednja vrijednost te veličine u nizu ponovljenih eksperimenata. Dakle, srednja vrijednost x¯\bar{x} neke slučajne veličine nakon mnogo ponavljanja eksperienta se postepeno sve bolje i bolje približava očekivanju te veličine. Naime ako se vrijednost x 1x_1 pojavi f 1f_1 puta, vrijednost x 2x_2 pojavi f 2f_2 puta, …, i vrijednost x nx_n pojavi f nf_n puta (drugim riječima frekvencija pojavljivanja vrijednosti x ix_i u ii-tom eksperimentu je f if_i), tada je ukupno f 1+f 2++f nf_1+f_2+\ldots + f_n puta vršeno mjerenje i srednja vrijednost ili aritmetička sredina je

x¯=x 1f 1+x 2f 2++x nf nf 1+f 2++f n \bar{x} = \frac{x_1 \cdot f_1 + x_2\cdot f_2 +\ldots+ x_n\cdot f_n}{f_1+f_2+\ldots+f_n}

i kako za veliki broj ponavljanja eksperimenta f if 1+f 2++f np i\frac{f_i}{f_1+f_2+\ldots+f_n}\rightarrow p_i to je x¯E(x)\bar{x}\rightarrow E(x).

Možemo ponavljanja uključiti tako da novo ponavljanje x ix_i pišemo kao da je neki novi x ix_{i'} i gledamo samo one vrijednosti koje se pojave u eksperimentu. Tada će frekvencija biti uvijek 11 (ili 00 ali je ne računamo tada). Dakle, formula je tada

x¯=x 1+x 2++x nn \bar{x} = \frac{x_1+x_2+\ldots+x_n}{n}

jer je f 1++f n=1+1++1=nf_1+\ldots+f_n = 1+1+\ldots+1 = n u tom slučaju. Tu formulu interpretiramo (tumačimo) obično malo drukčije: ii obično nije ii-ta mogućnost vrijednosti slučajen varijable xx nego izmjereni rezultat varijable xx u ii-tom ponavljanju eksperimenta.

Ako je x¯\bar{x} srednja vrijednost i x ix_i njena vrijednost u ii-tom ponovljenom eskperimentu, tada je razlika x ibatxx_i - \bat{x} odstupanje ili devijacija od srednje vrijednosti x¯\bar{x}. Neka odstupanja su pozitivni brojevi, a neka negativni. Ako se sva dostupanja statistički zbroje dobijemo nulu. Drugim riječima, srednja vrijednost odstupanja od srednje vrijednosti je nula, tj. xx¯¯=0\overline{x - \bar{x}} = 0. U terminima očekivanja, E(xE(x))=0E(x - E(x)) = 0.

Kako se tako pozitivna i negativna odstupanja ponište, a nas ipak zanima koliko su vrijednosti odstupanja u prosjeku velike (po apsolutnoj vrijednosti) mi ih možemo pretvoriti u pozitivne tako da ih kvadriramo, izračunamo srednju vrijednost tih kvadrata, i onda korjenujemo. Tako ćemo dobiti na novi način usrednjeno odstupanje koje zovemo standardno odstupanje ili standardna devijacija veličine xx, koju označavamo simbolom σ x\sigma_x. Dakle, ako izvodimo eksperiment nn puta, tada je standardna devijacija slučajne veličine xx definirana izrazom

σ x=(x 1x¯) 2+(x 2x¯) 2++(x nx¯) 2n \sigma_x = \sqrt{\frac{(x_1-\bar{x})^2+(x_2-\bar{x})^2 +\ldots+(x_n-\bar{x})^2}{n}}

Izraz ispod znaka kvadratnog korijena nazivamo i varijancom Var(x)=σ x 2Var(x) = \sigma^2_x. Jednako tako u terminima vjerojatnosti,

σ x=(x 1x¯) 2p 1+(x 2x¯) 2p 2++(x nx¯) 2p n \sigma_x = \sqrt{(x_1-\bar{x})^2\cdot p_1 +(x_2-\bar{x})^2\cdot p_2 +\ldots+(x_n-\bar{x})^2\cdot p_n}

Vrijedi

Var(x)=E((xE(x)) 2)=E(x 2)E(x) 2 Var(x) = E((x - E(x))^2) = E(x^2) - E(x)^2

dakle varijanca je razlika očekivanja kvadrata od xx i kvadrata očekivanja od xx. Primijeti da su te dvije veličine različite. Kod rezultata dugog niza eksperimenata, umjesto apstraktnog očekivanja možemo pisati srednju vrijednost iz ostvarenih mjerenja, pa dobivamo Var(x)=x 2¯(x¯) 2Var(x) = \overline{x^2} - (\bar{x})^2.

Primijetmo da taj izraz ne daje nulu. Npr. pretpostavimo da imamo dvije vrijednosti, 11 i 55, i svaka se pojavi jednom. Tada je srednja vrijednost 1+52=3\frac{1+5}{2} = 3, i kvadrat srednje vrijednosti je 3 2=93^2 = 9, a srednja vrijednost kvadrata je 1 2+5 22=262=13\frac{1^2 + 5^2}{2} = \frac{26}{2} = 13 što je veće od 99. Varijanca je u tom slučaju dakle Var=139=4Var = 13-9 = 4, pa je standardno odstupanje σ=4=2\sigma = \sqrt{4} = 2.

Puno primjera izračuna očekivanja, varijance i standardne devijacije tabličnom metodom napravljeni su na satu pa se studentima koji nisu bili na predavanjima preporuča da prepišu i prouče te primjere.

Za slučaj proučavanja zavisnoti dviju slučajnih varijabli pogledaj stranicu linearna regresija.

Last revised on February 22, 2019 at 10:01:01. See the history of this page for a list of all contributions to it.