Zoran Skoda
stat-041220

Razdiobe vjerojatnosti

Predavanje 4.12.2020. (9:15-11:30). Prije ovog predavanja bila su predavanja uživo u petak 27.11. (redovni) i subotu 28.11. (izvanredni) kad se radila binomna i Poissonova razdioba i normalna razdioba. Predavanja tjedan prije toga su bilo online, vidi stat-211120 i matstat-191120. Neke bilješke sa zadacima još od prije su na zadaci vj 1.

Danas smo ponovili općenito o razdiobam i radili nekoliko primjera iz vjerojatnosti.

Razdiobe vjerojatnosti

numerička obilježja: neprekidne (kontinuirane) i diskretne

kategorijska obilježja (kvalitativna obilježja)

X i P i kumulativnaP X iP i X iX¯ i (X iX¯)P i (X iX¯) 2P(X) 10 0.45 0.45 4.50 10.47 4.7115 49.3294 12 0.12 0.57 1.44 8.47 1.0164 8.6089 24 0.10 0.67 2.40 +3.53 +0.3530 1.2461 36 0.08 0.75 2.88 +15.53 +1.2424 19.2945 37 0.25 1.00 9.25 +16.53 +4.1325 68.3102 20.47 0 146.7891\array{ X_i & P_i & kumulativnaP & X_i \cdot P_i & X_i -\bar{X}_i &(X_i-\bar{X})P_i & (X_i-\bar{X})^2 \cdot P(X) \\ 10 & 0.45 & 0.45 & 4.50 &-10.47 & -4.7115& 49.3294\\ 12 & 0.12 & 0.57 & 1.44 &- 8.47 & -1.0164 & 8.6089\\ 24 & 0.10 & 0.67 & 2.40 &+ 3.53 & +0.3530 & 1.2461\\ 36 & 0.08 & 0.75 & 2.88 &+15.53 &+1.2424 &19.2945\\ 37 & 0.25 & 1.00 & 9.25 &+16.53 & +4.1325 &68.3102\\ & & & 20.47 & & 0 & 146.7891 }

srednja vrijednost = 20.47

Varijanca = i(X iX¯) 2P i=146.7891= \sum_i (X_i - \bar{X})^2 P_i = 146.7891

standardna devijacija =Varijanca=12.11=\sqrt{Varijanca}=12.11

srednja vrijednost = iX i(f i/n)= iX ip i= \sum_i X_i (f_i/n) = \sum_i X_i p_i

n= if i n = \sum_i f_i

kumulativna vjerojatnost za neku vrijednost aa numeričkog obilježja XX je P(Xa)P(X \leq a)

Kod neprekinutih obilježja imamo gustoću vjerojatnosti! Naime veličinu u nekom malom intervalu kojem pripada xx, na primjer

P(x<X<x+0.1)=kumulativnaP(x+0.1)kumulativnaP(x)P(x\lt X\lt x+0.1) = kumulativnaP(x + 0.1)-kumulativnaP(x)

podijelimo s širinom tog intervala, u ovom primjeru 0.10.1, dakle

kumulativnaP(x+0.1)kumulativnaP(x)0.1 \frac{kumulativnaP(x + 0.1)-kumulativnaP(x)}{0.1}

To je gustoća u tom malom intervalu, pa ako je interval mali, onda je to gustoća oko xx.

Populacija i uzorak

populacija – svi za koje gledamo statističku karakteristiku

uzorak populacije je manji dio populacije preko kojeg želimo procijeniti (engl. estimate) veću populaciju

Razlikujemo dvije vrste varijance

Varijanca (cijele) populacije (population variance)

Varijanca uzorka (sample variance)

Pravilo: u formuli varijance itd. kod populacije u formuli za varijancu uvijek dijelimo s nn a kod uzorka s n1n-1. Mi ćemo u testovima uvijek dijeliti s nn, no u praksi (recimo diplomskom ispitu) treba paziti na ovu distinkciju.

Zadataka s testa s normalnom razdibom

Ovo je bio zadatak 7 na testu iz statistike za razrednu nastavu u god. 2018/2019.

Mjerimo koliko je palo kiše u selu Imbriovcu svakog ljeta. Ako pretpostavimo da je razdioba količine kiše po godinama dana normalnom raz-diobom sa srednjom vrijednošću 280 mm po kvadratnom metru, i standardnom devijacijom 60 mm, kolika je vjerovatnost

a) da će u zadanoj godini biti ispod 200 mm kiše ?

b) da ́ce dvije godine za redom svake biti ispod 200 mm kiše ?

c) da će u zadanoj godini biti iznad 300 mm kiše ?

d) da će u zadanoj godini biti izmedju 250 i 300 mm kiše ?

Rješenje:

U oznakama za normalnu razdiobu, srednja vrijednost je μ=280\mu = 280 te je standardna devijacija σ=60\sigma = 60.

(varijabla XX)

x=200x = 200, z=xμσ=20028060=1.33z = \frac{x-\mu}\sigma = \frac{200-280}{60} = -1.33

a) P(X< 200)=P(Z< -1.33)=Phi(-1.33)=.0918 =9.18%

b) P(A i B) = P(A) puta P(B) jer su nezavisni događaji

P(2 godine za redom < 200 mm) = 0.0918\cdot 0.0918= 0.0084 = 0.84%

c) P(X>300)=1P(X300)P(X \gt 300) = 1- P(X\leq 300)

=1Φ((300280)/60)=1Φ(0.33)=10.6293=0.3707=37.07%= 1 - \Phi((300-280)/60) = 1 - \Phi(0.33) = 1-0.6293 = 0.3707 = 37.07\%

d) P(250<X300)=P(X300)P(X250)P(250\lt X\leq 300) = P(X\leq 300)-P(X\leq 250)

=0.6293P(Z(250280)/60)=0.62930.3085=0.3208=32.08%= 0.6293 - P(Z\leq (250-280)/60) = 0.6293 - 0.3085 = 0.3208 = 32.08\%
Zadatak s uvjetnom vjerojatnošću

Bacamo novčić nekoliko puta i ustanovimo da se kuna pojavljuje češće nego slavuj.

Neka je razdioba za jedno bacanje dana tako da je p(S) = 0.4, p(K) = 0.6.

a) Ako znamo da je u tri bacanja slavuj bio 2 puta, kolika je vjerojatnost da je to bilo u prva dva bacanja ?

b) Ako znamo da je u tri bacanja slavuj bio barem 2 puta, kolika je vjerojatnost da je dva puta bio slavuj već u prva dva bacanja ?

Rješenje. Najprije označimo događaje

Događaj A: da je u tri bacanja 2 puta bio slavuj

B: da je u prva dva bacanja bio slavuj

Uvjetna vjerojatnost je definirana kao

P(B|A)=P(BiA)P(A) P(B|A) = \frac{P(B\,i\,A)}{P(A)}

dakle,

P(B|A)=P(SSK)P(SSKiliSKSiliKSS)=0.0960.288=0.33 P(B|A)= \frac{P(SSK)}{P(SSK\,\,ili\,\,SKS\,\,ili\,\,KSS)} = \frac{0.096}{0.288} = 0.33

(isti rezultat kao da je bio pravedan novčić!)

P(SSK)=P(1S)P(2S)P(3K)=0.40.40.6=0.096P(SSK) = P(1S)P(2S)P(3K) = 0.4\cdot 0.4\cdot 0.6= 0.096

P(SSKiliSKSiliKSS)=30.096=0.288P(SSK\,\,ili\,\,SKS\,\,ili\,\,KSS) = 3\cdot 0.096 = 0.288

b) Definirajmo događaj A˜\tilde{A}: da je u tri bacanja najmanje dva puta bio slavuj.

P(B|A˜) = 0.096P(SSKiliSKSiliKSSiliSSS) = 0.0960.288+0.064=0.0960.352 = 0.2727=27.27%\array{ P(B| \tilde{A}) &=& \frac{0.096}{P(SSK\,\,ili\,\,SKS\,\,ili\,\,KSS\,\,ili\,\,SSS)} \\ &=& \frac{0.096}{0.288+0.064}=\frac{0.096}{0.352} \\ &=& 0.2727= 27.27\% }

za pravedan novcic je 1/4 = 0.25=25%

P(SSS)=0.4×0.4×0.4=0.064 P(SSS) = 0.4\times 0.4\times 0.4=0.064
Princip uključivanja-isključivanja

(engl. inclusion-exclusion principle)

C, D, E događaji

P(C ili D) = P(C) + P(D) - P(C i D)

P(C ili D ili E) = P(C) + P(D) + P(E) - P(C i D) - P(D i E) - P(C i E) + P(C i D i E)

svaki dio trebamo brojiti točno jednom, ni više ni manje!

Last revised on January 21, 2021 at 19:59:35. See the history of this page for a list of all contributions to it.