Zoran Skoda stat-111120

Uvjetna vjerojatnost

P(A|B) = P(A i B)/P(B)

P(A i B) = P(A|B) P(B)

Bayesova formula

usporedimo P(B|A) = P(A i B)/P(A) = P(A|B) P(B)/P(A)

B = B1 ili B2 ili B3 koji su disjunktni

Primjer. Matija odlazi u dućan svaki dan i kupuje mlijeko i kruh. Odlučuje svaki dan nezavisno koju vrstu će kupiti. Dvije vrste mlijeka: dukat i vindija. Dvije vrste kruha: kukuruzni i raženi. Ako kupuje kukuruzni kruh onda mu obično bolje uz njega paše vindijino mlijeko pa u tom slučaju u 70% kupuje vindijino mlijeko. Ako kupuje raženi kruh onda mu bolje paše dukatovo mlijeko, i onda njega kupuje u 70% slučajeva. U pola slučajeva je kukuruzni kruh, a u pola slučajeva je raženi kruh.

a) Ako znamo da je danas Matija kupio dukatovo mlijeko, kolika je vjerojatnost da je da je danas kupio raženi kruh ?

D i V su suprotni dogadjaji

K, R P(K) = 0.5, P(R) = 0.5

P(V|K) = 0.7, P(D|K) = 0.3

P(D|R) = 0.7, P(V|R) = 0.3

a) P(R|D) = P(R i D)/P(D) = 0.35/0.50 = 0.7 = 70%

P(RiD)=P(D|R)P(R)=0.7×0.5=0.35P(R i D) = P(D|R)P(R) = 0.7 \times 0.5 = 0.35

P(D)=P(D|R)P(R)+P(D|K)P(K)=0.35+0.3×0.5=0.50P(D) = P(D|R)P(R) + P(D|K)P(K) = 0.35 + 0.3\times 0.5 = 0.50

b) Kolika je vjerojatnost da je Matija dva dana za redom kupio raženi kruh, ako znamo da je u ta dva dana kupio različite vrste mlijeka ?

složeni događaj je 1(D i R)2(V i R) + 1(V i R)2(D i R)

uvjet je 1 D 2 V ili 1 V 2 D dvije mogućnosti, vjerojatnosti ćemo zbrojiti

najprije 1(D i R)2(V i R) ako 1 D 2 V

P(R|D) P(R|V)

zatim 1(V i R)2(D i R) ako 1 V 2 D

P(R|V) P(R|D)

Ukupno P(1R2R ako 1V2D ili 1D2V) je jednako

P(R|D)P(R|V)+P(R|V)P(R|D) = 2P(R|D)P(R|V) = 2×0.7×0.3=0.42\array{ P(R|D)P(R|V)+P(R|V)P(R|D)&=& 2 P(R|D)P(R|V) \\ &=& 2 \times 0.7 \times 0.3 = 0.42 }
P(R|V) = P(RiV)/P(V) = P(V|R)P(R)P(V|R)P(R)+P(V|K)P(K) = 0.30.50.30.5+0.70.5 = 0.15/0.50=0.30\array{ P(R|V) &=& P(R i V)/P(V)\\ &=& \frac{P(V|R)P(R)}{P(V|R)P(R) + P(V|K)P(K)}\\ &=& \frac{0.3\cdot 0.5}{0.3\cdot 0.5 + 0.7\cdot 0.5}\\ &=& 0.15/0.50 = 0.30 }

c) Kolika je vjerojatnost da svih 5 radnih dana u jednom tjednu kupuje dukatovo mlijeko (nikakvi uvjeti)

Za jedan dan,

P(D) = P(D|K)P(K)+P(D|R)P(R) = 0.3×0.5+0.7×0.5 = 0.5\array{ P(D) &=& P(D|K)\cdot P(K) + P(D|R)\cdot P(R)\\ &=& 0.3 \times 0.5 + 0.7 \times 0.5\\ &=& 0.5 }

Za pet dana, P(D)×P(D)×P(D)×P(D)×P(D)=0.03125P(D)\times P(D)\times P(D)\times P(D)\times P(D) = 0.03125 ili 3.125%

d) koliko bi bile brojke u c) da su početne brojke P(V|K) = 70% i P(D|R) = 60%

Dakle P(K) = 0.5, P(R) = 0.5

P(V|K) = 0.7, P(D|K) = 0.3

P(D|R) = 0.6, P(V|R) = 0.4

P(D) = P(D|K)P(K)+P(D|R)P(R) = 0.3×0.5+0.6×0.5=0.45\array{P(D) &=& P(D | K) P(K) + P(D | R) P(R)\\ &=& 0.3 \times 0.5 + 0.6 \times 0.5 = 0.45}

a za pet dana ?

0.45×0.45×0.45×0.45×0.45=0.01845=1.8450.45\times 0.45\times 0.45\times 0.45\times 0.45 = 0.01845 = 1.845%

Na nekom OPGu ima 120 svinja i 25 krava od čega je 8 svinja i 3 krava trenutno bolesno. a) Ako nasumce izaberemo jednu životinju i ta je životinja bolesna, kolika je vjerojatnost da je to krava ?

P(B|S)=8/120 P(K)=25/145 P(B|K)=3/25 P(S)=120/145\array{ P(B|S) = 8/120 & P(K) = 25/145\\ P(B|K) = 3/25 & P(S) = 120/145 }

P(K|B) = P(K i B)/P(B)

= P(B|K)P(K)P(B|K)P(K)+P(B|S)P(S) = 3/2525/1453/2525/145+8/120120/145 = 3/11\array{ =& \frac{P(B|K) P(K)}{P(B|K)P(K)+P(B|S)P(S)}\\ =& \frac{3/25 \cdot 25/145}{3/25 \cdot 25/145 + 8/120\cdot 120/145}\\ =& 3/11 }

Kako su sve životinje jednako vjerojatne, to smo mogli i ovako:

P(K|B) = n(K i B)/n(B) = 3/(3+8) = 3/11 = 27.27%

b) Ako nasumce biramo navečer kad se slabo vidi, a kravu se dva put lakše uoči nego svinju kolika je vjerojatnost da je uočena životinja krava ?

krava uočena

P(K|U) = P(K i U)/P(U)

P(S|U) = P(S i U)/P(U)

P(U|K) = 2 P(U|S) = 2 p

Bayes

P(K|U) = P(U|K)P(K)P(U|K)P(K)+P(U|S)P(S) = 2p25/1452p25/145+p120/145 = 50p170p=517\array{P(K|U) &=& \frac{P(U|K)P(K)}{P(U|K)P(K)+P(U|S)P(S)}\\ &=& \frac{2 p 25/145}{2 p 25/145 + p 120/145}\\ &=& \frac{50 p}{170 p} = \frac{5}{17} }

P(S|U)=12/17P(S|U) = 12/17

krave uočene u 5/17 slučajeva umjesto prijašnjih (kad čimbenik uočavanja nije bio prisutan) 25/145 = 5/29

sve oznake se sad odnose na uočene (ne pišemo više U):

P(K|B) = P(K i B)/P(B)

= P(B|K)P(K)P(B|K)P(K)+P(B|S)P(S) = 3/25×5/173/25×5/17+8/120×12/17 = 1525×171525×17+8170 = 6/14=3/7=0.42857=42.857%\array{ =&\frac{P(B|K) P(K)}{P(B|K)P(K)+P(B|S)P(S)}\\ =&\frac{3/25\times 5/17}{3/25\times 5/17 + 8/120\times 12/17}\\ =&\frac{\frac{15}{25\times 17}}{\frac{15}{25\times 17}+\frac{8}{170}}\\ =& 6/14 = 3/7 = 0.42857 = 42.857\% }

Statistički testovi – metode da s nekom sigurnošću naši podaci podržavaju neku slutnju (hipotezu)

NUL hipoteza je hipoteza koju želimo provjeriti.

Suprotni događaj odgovara tzv. alternativnoj hipotezi.

Mi unaprijed odredimo neki kriterij, recimo mi smo zadovoljni ako nam je sigurnost 95% (znači šansa da nije točna je 5%), tu se pojavljuje p-vrijednost (p-value)

χ 2\chi^2-kvadrat test

Dani podaci,

1) dimenzija

2) hi-kvadrat je mjera koliko se očekivani rezultati (oznaka e ie_i (expected values), ili u hrvatskoj literaturi O iO_i, kao očekivane vrijednosti) nul hipoteze kose sa mjerenim rezultatima (frekvencijama) na uzorku

(stvarni - očekivani) na kvadrat
  podijeli s očekivanim 
 i zbroji za sve vrijednosti 

Dakle,

χ 2=Σ i(f iO i) 2O i, \chi^2 = \Sigma_i\frac{(f_i - O_i)^2}{O_i},

gdje ii prolazi kroz sva polja u tablici. Pri tome spajamo kategorije koje imaju O i<5O_i \lt 5.

Ta vrijednost mora biti manja od kritične vrijednosti u tablici za unaprijed zadani nivo sigurnosti koji želimo testirati.

Primjer s engleske wikipedije,

A B C D ukupno W 90 60 104 95 349 B 30 50 51 20 151 N 30 40 45 35 150 ukupno 150 150 200 150 650\array{ & A & B & C & D & ukupno\\ W& 90& 60& 104& 95& 349\\ B& 30& 50& 51& 20& 151\\ N& 30& 40& 45& 35& 150\\ ukupno& 150& 150& 200& 150& 650 }

Tablica očekivanih vrijednosti je

80.5 80.5 107.4 80.5 34.8 34.8 46.5 34.8 34.6 34.6 46.2 34.6\array{ 80.5& 80.5& 107.4& 80.5\\ 34.8& 34.8& 46.5& 34.8\\ 34.6& 34.6& 46.2& 34.6 }

Doprinosi za χ 2\chi^2 su

1.12 5.22 0.11 2.61 0.66 6.64 0.44 6.29 0.61 0.84 0.03 0.00\array{ 1.12& 5.22& 0.11& 2.61\\ 0.66& 6.64& 0.44& 6.29\\ 0.61& 0.84& 0.03& 0.00 }

χ 2=24.6\chi^2 = 24.6

dimenzija = (3-1)(4-1) = 6

Last revised on December 11, 2020 at 17:43:35. See the history of this page for a list of all contributions to it.