P(A|B) = P(A i B)/P(B)
P(A i B) = P(A|B) P(B)
Bayesova formula
usporedimo P(B|A) = P(A i B)/P(A) = P(A|B) P(B)/P(A)
B = B1 ili B2 ili B3 koji su disjunktni
Primjer. Matija odlazi u dućan svaki dan i kupuje mlijeko i kruh. Odlučuje svaki dan nezavisno koju vrstu će kupiti. Dvije vrste mlijeka: dukat i vindija. Dvije vrste kruha: kukuruzni i raženi. Ako kupuje kukuruzni kruh onda mu obično bolje uz njega paše vindijino mlijeko pa u tom slučaju u 70% kupuje vindijino mlijeko. Ako kupuje raženi kruh onda mu bolje paše dukatovo mlijeko, i onda njega kupuje u 70% slučajeva. U pola slučajeva je kukuruzni kruh, a u pola slučajeva je raženi kruh.
a) Ako znamo da je danas Matija kupio dukatovo mlijeko, kolika je vjerojatnost da je da je danas kupio raženi kruh ?
D i V su suprotni dogadjaji
K, R P(K) = 0.5, P(R) = 0.5
P(V|K) = 0.7, P(D|K) = 0.3
P(D|R) = 0.7, P(V|R) = 0.3
a) P(R|D) = P(R i D)/P(D) = 0.35/0.50 = 0.7 = 70%
b) Kolika je vjerojatnost da je Matija dva dana za redom kupio raženi kruh, ako znamo da je u ta dva dana kupio različite vrste mlijeka ?
složeni događaj je 1(D i R)2(V i R) + 1(V i R)2(D i R)
uvjet je 1 D 2 V ili 1 V 2 D dvije mogućnosti, vjerojatnosti ćemo zbrojiti
najprije 1(D i R)2(V i R) ako 1 D 2 V
P(R|D) P(R|V)
zatim 1(V i R)2(D i R) ako 1 V 2 D
P(R|V) P(R|D)
Ukupno P(1R2R ako 1V2D ili 1D2V) je jednako
c) Kolika je vjerojatnost da svih 5 radnih dana u jednom tjednu kupuje dukatovo mlijeko (nikakvi uvjeti)
Za jedan dan,
Za pet dana, ili 3.125%
d) koliko bi bile brojke u c) da su početne brojke P(V|K) = 70% i P(D|R) = 60%
Dakle P(K) = 0.5, P(R) = 0.5
P(V|K) = 0.7, P(D|K) = 0.3
P(D|R) = 0.6, P(V|R) = 0.4
a za pet dana ?
%
Na nekom OPGu ima 120 svinja i 25 krava od čega je 8 svinja i 3 krava trenutno bolesno. a) Ako nasumce izaberemo jednu životinju i ta je životinja bolesna, kolika je vjerojatnost da je to krava ?
P(K|B) = P(K i B)/P(B)
Kako su sve životinje jednako vjerojatne, to smo mogli i ovako:
P(K|B) = n(K i B)/n(B) = 3/(3+8) = 3/11 = 27.27%
b) Ako nasumce biramo navečer kad se slabo vidi, a kravu se dva put lakše uoči nego svinju kolika je vjerojatnost da je uočena životinja krava ?
krava uočena
P(K|U) = P(K i U)/P(U)
P(S|U) = P(S i U)/P(U)
P(U|K) = 2 P(U|S) = 2 p
Bayes
krave uočene u 5/17 slučajeva umjesto prijašnjih (kad čimbenik uočavanja nije bio prisutan) 25/145 = 5/29
sve oznake se sad odnose na uočene (ne pišemo više U):
P(K|B) = P(K i B)/P(B)
Statistički testovi – metode da s nekom sigurnošću naši podaci podržavaju neku slutnju (hipotezu)
NUL hipoteza je hipoteza koju želimo provjeriti.
Suprotni događaj odgovara tzv. alternativnoj hipotezi.
Mi unaprijed odredimo neki kriterij, recimo mi smo zadovoljni ako nam je sigurnost 95% (znači šansa da nije točna je 5%), tu se pojavljuje p-vrijednost (p-value)
-kvadrat test
Dani podaci,
1) dimenzija
2) hi-kvadrat je mjera koliko se očekivani rezultati (oznaka (expected values), ili u hrvatskoj literaturi , kao očekivane vrijednosti) nul hipoteze kose sa mjerenim rezultatima (frekvencijama) na uzorku
(stvarni - očekivani) na kvadrat
podijeli s očekivanim
i zbroji za sve vrijednosti
Dakle,
gdje prolazi kroz sva polja u tablici. Pri tome spajamo kategorije koje imaju .
Ta vrijednost mora biti manja od kritične vrijednosti u tablici za unaprijed zadani nivo sigurnosti koji želimo testirati.
Primjer s engleske wikipedije,
Tablica očekivanih vrijednosti je
Doprinosi za su
dimenzija = (3-1)(4-1) = 6
Last revised on December 11, 2020 at 17:43:35. See the history of this page for a list of all contributions to it.