Binaarse tunnuse tõenäosuste graafik
Graafikule on lisatud usalduspiirid tõenäosusele leida sesoonsest proovist mingit meid eriliselt huvitavat põhjalooma.
Valimis on selle liigi arvukuse tunnuseks VaA, teisendame kõigepealt tunnuse binaarseks, nimega eriline, selleks on R käsk as.numeric(I...), sellega kõik VaA, mis on suuremad kui 0 (ehk neid leiti), saavad väärtuse 1. Lihtsalt I annab väärtusteks TRUE ja FALSE, millega ei saa aga sagedustabelit teha.
Andmed failist badom_v6rts.csv
eriline<-as.numeric(I(VaA>0))
a<-barplot(prop.table(table(eriline,sesoon),2)[2,]*100, ylim=c(0,100),col=c("green","orange","white"),
main="Erilise bentose olemasolu sesoonselt", ylab="Tõenäosus %")
# usalduspiiride arvutamine, R teeb selle sagedustabeli 1. ehk 0 (ei leidunud) jaoks
lim1 <- binom.test(table(eriline[sesoon=="kevad"]))$conf.int*100
lim2 <- binom.test(table(eriline[sesoon=="suvi"]))$conf.int*100
lim3 <- binom.test(table(eriline[sesoon=="talv"]))$conf.int*100
# olemasolu ehk väärtuse 1 tõenäosus on 100-mitteleidumise oma
arrows(a, 100-c(lim1[1], lim2[1], lim3[1]),
a, 100-c(lim1[2], lim2[2], lim3[2]),
code=3, angle=90, col="gray40", lwd=2)
Selgitus esimese omistamise kohta:
prop.table(table(varia,sesoon),2)- tellime tingliku jaotuse 2.faktori, ehk sesooni suhtes.
[2,]*100 - selle osa lisamisega võtame joonisele need sagedused, mille korral liik esines, ehk siis sagedustabeli 2.rida. Numbrite järjekorras, 1 on pärast 0! Korrutame suhtelise sageduse 100ga, et saaksime joonise protsentides, sama kehtib ka usalduspiiride arvutamise käsu juures.
Mis me näitegraafiku põhjal järeldame?
Meie valimi põhjal võib ötelda, et antud liigi leidmise tõenäosus on sesooniti ühesugune, 50% ringis. Suvel on küll madalam, kuid usalduspiirid on laiad ja statistilist erinevust ei saa tõestada. Vajalik testi tegemine.
Märkus. See konstruktsioon on algajale väga keeruline teha, vajab hästi süvenemist ja sagedustabeli uurimist. Jälgida tuleb faktori nivoode arvu, meie näite puhul oli neid 3.
Eelmine Järgmine