O primjeni programa Maxima u nastavi predmeta Vjerojatnost i statistika na specijalističkom stručnom studiju graditeljstva
mandi.orlic@tvz.hr
Ključni pojmovi: vjerojatnost, statistika, Maxima, besplatni računalni program
U prvom semestru Politehničkog diplomskog specijalističkog stručnog studija graditeljstva Tehničkog veleučilišta u Zagrebu izvodi se predmet Vjerojatnost i statistika. Cilj tog predmeta je upoznati studente s osnovnim pojmovima vjerojatnosti i metodama za statističku obradu podataka. Fond sati tog predmeta je 15+13+2, od čega je 15 sati predviđeno za predavanja, 13 sati za auditorne vježbe, a 2 sata za laboratorijske vježbe koje se održavaju u računalnom laboratoriju. Teme predviđene nastavnim planom i programom odnose se na: klasičnu definiciju vjerojatnosti, operacije među događajima, uvjetnu i totalnu vjerojatnost, diskretne i kontinuirane slučajne varijable, statističku populaciju i slučajni uzorak, grafičko prikazivanje statističkih podataka, procjenitelje, intervalnu procjenu očekivanja i varijance te testiranje hipoteza. Do ove akademske godine u sklopu laboratorijskih vježbi zadaci su se rješavali pomoću MS Excela. Međutim, kako se od akademske godine 2015./2016. u sklopu predmeta Računarstvo u graditeljstvu, koji se izvodi u prvom semestru preddiplomskog stručnog studija graditeljstva, obrađuje program Maxima, ove akademske godine umjesto MS Excela koristili smo program Maxima. Osim na predmetu Vjerojatnost i statistika Maximu koristimo i u sklopu ostalih matematičkih predmeta koji se izvode na studijima graditeljstva Tehničkog veleučilišta u Zagrebu, o čemu smo pisali u
Računalni program Maxima, besplatni je program koji se može preuzeti na web adresi http://maxima.sourceforge.net/. Općenito, program je pogodan za različite algebarske operacije sa simboličkim i numeričkim izrazima, kao što su deriviranje, integriranje, razvoj u Taylorov red, Laplaceova transformacija, sustavi linearnih jednadžbi, vektori, matrice, statistika itd.
U ovom članku prikazano je kako se pomoću programa Maxima mogu riješiti neki od zadataka koji se obrađuju u sklopu nastave predmeta Vjerojatnost i statistika.
U ovom dijelu rada dan je pregled i opis onih funkcija programa Maxima, koje koristimo u sklopu nastave predmeta Vjerojatnost i statistika. To su funkcije iz paketa descriptive, distrib i stats.
Paket descriptive sadrži funkcije deskriptivne statistike i funkcije za grafički prikaz podataka. Sljedeće funkcije samo su neke od dostupnih funkcija ovog paketa. Njihov argument x može biti lista ili matrica.
∙ | Funkcija mean(x) računa uzoračku aritmetičku sredinu. |
∙ | Funkcija var(x) računa uzoračku varijancu. |
∙ | Funkcija var1(x) računa korigiranu uzoračku varijancu. |
∙ | Funkcija std(x) računa uzoračku standardnu devijaciju. |
∙ | Funkcija std1(x) računa korigiranu standardnu devijaciju. |
∙ | Funkcija histogram(x, opcije) koristi se za izradu histograma. |
Paket distrib sadrži funkcije za izračun vjerojatnosti diskretnih i kontinuiranih univarijatnih modela. Dalje su opisane one funkcije koje se odnose na slučajne varijable s normalnom odnosno binomnom razdiobom.
∙ |
Za slučajnu varijablu s normalnom razdiobom N(m,s) funkcija:
|
||||||||||
∙ |
Za slučajnu varijablu s binomnom razdiobom B(n,p) funkcija:
|
Paket stats sadrži funkcije za izvođenje zaključaka o populaciji na temelju svojstava uzorka.
∙ |
Funkcija test_mean(x,opcije) koristi se za testiranje hipoteza i određivanje intervala povjerenja za očekivanje s poznatom ili nepoznatom varijancom. Argument x može biti lista ili stupac matrice, a odnosi se na jednodimenzionalni slučajni uzorak normalno distribuirane slučajne varijable, dok se pod opcijama mogu unijeti sljedeći podaci:
|
||||||||||||||||||||||||
∙ | Funkcija test_variance(x, opcije) koristi se za testiranje hipoteza te određivanje intervala povjerenja za varijancu. Argument i opcije definiraju se isto kao i kod funkcije test_mean. |
Prije zadavanja bilo koje funkcije iz navedenih paketa potrebno je učitati odgovarajući paket i to jednom od naredbi: load("descriptive")$, load("distrib")$ ili load("stats")$. Unutar jednog radnog lista paket je dovoljno učitati jednom bez obzira koliko se funkcija iz njega poziva. Više o ovim i ostalim funkcijama dostupnim u navedenim paketima može se pronaći u
U ovom poglavlju dani su primjeri zadataka i njihova rješenja koji se rješavaju u sklopu auditornih ("ručnim" putem) i laboratorijskih vježbi (upotrebom računalnog programa) na predmetu Vjerojatnost i statistika. Budući da se zbog ograničena vremena na laboratorijskim vježbama ne stigne u sklopu zadataka ponavljati teorijska podloga, rješavamo iste zadatke kao i na auditornim vježbama. Na taj način ne "trošimo" vrijeme na razumijevanje teksta zadatka i postavljanje problema, već su studenti usmjereni na razumijevanje naredbi programa Maxima i interpretaciju dobivenih rezultata. Najčešći problem s kojim se susrećemo na laboratorijskim vježbama vezan je uz poznavanje sintakse programa odnosno uz ispravan unos početnih podataka i interpretaciju dobivenih rezultata.
Za slučajnu varijablu X∼N(μ,σ2), slučajna varijabla sa standardnom normalnom razdiobom je X∗=X−μσ, a vjerojatnost da normalno distribuirana slučajna varijabla X poprimi vrijednosti unutar segmenta [a,b] je
Podintegralna funkcija f∗(x) je funkciju gustoće vjerojatnosti standardne normalne razdiobe (
Stoga, primjenom formule
U programu Maxima vrijednosti funkcije F∗(x) mogu se izračunati, i to nešto preciznije, na sljedeći način. Najprije izračunamo vrijednosti a−μσ i b−μσ unošenjem naredbi:
(235−250)/sqrt(40),numer;(260−250)/sqrt(40),numer;Nakon što stisnemo zajedno tipke SHIFT+ENTER Maxima će ispisati:
−2.3717082451261.58113883008.Za izračun vrijednosti funkcije F∗ koristimo funkciju cdf_normal(x,m,s), gdje x odgovara vrijednosti X−μσ, m=0 i s=1. U novi red unesemo naredbu za učitanje paketa distrib, a potom zadamo odgovarajuću naredbu.
load(distrib)$cdf_normal(1.58113883008,0,1)−cdf_normal(−2.371708245126,0,1);Kao izlaz zadane naredbe Maxima će ispisati:
0.9342238180929876.Za binomno distribuiranu slučajnu varijablu X∼B(n,p) funkcija vjerojatnosti dana je izrazom
gdje je n proizvoljan prirodan broj, k\leq n prirodan broj i p(0\lt p\lt 1) realan broj (
Vjerojatnost da se pogodi cilj barem 2 puta, uključuje događaje da se cilj pogodi dva ili tri ili četiri,..., ili deset puta. U ovom slučaju jednostavnije je izračunati vjerojatnost suprotnog događaja, koji uključuje događaje da se cilj nije pogodio te da se pogodio jednom. Stoga, primjenom formule
U programu Maxima ovo možemo izračunati unošenjem sljedećih naredbi:
\begin{aligned} & \texttt{load(distrib)}\$ \\ &1-\texttt{pdf_binomial}(0,10,57/100)-\texttt{pdf_binomial}(1,10,57/100),\texttt{numer}; \end{aligned}Izlaz ove naredbe je:
0.9969191072888272\,.Test-statistika
T=\frac{\bar{X}-\mu}{S}\sqrt{n} \sim t(n-1)ima Studentovu t-razdiobu s n-1 stupnjeva slobode. Za određivanje vrijednosti test-statistike potrebno je odrediti aritmetičku sredinu i korigiranu standardnu devijaciju:
\begin{aligned} \bar{x}&=\frac{1}{n}\sum_{i=1}^{m}{x_{i} \cdot f_{i}}=9.9825\\ s^{2}&=\frac{1}{n-1}\sum_{i=1}^{m}\left(x_{i}-\bar{x}\right)^{2}\cdot f_{i}=0.7744 \quad \Rightarrow \quad s=0.87999. \end{aligned}Tada test-statistika iznosi:
t=\frac{\bar{x}-\mu_{0}}{s}\sqrt{n}=\frac{9.9825-9.5}{0.87999}\sqrt{12}=1.8994\,.Digresija: Vrijednosti aritmetičke sredine i standardne devijacije u programu Maxima mogu se izračunati na sljedeći način:
\begin{aligned} & \texttt{load(descriptive)}\$ \\ & \texttt{x:}\left[ 8.65, 9.90, 9.71, 9.60, 9.61, 10.21, 11.29, 9.70, 11.24, 9.10, 11.35, 9.43\right];\\ & \texttt{mean (x);}\\ & \texttt{std1 (x);} \end{aligned}Izlazi ovih naredbi su:
\begin{aligned} &9.9825\\ &0.8799909606973759\,.\\ \end{aligned}Postavljamo hipoteze
\begin{cases} H_{0}:&\mu=9.5\\ H_{1}:&\mu\lt 9.5 \end{cases}Za ovako postavljene hipoteze kritično područje ili područje odbacivanja hipoteze H_{0} je \left[-\infty,t_{\alpha}\right\rangle. Vrijednost t_{\alpha} odredimo iz tablice Studentove t-razdiobe za n-1=11 stupnjeva slobode (vidjeti tablicu u
odnosno kritično područje je \left\langle -\infty, -1.85955 \right\rangle\,. Kako vrijednost test-statistike t ne upada u kritično područje prihvaćamo hipotezu H_{0}, te odbacujemo hipotezu H_{1}, na razini značajnosti od 5\%. Prema tome, možemo reći da stroj ne proizvodi ploče debljine manje od propisanih 9.5 mm.
Zadatak ćemo u programu Maxima riješiti tako da ćemo prvo učitati paket stats, definirat ćemo skup podataka te potom zadati naredbu za lijevi jednostrani test. To činimo na sljedeći način:
Napomena: 'conflevel=0.95 je razina pouzdanosti i njegova vrijednost jednaka je 1-\alpha.
Maxima će rezultat zadane naredbe ispisati u obliku:
Na temelju dobivenih rezultata odgovor o odbacivanju ili prihvaćanju hipoteze H_{0} dajemo na temelju p-vrijednosti testa. Kako na auditornim vježbama, kao što je prethodno prikazano, odgovor o prihvaćanju hipoteze H_{0} dajemo na temelju vrijednosti test-statistike i kritičnog područja te se pojam p-vrijednosti ne spominje, ovdje je potrebno studentima dodatno pojasniti što ona predstavlja.
U slučaju lijevog jednostranog t-testa p-vrijednost jednaka je p=\mathbb{P}\left(T\leq \left.t \right|H_{0}\right), desnog jednostranog testa jednaka je p=\mathbb{P}\left(T \geq \left.t \right|H_{0}\right), dok je kod dvostranog testa p-vrijednost manja od brojeva 2\cdot \mathbb{P}\left(T\leq \left.t \right|H_{0}\right) i 2\cdot \mathbb{P}\left(T \geq \left.t \right|H_{0}\right). Na temelju p-vrijednosti možemo dati sljedeće zaključke:
\bullet | ako je p \leq \alpha, onda se t nalazi u kritičnom području, pa odbacujemo H_{0} na razini značajnosti \alpha, |
\bullet | ako je p \gt \alpha, onda se t ne nalazi u kritičnom području, pa prihvaćamo H_{0} na razini značajnosti \alpha. |
U našem slučaju je p=0.96\gt 0.05, pa stoga hipotezu H_{0} prihvaćamo na razini značajnosti od 0.05.
Interval povjerenja za očekivanje s nepoznatom varijancom i pouzdanošću \gamma je
gdje je t_{\frac{1+\gamma}{2}} kvantil Studentove t-razdiobe s n-1 stupnjeva slobode.
Vrijednost kvantila t_{\frac{1+\gamma}{2}} odredimo iz tablice Studentove t-razdiobe za n-1=11 stupnjeva slobode (vidjeti tablicu u
Tada je interval povjerenja na temelju formule
U programu Maxima interval povjerenja određuje se pomoću naredbe za određivanje dvostranog t-testa. U novi red unesemo naredbu:
\texttt{test_ {m}ean(x,'mean=9.5,'alternative='twosided,'conflevel=0.95);}Maxima će rezultat zadane naredbe ispisati u obliku:
\begin{aligned} & \texttt{MEAN TEST}\\ &\texttt{mean_estimate=9.9825}\\ &\texttt{conf_level=0.95}\\ &\texttt{conf_interval=[9.423380425654932,10.54161957434507]}\\ &\texttt{method="Exact t-test. Unknown variance."}\\ &\texttt{hypotheses="H0: mean = 9.5 , H1: mean} \neq 9.5"\\ &\texttt{statistic}=1.899370679875383\\ &\texttt{distribution}=\texttt{[student_t,11]}\\ &\texttt{p_value}=0.08403989582936022 \end{aligned}Sada je u četvrtom redu ispisan interval povjerenja za očekivanje s nepoznatom varijancom s pouzdanošću od 95\%.
Od akademske godine 2015./2016. na stručnom studiju graditeljstva Tehničkog veleučilišta u Zagrebu računalni program Maxima obrađuje se u sklopu predmeta Računarstvo u graditeljstvu. U posljednje tri godine pokazalo se da ga studenti s lakoćom savladavaju te da ga uspješno primjenjuju u rješavanju zadataka u sklopu ostalih matematičkih predmeta (bilo na nastavi ili samostalno u sklopu seminarskih radova). Iz tog razloga, ali i zato što imamo mali broj sati predviđen za rad na računalu iz predmeta Vjerojatnost i statistika, odlučili smo se koristiti program Maxima, a ne neki, možda, prikladniji program za statističku obradu podataka (R, SPS i sl.).
U ovom trenutku postoje prijedlozi da se broj laboratorijskih vježbi poveća. Na taj način imali bi mogućnost raditi s oba programa, Excelom (kojeg smo do ove godine koristili) i Maximom. Iako se pokazalo da program Maxima u potpunosti zadovoljava sve nastavne potrebe matematičkih predmeta, koji se izvode na studijima graditeljstva, Excel je program koji će studenti u svom budećem poslu koristiti na svakodnevnoj razini i stoga je dobro u što većoj mjeri i u što različitije svrhe koristiti ga u sklopu nastave.
