Izracunavanje i primjena normalne slučajne varijable u kemiji

Branka Gotovac,^{1} Sanja Tipurić-Spužević,^{2} Danijela Marić (student)^{3},


Leonardo Pavlović (student)^{4}

^{1}Kemijsko-tehnološki fakultet, Sveučilište u Splitu, gotovac@ktf-split.hr
^{2}Kemijsko-tehnološki fakultet, Sveučilište u Splitu, stspuzevic@ktf-split.hr ,
^{3}Kemijsko-tehnološki fakultet, Sveučilište u Splitu, dm16293@mak.ktf-split.hr ,
^{4}Kemijsko-tehnološki fakultet, Sveučilište u Splitu, lp16065@ktf-split.hr 

 


 

Sažetak

U ovom radu je pokazana primjena normalne slučajne varijable u kemiji i izračun vjerojatnosti iste uporabom dostupnih programskih paketa GeoGebra i Symbolab, čime se računanje višestruko ubrzava i smanjuje se mogućnost pogreške.



1Uvod

Veliki broj pojava u prirodi, kao i mnogi proizvodni procesi, odvijaju se uz bitnu prisutnost raznih slučajnih varijabli. Također, pri analizi in ženjerskih procesa mnoge varijable i inženjerski procesi mogu biti definirani kao slučajne varijable, poglavito u kemiji. Slučajne varijable su funkcije koje imaju realne vrijednosti i koje predstavljaju preslikavanje iz prostora slučajnih vrijednosti S u prostor realnih brojeva \textbf{R}. Slučajne varijable mogu biti diskretne, kao broj sušnih i kišnih dana u nekom periodu, ili kontinuirane, kao što su protok, intenzitet ki še, koncentracija i slično.Diskretne slučajne varijable povezane su s prebrojavanjem u nekom pokusu. One primaju konačan skup vrijednosti (ili možda beskonačan, ali je tada nužno prebrojiv i diskretan). Međutim, u pokusima se prirodno javlja i mjerenje. Skup brojeva kojima se zapisuju rezultati mjerenja nije ni konačan niti diskretan, već neki interval u skupu realnih brojeva. Na primjer slučajna varijabla koja mjeri postotak neke tvari u nekoj smjesi teoretski može primiti svaku vrijednost intervalu [0,100], a slučajna varijabla koja mjeri relativni udio neke tvari u nekoj smjesi može primiti svaku vrijednost u intervalu [0,1]. Takve slučajne varijable, koje poprimaju vrijednosti na nekom intervalu, nazivamo kontinuiranim. Poznavanje niza mogućih vrijednosti slučajne varijable ne daje dovoljnu osnovu za praktički potrebne ocjene. Na primjer, ako treba ocijeniti temperaturu zadane količine plina, a u tu svrhu se nudi samo niz podataka o mogućim brzinama njegovih molekula, tada je naravno, prvo pitanje kako se često javlja svaka od tih brzina. Drugim riječima, treba, što je samo po sebi razumljivo, saznati kolika je vjerojatnost nastupanja svake od mnogih vrijednosti promatrane slučajne varijable. Isto tako, ako su poznate vjerojatnosti raznih mogućih vrijednosti slučajne varijable, znat će se i kako se često očekuje nastupanje njenih povoljnih i nepovoljnih vrijednosti, a to je očigledno dovoljno za ocjenu efikasnosti ili kvalitete kemijskog procesa.

Zbog toga, za slučajnu varijablu vežemo još i pojmove razdioba slučajne varijable, očekivanje slučajne varijable i varijanca. Sve su ovo pojmovi koji su vrlo korisni u inženjerskim procesima, ali s druge strane nekome tko nije primarno matematičar mogu biti teški za izračunati.

Cilj ovoga rada je pokazati primjena kontinuirane slučajne varijable u kemiji i izračun vjerojatnosti iste uporabom dostupnih programskih paketa, čime se računanja višestruko ubrzava i smanjuje se mogućnost pogreške. Za takve izračune se mogu koristiti besplatni programski paketi GeoGebra i Symbolab, koji su vrlo jednostavni za korištenje kad je slučajna varijabla u pitanju. Isto tako ova dva programska paketa omogućavaju provjeru podataka dobivenih izračunom, te detaljnu analizu i međusobnu usporedbu dobivenih rezultata.

Početni dio rada daje čvrstu teorijsku bazu o slučajnoj varijabli. Iskustvo pokazuje da korištenje programske podrške, bez čvrsto utemeljenog znanja statistike i vjerojatnosti, rezultira nekvalitetnim statističkim obradama. Stoga je rad usmjeren na teoriju, konkretnu primjenu i uporabu programskih paketa.



2Pojam kontinuirane slučajne varijable i njene razdiobe

Slučajna varijabla je numerički ishod slučajnog pokusa. Neka je S skup svih ishoda u nekom pokusu. Prema [2]  i [7] vrijedi sljedeće



Definicija 1. Slučajna varijabla X je kontinuirana ako skup njezinih vrijednosti č ini interval brojeva. Slučajnu varijablu ćemo označavati s velikim slovima. Za kontinuiranu slučajnu varijablu se računa vjerojatnost da poprimi vrijednosti u nekom intervalu.



Definicija 2. Funkcija gustoće vjerojatnosti kontinuirane slučajne varijable X je funkcija f(x) takva da za bilo koja dva broja x_{1} i~x_{2} vrijedi


\int_{x_{1}}^{x_{2}}f(x)dx=P(x_{1}\leq X\leq x_{2}),

odnosno pomoću funkcije gustoće vjerojatnosti, zapravo računamo vjerojatnost da slučajna varijabla X poprimi vrijednost unutar intervala \left[ x_{1},x_{2}\right].


Vjerojatnost da X poprimi vrijednost unutra intervala \left[ x_{1},x_{2}\right] dana je površinom ispod funkcije gustoće vjerojatnosti nad segmentom \left[ x_{1},x_{2}\right].
Pri tom f(x) zadovoljava sljedeća svojstva:

 
[\bullet] f(x)\geq0, za sve realne x,
 
 
[\bullet] \int_{-\infty}^{+\infty}f(x)dx=1


Dakle, svaka ovakva funkcija definira neku razdiobu vjerojatnosti kontinuirane slučajne varijable. Iako ima puno takvih funkcija f, nas u praksi zanima samo nekoliko takvih funkcija.



Primjer 3. Pokažimo da je funkcija definirana izrazom

f(x) = \left\lbrace \begin{array}{l@ {,}l} \cos x & x\in \langle 0, \frac{\pi}{2} ] \\ 0 & x \notin \langle 0, \frac{\pi}{2} ] \end{array} \right.


funkcija gustoće vjerojatnosti neke kontinuirane slučajne varijable X. Odrediti

P(\frac{\pi}{4}\lt X\leq\frac{\pi}{2}).


Iz definicije funkcije f očito je da se radi o nenegativnoj funkciji:

-
na intervalu \langle 0, \frac{\pi}{2} ] je f(x)=\cos x, a funkcija kosinus je na tom intervalu pozitivna
 
-
na \langle -\infty, 0 ] \cup \langle\frac{\pi}{2}\rangle je f(x)=0.


Pokažimo da je funkcija f normirana:


 

\int_{-\infty }^{+\infty }f(x)dx=\int_{-\infty }^{0}f(x)dx+\int_{0}^{\frac{\pi }{2}}f(x)dx+\int_{\frac{\pi }{2}}^{+\infty }f(x)dx=\int_{0}^{\frac{\pi }{2}}\cos xdx=1

Budući je funkcija f nenegativna i normirana, zaključujemo da može poslužiti kao funkcija gustoće neprekidne slučajne varijable.

Traženu vjerojatnost računamo na sljedeći način:


 

P(\frac{\pi }{4}\lt X\leq \frac{\pi }{2})=\int_{\frac{\pi }{4}}^{\frac{\pi }{2}}f(x)dx=\int_{\frac{\pi }{4}}^{\frac{\pi }{2}}\cos xdx=\left. \sin x\right\vert _{\frac{\pi }{4}}^{\frac{\pi }{2}}=\sin (\frac{\pi }{2})-\sin (\frac{\pi }{4})=1-\frac{\sqrt{2}}{2}=0.293.

Vjerojatnost u prethodnom primjeru smo mogli izračunati, jer je pripadna funkcija gustoće f imala primitivnu funkciju, pa se računanje integrala svelo na oduzimanje dviju vrijednosti primitivne funkcije. Zaključujemo da bi nam bilo dobro uvijek znati primitivnu funkciju funkcije f, stoga definirajmo pojam funkcije distribucije.



Definicija 4. Funkcija distribucije kontinuirane slučajne varijable X je funkcija F\colon\mathbb{R}\rightarrow [0,1] definirana formulom

F(x)\colon=P(X\leq x)=\int_{-\infty}^{x}f(t)dt.

Vrijednost funkcije razdiobe u točki x jednaka je površini ispod krivulje funkcije gustoće do točke x.


Ako znamo F možemo izračunati vjerojatnost da slučajna varijabla pripada pojedinom intervalu. Vrijedi:


 

F(x_{2})-F(x_{1})=\int_{-\infty}^{x_{2}}f(x)dx-\int_{-\infty}^{x_{1}}f(x)dx=
=\int_{x_{1}}^{x_{2}}f(x)dx
\dots=P\lbrace x_{1}\leq X \leq x_{2}\rbrace


Definicija 5. Matematičko očekivanje ili srednja vrijednost kontinuirane slučajne varijable X je definirano kao

E(x)=\int_{-\infty}^{+\infty}xf(x)dx,

ukoliko ovaj integral postoji. Očekivanje još označujemo sa \mu.



Definicija 6. Varijanca ili rasipanje kontinuirane slučajne varijable X je definirano kao

E(x)=\int_{-\infty}^{+\infty}(x-\mu)^{2}f(x)dx,

ukoliko ovaj integral postoji. Varijancu još označujemo s \sigma^{2}.



Definicija 7. Standardna devijacija ili odstupanje \sigma neprekidne varijable X se definira kao korijen iz varijance tj.

\sigma=\sqrt{V(x)}.



3Normalna razdioba

To je najvažnija razdioba među svim kontinuiranim razdiobama, ali i među svim razdiobama općenito. To je posljedica spoznaje koja ima fundamentalno značenje u izučavanju slučajnih pojava odnosno fenomena u prirodi. Naime, većina se slučajnih pojava u prirodi odnosno u realnom svijetu koji nas okružuje asimptotski ponaša po normalnoj razdiobi. Tu razdiobu imaju i mnoge slučajne varijable koje nastaju u praksi, primjerice slučajna varijabla koja registrira grešku pri mjerenju, koja registrira rezultat mjerenja (npr. mase, visine, postotka, inteligencije, \dots), koja registrira rezultate pri dobro odmjerenom pismenom ispitu itd. Tako se na temelju teorije koja je razvijena za normalnu razdiobu dobivaju dobre prognoze o ponašanju te slučajne pojave u budućnosti. Prema [5] i [2] vrijede sljedeće definicije:



Definicija 8. Za kontinuiranu slučajnu varijablu X s pripadnom funkcijom gustoće

f(x))=\frac{1}{\sigma\sqrt{2\pi}}e^{\frac{(x-\mu)^{2}}{2\sigma^{2}}}, x\in\mathbb{R}

kažemo da ima normalnu ili Gaussovu razdiobu s parametrima \mu i \sigma^{2}.


Za normalnu razdiobu koristimo oznaku


 

X\thicksim N(\mu,\sigma^{2})

Graf funkcije gustoće vjerojatnosti za normalnu razdiobu naziva se normalna ili Gaussova krivulja (Slika 1.).

Slika 1: Slika 1.

Vidimo da je graf zvonolika krivulja, simetrična obzirom na \mu.

Graf se mijenja u ovisnosti o parametrima \mu i \sigma, gdje \mu određuje središte razdiobe, \sigma koliko su podaci raspršeni (Slika 2.).

Slika 2: Slika 2.

Parametar \mu normalne razdiobe jednak je njenom matematičkom očekivanju E(X), a parametar \sigma ^{2} jednak je njenoj varijanci V(X).

Funkcija razdiobe normalne varijable X\thicksim N(\mu ,\sigma ^{2}) je


 

F(x))=\frac{1}{\sigma\sqrt{2\pi}}\int_{-\infty}^{x}e^{-\frac{(x-\mu)^{2}}{2\sigma^{2}}}dt

Gornji integral se ne može izraziti preko elementarnih funkcija. Stoga se koriste tablice. Vrijednost gornjeg integrala ovisi o parametrima normalne razdiobe, te bi stoga za svaki par parametara trebala posebna tablica.

Međutim dovoljno je gledati samo jedan par parametara.

Uzmimo parametre \mu=0, \sigma=1. Njima je zadana jedinična normalna razdioba Z\thicksim N(0,1) s pripadnom funkcijom gustoće


 

\varphi(z)=\frac{1}{\sqrt{2\pi}}e^{\frac{z^{2}}{2}}.

Primijetimo da se varijabla jedinične normalne razdiobe u pravilu označuje sa z. Funkcija gustoće jedinične normalne razdiobe je parna funkcija, te je njezin graf simetričan obzirom na os y.

Funkcija razdiobe slučajne varijable Z\thicksim N(0,1) se označava sa \Phi


 

\Phi=\frac{1}{\sqrt{2\pi}}\int_{-\infty}^{z}e^{-\frac{t^{2}}{2}}dt

i njene vrijednosti su dane u tablicama (prilog 1.). Zbog simetrije grafa funkcije gustoće imamo da je \Phi(0)=0.5.

što ako slučajna varijabla ima normalnu razdiobu različitu od standardne? Tu nam pomaže sljedeći teorem:



Teorem 9. Neka je Z\thicksim N(0,1) proizvoljna normalna varijabla. Tada Z\colon =\frac{X-\mu }{\sigma } ima jediničnu normalnu razdiobu.


Teorem 1. nam omogućava da računanje normalne razdiobe svedemo na računanje jedinične normalne razdiobe.

Pokažimo sada na primjeru primjenu kontinuirane slučajne varijable u kemiji.



Primjer 10. Priprava poli(vinil-alkohola) (PVAL) provodi se hidrolizom, tj. alkoholizom poli(vinil-estera) kao što je poli(vinil-acetat) (PVAC), najčešće u lužnatom mediju uz dodatak alkohola (npr. metanola). Pri normalnim uvjetima doseg reakcije je oko 90\%. Trajanje alkoholize je normalna slučajna varijabla čije je očekivanje 2 sata za postizanje navedene konverzije, a standardna devijacija 7 minuta. Izračunajte vjerojatnost sljedećih događaja:


a)
Alkoholiza PVAL-a trajati će točno 1 sat i 45 minuta
 
b)
Alkoholiza PVAL-a trajati će dulje od 122 minute
 
c)
Alkoholiza PVAL-a trajati će kraće od 117 minuta
 
d)
Alkoholiza PVAL-a trajati će između 110 i 130 minuta


Rješenje:
1. Primjena programskog paketa GeoGebra
Primjer ćemo prvo riješiti pomoću matematičkog alata GeoGebra. GeoGebra je program kojeg je moguće koristiti bez prethodne instalacije, jednostavnim upisivanjem pojma GeoGebra u Google. Nakon upisivanja, potrebno je kliknuti na Klasična GeoGebra gdje se otvara sučelje koje je prikazano na Slici 3. U izborniku s desne strane kliknuti na Vjerojatnost, a nakon otvaranja novog prozora, u padajućem izborniku potrebno je odabrati opciju Normalna što je vidljivo na Slici 4.

Slika 3: Slika 3.


Slika 4: Slika 4.

Na Slici 3. vidimo da najprije treba unijeti vrijednost za matematičko očekivanje \mu i standardnu devijaciju \sigma . U našem primjeru je trajanje alkoholize je normalna slučajna varijabla čije je očekivanje 2 sata, pa za \mu stvaljamo 120 (odnosi se na 120 minuta) i standardna devijacija 7 minuta, pa za \sigma stavljamo 7.

U zadatku pod a) pitanje je kolika je vjerojatnost da će alkoholiza PVAL-a trajati će točno 1 sat i 45 minuta, stoga je potrebno izabrati Interval, a potom unijeti vrijednost 105 slijeva i zdesna (Slika 3.).



Napomena 11. Dobivena vjerojatnost iznosi 0, a razlog leži u činjenici da se kod kontinuiranih varijabli vjerojatnost pridružuje intervalima realnih brojeva, a vjerojatnost pridružena pojedinačnim vrijednostima je jednaka 0.


Slika 5: Slika 5.

U zadatku pod b) pitanje je kolika je vjerojatnost da će alkoholiza PVAL-a trajati dulje od 122 minute, stoga je potrebno izabrati Jednostrani desni interval, a potom unijeti vrijednost 122 (Slika 5.). Dobivena vjerojatnost iznosi 0.3875.

Slika 6: Slika 6.

U zadatku pod c) pitanje je kolika je vjerojatnost da će alkoholiza PVAL-a trajati kraće od 117 minuta, stoga je potrebno izabrati Jednostrani lijevi interval, a potom unijeti vrijednost 117 (Slika 7.). Dobivena vjerojatnost iznosi 0.3341.

Slika 7: Slika 7.

U zadatku pod d) pitanje je kolika je vjerojatnost da će alkoholiza PVAL-a trajati između 110 i 130 minuta, stoga je potrebno izabrati Interval, a potom unijeti vrijednost 110 slijeva i vrijednost 130 zdesna (Slika 8.). Dobivena vjerojatnost iznosi 0.8469.

Slika 8: Slika 8.

2. Numeričko rješavanje:


a) P(X=105)=0 (pogledati Napomenu 1.)


b)


 

P(X\gt 122)=1-P(X\leq 122)
1-\Phi(\frac{122-120}{7})=1-\Phi(\frac{2}{7})
1-\Phi(0.29)=1-0.6141=0.3859


Napomena 12. ovdje se mora koristiti formula suprotne vjerojatnost, odnosno mora se ra čunati po formuli P(X\gt A)=1-P(X\leq A^{C}).


U drugom redu je vidljivo da smo računanje normalne razdiobe sveli na ra čunanje jedinične normalne razdiobe, uvođenjem varijable Z\colon=\frac{X-\mu}{\sigma}. Vrijednost \Phi(0.29) tražimo u tablicama, tako što prvo u prvom stupcu tablice pronadjemo vrijednost 0.2, a zatim u tom retku pronadjemo stupac sa vrijednošću 9 (Slika 9.)


Slika 9: Slika 9.

c)


 

P(X\lt 117)=\Phi(\frac{117-120}{7})=\Phi(-\frac{3}{7})
=1-\Phi(3/7)=1-\Phi(0.43)=1-0.664=0.336


Napomena 13. Vrijednost \Phi(0.43) se traži u tablicama vrijednosti jedinične normalne razdiobe na isti način kao i pod a).


d)


 

P(110\lt X\lt 130)=\Phi(\frac{130-120}{7})-\Phi(\frac{110-120}{7})=
\Phi(\frac{10}{7})-\Phi(-\frac{10}{7})=\Phi(1.43)-(1-\Phi(1.43))
=2\cdot 0.9236-1=0.8472.

3. Primjena programskog paketa Symbolab:



Napomena 14. Napomena: Symbolab je program kojeg je moguće koristiti bez prethodne instalacije, jednostavnim upisivanjem pojma Symbolab u Google. U Symbolab je tek odnedavno uvedena opcija izračuna normalne razdiobe, pa smo je odmah odlučili isprobati na našem primjeru. Usprkos našem dobrom iskustvu do sada sa Symbolabom, ovaj put moramo priznati da nije ponu\dj {}en najbolji način rješavanja jer za izračun moramo prethodno napraviti samostalne korake kao što je izračun varijable Z\colon = \frac{X-\mu }{\sigma }. Znači sa Symbolabom nismo u potpunosti izbjegli numeričko rješavanje kao što je slučaj sa GeoGebrom.


a) Obzirom da sami moramo izračunati Z\colon=\frac{X-\mu}{\sigma}, za P(X=105), uopće ne postoji opcija izračuna, nego bi korisnik morao znati činjenicu da se kod kontinuiranih varijabli vjerojatnost pridru žuje intervalima realnih brojeva, a vjerojatnost pridružena pojedina čnim vrijednostima je jednaka 0.


b) Ovdje se mora koristiti formula suprotne vjerojatnosti, odnosno mora se ra čunati po formuli P(X\gt A)=1-P(X\leq A^{C}). I ne samo to, nego se za izračun P(X\gt 122) prvo mora izračunati Z=\frac{122-120}{7}=0.29 i tek onda možemo pristupiti uporabi Symbolaba.
Nakon što smo otvorili Symbolab, u prvom gornjem redu kliknemo na opciju Solutions (Slika 10.).
Na lijevoj strani će nam se pojaviti popis izračuna koje nam nudi Symbolab. Na izborniku biramo Statistics.

Slika 10: Slika 10.

Nakon toga nam se pojavi izbornik pod nazivom Statistics Calculator, na kojem se u dnu pojavi mogućnost izračuna Standardne normalne distribucije (Slika 11.).

Slika 11: Slika 11.

Klikom na Standardnu normalnu distribuciju pojavi se P(Z=), u koji upisemo P(Z=0.29) (Slika 12.). Vidimo da je rješenje P(Z=0.29)=0.6103. Kad smo taj korak napravili možemo izračunati suprotnu vjerojatnost, pa je rješenje



 

P(X\gt 122)=1-0.6103=0.3897

Slika 12: Slika 12.


c) Za izračun P(X\lt 117) prvo mora izračunati Z=\frac{117-120}{7} =-0.43. Upisivanjem Z=-0.43 dobijemo (Slika 13.)


 

P(X\lt 117)=0.336

Slika 13: Slika 13.



Napomena 15. U ovom slučaju vidimo da Z može biti i negativan, što u sluč aju numeričkog rješavanja nije moguće.


d) Za izračun P(110\lt X\lt 130) prvo moramo izračunati Z=\frac{130-120 }{7}=1.43 i Z=\frac{110-120}{7}=-1.43. Na isti način kao u prethodnim primjerima u Symbolabu dobijemo da je P(Z=1.43)=0.9236 i P(Z=-1.43)=0.0764, pa je rješenje


 

P(110\lt X\lt 130)=\Phi(\frac{130-120}{7})-\Phi(\frac{110-120}{7})=
=0.9236-0.0764=0.8472


4Zaključak

Iz konkretnog primjera iz kemije je očito da je numeričko rješavanje i postavljanje ovakvih problema složeno. Kod primjene gotovih programskih paketa GeoGebra i Symbolab, se GeoGegebra pokazala boljom opcijom, jer ne zahtjeva nikakve predizračune dok sa Symbolabom nismo u potpunosti izbjegli numeričko rješavanje. 

Bibliografija
[1] W. Volk: Applied Statistics for Engineers, McGraww-Hill Book Company, Inc., United States of America, 1958.
 
[2] https://moodle.srce.hr/2020-2021/enrol/index.php?id=70069;   (Datum zadnjeg pristupa: 22.07.2021.)
 
[3] B.V. Gnedenko, A.J. Hinčin: Uvod u teoriju vjerojatnosti, Tehnička knjiga, Zagreb, 1995.
 
[4] S. Pivac, A. Rozga: Statistika za sociološka istraživanja, Sveučilište u Splitu, Split, 2006.
 
[5] http://matematika.fkit.hr/novo/statistika_i_vjerojatnost/predavanja/4-Osnove_teorije_vjerojatnosti_za_inzenjere_3.dio.pdf  ;  (Datum zadnjeg pristupa: 07.07.2021.)
 
[6] N. Koceić Bilan: Primijenjena statistika, Prirodoslovno-matematički fakultet u Splitu, Split, 2011.
 
[7] https://www.mathos.unios.hr/uvis/poglavlje2.pdf  (Datum zadnjeg pristupa: 14.07.2021.)

 

Share this