Broj 5 |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Bojan Radman |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Benfordov zakon |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sadržaj:UvodPovijest Benfordovog zakona Primjeri Benfordovog zakona Izvod Benfordovog zakona Zaključak Literatura UvodPromatrajući neku stranicu telefonskog imenika, što mislite koja će se znamenka pojavljivati najčešće kao prva u telefonskim brojevima na toj stranici? Ograničimo se još na to da promatramo samo prvu značajnu znamenku u broju (tj., prvu znamenku različitu od nule). Vrlo vjerojatno očekujete da će se otprilike jednak broj puta na prvom mjestu pojaviti znamenke 1, 2, 3, 4, 5, 6, 7, 8, 9, tj. da je vjerojatnost pojavljivanja bilo koje od ovih 9 znamenaka na prvom mjestu jednaka i iznosi oko 0.111, tj. 11.1%. Međutim, to nije istina! Ako imate strpljenja prebrojiti te znamenke, otkrit ćete nešto pomalo iznenađujuće. Broj 1 pojavljuje se mnogo češće kao prva značajna znamenka od ostalih. Ovo je primijetio i Benford prije više od 60 godina. Svi znamo da se naš brojevni sustav koristi znamenkama od 0 do 9 i da je vjerojatnost slučajno odabrane prve značajne znamenke u broju 1/9 (ovdje opet izbacujemo nulu jer ona ne može biti prva značajna znamenka u broju). Ovo vrijedi za podatke generirane Random funkcijom ili neke lažne izmišljene podatke. Kod podataka koji se pojavljuju prirodno, ovo ne vrijedi: za njih vrijedi tzv. BENFORDOV ZAKON. Tako se brojevi od 1 do 9 pojavljuju u prosjeku kao prve značajne znamenke ovako:
Povijest Benfordovog zakonaOvu zanimljivu činjenicu otkrio je 1881. god. američki astronom Simon Newcomb. U to vrijeme džepni kalkulator nije postojao ni u najluđim snovima. Računanje se provodilo samo uz pomoć papira i olovke. Knjige sa stranicama i stranicama logaritamskih tablica upotrebljavale su se za složene račune. Newcomb je primijetio da su stranice logaritamskih tablica koje počinju s 1 puno istrošenije i češće upotrebljavane nego druge. Poslije analiziranja više skupina podataka koji se pojavljuju u prirodi, Newcomb je došao do teze koja je kasnije prozvana Benfordovim zakonom. Newcomba su, na žalost, u njegovo vrijeme ignorirali.Godine 1938. fizičar Frank Benford uočio je isto što i Newcomb. Međutim, on je proučavao mnogo veće skupine podataka nego Newcomb (čak 20.229 skupina različitih podataka). Benford je proučavao brojevne podatke iz najrazličitijih izvora: površine jezera, duljine rijeka, brojnost populacija, atomske težine, statistike o baseballu, brojeve u telefonskom imeniku. I za sve podatke uočio je da se najčešće kao prva znamenka pojavljuje broj 1, zatim broj 2 i tako dalje. Za razliku od Newcomba, Benfordov rad bio je priznat i po njemu se odnosi koje je odredio zovu Benfordovim zakonom. Sljedeća tablica pokazuje relativne frekvencije prvih znamenaka u različitim skupinama podataka, a Benford ju je objavio 1938. godine u svom originalnom radu.
Podatke s kojima radimo i kojima se koristimo u istraživanju nazivamo uzorcima. Broj koji govori koliko se puta neki element pojavio u uzorku nazivamo frekvencijom. Nas će, međutim, zanimati zapravo relativna frekvencija, a to je omjer frekvencije i veličine uzorka.
Na primjer, ako promatramo
površine 200 jezera (uzorak) i
među njima ustanovimo da 62 jezera (frekvencija)
imaju znamenku 1 kao početnu znamenku, tada
je relativna frekvencija pojavljivanja znamenke 1 u površinama jezera
kao početne znamenke Primjeri Benfordovog zakonaUzmimo neki grad u Hrvatskoj koji ima 10 000 stanovnika i pretpostavimo da mu se broj stanovnika poveća godišnje za 2%. Za 36 godina broj stanovnika tog grada doseći će broj od
U narednih 15 godina
broj stanovnika povećat će se do
Sada pogledajmo nalazimo li u matematici negdje relativne frekvencije početnih znamenki kao u Benfordovom zakonu. Zanimljivo je, npr., pitanje koja je vjerojatnost da početna znamenka Fibonaccijevog broja bude 1? Ili da bude npr. 5? Ako ste u nedoumici vrijedi li Benfordov zakon za Fibonaccijeve brojeve ili ne, pogledajmo tablicu za prvih 100 Fibonaccijevih brojeva i njihove početne znamenke.
Pogledajmo sad vremena trkača na 400 m - ne počinju mnoga od njih s 1. Pogledajmo godine poznatih političara u svijetu i kod nas - ni mnoga od njih ne počinju s 1 (zapravo skoro da i nema nikoga s npr. 19 godina). Za razliku od lutrije, gdje su podatci uniformno distribuirani i potpuno slučajni, ovi podatci nisu slučajni, nego su jako ograničeni i determinirani, tj. raspon mogućnosti preuzak je da bi dozvolio da se Benfordov zakon održi. Drugim riječima, Benfordov zakon treba podatke koji nisu ni potpuno slučajni niti su jako ograničeni, već nešto između. Ti podatci mogu biti jako široki i tipični su rezultati više procesa s mnogo utjecaja, kao npr. populacija gradova koja može doseći razinu od desetak tisuća do nekoliko milijuna i ovisi o velikom rasponu faktora. Matematičari su otkrili da što veću količinu podataka imamo i što više podatci variraju, to se relativne frekvencije brojeva više približavaju relativnim frekvencijama iz Benfordovog zakona.
Pogledajmo sada kako su
logaritmi brojeva 1, 2, 3, ... , 9 distrubuirani unutar segmenta
Vidimo da brojevi koji započinju s 1 zauzimaju puno veći dio segmenta nego brojevi koji započinju s 9. Preciznije, brojevi koji započinju sa znamenkom 1 zauzimaju 30.1% duljine čitavog segmenta. Podatci za ostale znamenke navedeni su u sljedećoj tablici:
P = (log10(n + 1) - log10(n)) / (log1010 - log101) = log10(n + 1) - log10(n) = log10(1+1/n), gdje je n prva značajna znamenka broja.Tako je vjerojatnost da 1 bude prva značajna znamenka jednaka log10(2) = 0.3010, tj. 30.1%. Za 2, 3, 4, ..., 9 uvrštavanjem u prethodnu formulu dobivaju se sljedeće vrijednosti:
Izvod Benfordovog zakonaPokažimo da je frekvencija pojavljivanja prve znamenke u geometrijskom nizu qn upravo kao u Benfordovom zakonu ako je log q pozitivan iracionalan broj.Uzmimo da je prva znamenka od qn jednaka k. Tada je qn [k 10m, (k + 1) 10m , m , k {1, 2, 3, 4, 5, 6, 7, 8, 9} n log10 q [log10 k + m, log10 (k + 1) + m . Kako je m prirodan broj, a log10 k, log10 (k + 1) [0,1], ova relacija ekvivalentna je sn log10 q [log10 k, log10 (k + 1) mod 1, gdje je mod operacija koja daje ostatak pri cjelobrojnom dijeljenju. Alternativna oznaka zaNavedimo sada (bez dokaza) jednu lemu iz teorije vjerojatnosti koju ćemo iskoristiti u daljnjem izvodu.
Lema: Ako je
iracionalan broj, onda je frekvencija kojom niz
(n),
n
,
pada u interval
Sada, znači, imamo da je u našem slučaju frekvencija kojom nlog10 q pada u interval [log10 k, log10 (k + 1) mod 1 jednaka log10(k + 1) - log10k = log10 (1 + 1/k). Dakle, dobili smo frekvencije kao u Benfordovom zakonu jer je frekvencija pojavljivanja znamenke k = 1 kao prve znamenke u geometrijskom nizu qn jednaka log10 2 = 0.301, za k = 2 je log10 (1 + 1/k) = 0.176 , ... , za k = 9 je log10 (1 + 1/k) = 0.046.Vidjeli smo da je frekvencija pojavljivanja znamenki u Benfordovom zakonu upravo logaritamska.
Ovaj izvod pokazuje zašto Fibonaccijevi brojevi poštuju Benfordov zakon. Naime, svaki
Fibonaccijev broj Fn može se
izraziti eksplicitno kao funkcija od n, naime Fn
je najbliži prirodan broj broju
Za bazu 10, tj. dekadski sustav, vrijedi Benfordov zakon. Sljedeća slika pokazuje kako to izgleda u bazama 2, 3, 4, 5, ..., 10. Na x–osi nalaze se znamenke, a na y– osi vjerojatnost da ta znamenka bude prva značajna znamenka u broju u pripadnoj bazi (vjerojatnosti za određenu bazu obojane su različitim bojama). Vidimo da i za baze 2, 3, 4, ..., 9 znamenka 1 ima najveću vjerojatnost pojavljivanja kao prva značajna znamenka u broju, tj. da Benfordov zakon vrijedi ne samo za bazu 10, nego i baze 2, 3, 4, ..., 9. Benfordov zakon ne vrijedi za drugu značajnu znamenku u broju pa je tako vjerojatnost da će 1 biti druga značajna znamenka u broju jednaka 0.1138, a vjerojatnost da će 1 biti neka manje značajna znamenka u broju približava se 0.10 kako idemo dalje, tj. nakon prve značajne znamenke za koju vrijedi Benfordova raspodjela, znamenke počinju biti uniformno distribuirane. ZaključakAko se pitate da li bi Benfordov zakon uopće mogao biti koristan i gdje, odgovor je da sve više matematičara, a i informatičara, drži da je Benfordov zakon snažan i relativno jednostavan alat za otkrivanje računovodstvenih prijevara, lažiranja podataka kod plaćanja poreza i čak za otkrivanja računalnih bugova. Porezne uprave nekoliko država, kao npr. Kalifornije, već koriste računalne programe za otkrivanje prijevara bazirane na Benfordovom zakonu, kao i neke velike svjetske kompanije. Dr. Nigrin sa sveučilišta u Dallasu, jedan od vodećih stručnjaka i znanstvenik koji je stekao priznanja za otkrivanje praktične upotrebe Benfordovog zakona, uvjeren je, kao i mnogi drugi stručnjaci, kako će Benfordov zakon u budućnosti biti sve češće primjenjivan u različite svrhe. Jedan od najranijih eksperimenata koje je proveo dr. Nigrin s programom koji se bazira na Benfordovom zakonu, bila je analiza porezne prijave predsjednika Clintona. Utvrdio je kako prijava sadrži vjerojatno zaokružene vrijednosti, a ne precizne brojeve, ali da nije lažna, tj. da nema porezne prijevare. Kako on kaže: "Benford je za mene veliki junak. Njegov zakon nije magičan, ali se katkad čini takvim!"Literatura[1] K. Brown: Benford's Law, MathPageshttp://www.mathpages.com/home/kmath302/kmath302.htm
[2] E. Weisstein: Benford's Law, MathWorld
[3] Benford's Law - How to Spot Tax Fraud,
Amazing Applications of Probability and Statistics
[4] J. Walthoe, R. Hunt, M. Pearson: Looking out
for number one, +plus magazine, September 1999
[5] R. Knott: The Mathematical Magic of the Fibonacci Numbers
Uvod Povijest Benfordovog zakona Primjeri Benfordovog zakona Izvod Benfordovog zakona Zaključak Literatura |