Seminar za matematičku logiku i osnove matematike

lokacija: 
PMF Matematički odsjek (virtualno)
vrijeme: 
26.10.2020 - 17:15 - 19:00

Na Seminaru za matematičku logiku i osnove matematike, u ponedjeljak 26. listopada 2020. u 17:15 sati,

Filip Nikšić (University of Pennsylvania) će održati predavanje

 

Parcijalno uređeni tokovi podataka

Sažetak: Obrada tokova podataka je pristup obradi velikih količina podataka (engl. big data) u kojem su podaci organizirani u diskretan tok (engl. data stream) — apstrakciju u kojoj zamišljamo da se podaci kontinuirano pojavljuju element po element bez pretpostavke da će se ikad prestati pojavljivati. Program za obradu tokova zamišljamo kao transformaciju koja reagira na elemente iz jednog ili više ulaznih tokova i proizvodi elemente u izlaznom toku; program pritom može održavati proizvoljno stanje koje utječe na način obrade. Moderni sustavi za obradu tokova (npr. Spark Streaming, Flink i Samza) omogućuju paraleliziranu obradu, pritom postižući visoku propusnost (engl. throughput) uz nisko kašnjenje (engl. latency).

Tradicionalno se tokovi formaliziraju kao konačni ili beskonačni nizovi podataka. No moguće ih je formalizirati i kao parcijalno uređene multiskupove: ugrubo, dva elementa u toku su zavisna ako je njihov relativni poredak bitan za obradu; parcijalan uređaj dobijemo tranzitivnim zatvorenjem relacije zavisnosti. Moderni sustavi za obradu tokova implicitno koriste (ne)zavisnost podataka pri paralelizaciji obrade. U predavanju ću pokazati da "osvještenje" parcijalnog uređaja omogućuje novi pristup testiranju programa u postojećim sustavima za obradu tokova, kao i razvoj novih sustava s većom mogućnošću paralelizacije.

 

Podaci za online praćenje preko Zoom platforme:

 
Topic: SLOM
 
Share this