Obrada i analiza velikih podataka - besplatni tečaj Open Educationa, obuka 2 tjedna, oko 36 sati tjedno, Datum 29. studenog 2023.
Miscelanea / / November 30, 2023
dr.sc. Pozicija: izvanredni profesor, Fakultet sustava upravljanja i robotike, izvanredni profesor, Visoka škola za digitalnu kulturu, Sveučilište ITMO
Kandidat fizičko-matematičkih znanosti Pozicija: izvanredni profesor, Visoka škola digitalne kulture, Sveučilište ITMO
dr.sc. Pozicija: izvanredni profesor, Visoka škola za digitalnu kulturu, Sveučilište ITMO
Modul 1 Tema 1.1 Uvod u znanost o podacima Raspravlja o vrstama i izvorima podataka, načelima odvajanje i objedinjavanje podataka, vrste ljestvica, načini čišćenja podataka i popunjavanja praznina, kontrola rasponi. Tema 1.2 Alati za obradu podataka Govori o primarnim alatima za obradu podataka, kao što su proračunske tablice (Google proračunske tablice i Excel), pokriva pitanja sortiranja i filtriranja podataka, sredstva agregacije i analize tabelarnih podataka (zaokretne tablice) Tema 1.3 Vizualizacija podataka Zadaće i metode vizualizacije podataka u različitim alatima (Google proračunske tablice i Excel), oblici prikaza kvantitativnih i kvalitativni podaci. Razmatra se vizualizacija kognitivnih podataka. Tema 1.4 Analiza i transformacija podataka Razmatraju se metode izravnavanja i normalizacije podataka, problematika transformacije podataka. Detaljno su opisane vrste deskriptivne statistike i metode za njihov izračun. Tema 1.5 Rad s vremenskim serijama Razmatraju se principi rada s vremenskim serijama i metode njihove analize. Posebna pažnja posvećena je tehnikama izglađivanja vremenskih serija, utvrđivanju trendova i sezonskih komponenti vremenskih serija.
Modul 2 Big Data Storage Tema 2.1. Sustavi za upravljanje bazama podataka Razmatraju se arhitektura informacijskih sustava i glavne funkcije sustava za upravljanje bazama podataka. Tema 2.2. Projektiranje strukturiranih podataka Razmatraju se osnovni koncepti relacijskog (tabularnog) modela podataka, projektiranje podataka u relacijskom modelu, pravila za kreiranje tablica i definiranje ograničenja integriteta. Tema 2.3. SQL - upiti prema podacima i objektima baze podataka Razmatraju se principi konstruiranja upita prema podacima u SQL jeziku, uključujući projekciju, sortiranje, postavljanje uvjeta odabira, spajanje više tablica, skup-teoretske operacije, ugniježđene zahtjevi. Predavanje također govori o objektima baze podataka - pogledima, procedurama/funkcijama, okidačima. Dan je koncept indeksa koji može poboljšati učinkovitost izvršavanja niza upita. Tema 2.4. NoSQL pohrana Razmatraju se osnovni pojmovi i karakteristike NoSQL sustava, različite vrste i ocjene NoSQL sustava: ključ-vrijednost, dokument, stupac i graf. Principi izgradnje upita prema podacima u NoSQL pohranama. Tema 2.5. MongoDB - rad s pohranom dokumenata Raspravlja o organiziranju podataka i izradi upita u MongoDB-u. Navedeni su primjeri izgradnje upita u MongoDB demo bazi podataka.