Generalizirani linearni modeli - tečaj 3600 rub. iz Otvorenog obrazovanja, obuka 3 tjedna, oko 6 sati tjedno, Datum 29. studenog 2023.
Miscelanea / / December 01, 2023
Jedan od uvjeta za primjenjivost konvencionalnih linearnih modela je neovisnost opažanja jedna o drugoj, na temelju koje se odabire model. Međutim, u praksi često postoje situacije u kojima je dizajn zbirke materijala takav da je kršenje ovog uvjeta neizbježno. Zamislite da ste odlučili izgraditi model koji opisuje odnos između uspješnosti tjelesnog odgoja i rezultata IQ testa među učenicima. Da biste riješili ovaj problem, napravili ste brojne uzorke u nekoliko institucija. Je li moguće kombinirati takve podatke u jednu analizu, izgrađenu prema tradicionalnoj shemi? Naravno da ne. Studenti na svakom sveučilištu mogu biti na neki način slični jedni drugima. Čak i priroda odnosa između količina koje se proučavaju može biti nešto drugačija. Ovu vrstu podataka, u kojoj postoje unutargrupne korelacije, treba analizirati pomoću linearnih mješovitih modela. Pokazat ćemo da neke prediktore treba uključiti u model kao tzv. “slučajne faktore”. Naučit ćete da slučajni faktori mogu biti hijerarhijski podređeni. Raspravljat ćemo o tome kako se takvi mješoviti modeli mogu izgraditi za ovisne varijable koje slijede različite vrste distribucija. Osim toga, pokazat ćemo da slučajni dio modela može biti još složeniji - može imati komponentu koja modelira ponašanje varijance kao odgovor na utjecaj kovarijable. Na kraju tečaja pronaći ćete projekt u kojem možete vježbati izgradnju mješovitih modela odabirom jednog od nekoliko skupova podataka. Na temelju analize ovih podataka možete izraditi izvješće u skladu s tradicijom ponovljivog istraživanja.
Izvanredni profesor, Odsjek za zoologiju beskralježnjaka, Biološki fakultet, Državno sveučilište u St. Petersburgu, dr. sc.
Znanstveni interesi: struktura i dinamika zajednica morskog bentosa, prostorna mjerila, sukcesija, interspecific i intraspecific biotičke interakcije, rast i razmnožavanje morskih beskralješnjaka, demografska struktura populacija, mikroevolucija, biostatistika.
Tečaj se sastoji od 4 modula:
1) Uvod u generalizirane linearne modele
Generalizirani linearni modeli (GLM) omogućuju modeliranje ponašanja veličina koje ne slijede normalnu distribuciju. Kako bismo vam olakšali prve korake u svijetu GLM-a, analizirat ćemo njihovu strukturu na primjeru GLM-a za normalno raspodijeljene veličine – na taj način možete povući paralele s jednostavnim linearnim modelima. Naučit ćete što je funkcija veze, kako funkcionira maksimalna vjerojatnost i kako testirati GLM hipoteze pomoću Waldovih testova i testova omjera vjerojatnosti.
2) Problem odabira modela
U ovom modulu govorit ćemo o metodološkim pitanjima povezanima s izgradnjom modela. Model je pojednostavljeni prikaz stvarnosti, a odabir između različitih konkurentskih metoda takvog pojednostavljenja čest je zadatak analitičara. U ovom modulu naučit ćete uspoređivati modele pomoću informacijskih kriterija. Razmotrit ćemo glavne mogućnosti analize pri odabiru modela i razgovarati o poteškoćama koje nastaju u vezi sa skrivenim mnoštvom modela. Na kraju ćemo vas naučiti prepoznati glavne vrste zlouporaba odabira modela (data-fishing, p-hacking).
3) Generalizirani linearni modeli za brojanje podataka
U ovom modulu raspravljat ćemo o osnovnim metodama za modeliranje prebrojivih veličina. Prvo ćemo raspraviti zašto konvencionalni linearni modeli nisu prikladni za brojanje podataka. Svojstva prebrojivih distribucija pomoći će vam da razumijete razlike između vrsta GLM-a za prebrojive podatke i značajke njihove dijagnostike. Vidjet ćete funkciju veze na djelu kada vizualizirate GLM predviđanja na skali funkcije veze i na skali varijable odgovora.
4) Generalizirani linearni modeli s binarnim odzivom
Ponekad postoji potreba za simulacijom je li se neki događaj dogodio ili ne, je li nogometni tim ili izgubljen, je li se pacijent oporavio nakon tretmana ili ne, je li klijent počinio kupiti ili ne. Konvencionalni linearni modeli nisu prikladni za modeliranje takvih binarnih podataka (događaja s dva ishoda), ali to se lako može učiniti pomoću generaliziranih linearnih modela. U ovom modulu naučit ćete modelirati vjerojatnosti događaja predstavljajući ih kao izglede. Pogledat ćemo kako funkcionira funkcija logit veze i kako se tumače GLM koeficijenti kada se ona koristi. Konačno, moći ćete vježbati analizu generaliziranih linearnih modela s različitim distribucijama dovršavanjem projekta analize podataka. Rezultate ove analize potrebno je predstaviti kao izvješće u html formatu, napisano pomoću rmarkdown/knitr.
• Naučite koje su vještine potrebne za početak rada u analitici i znanosti o podacima • Naučite koristiti Excel, SQL, Power BI, Google Data Studio za rad podataka i napišite svoj prvi kod u Pythonu• Dobijte vodič korak po korak i naučite kako ući u područje znanosti o podacima i odabrati ulogu u znanosti o podacima
4,4
1 490 ₽