Strojno učenje o velikim podacima - besplatni tečaj Open Educationa, obuka 5 tjedana, od 5 do 14 sati tjedno, Datum: 3. prosinca 2023.
Miscelanea / / December 08, 2023
Položaj: Crowd Solution Architect, Neatsy, Inc.
Na Visokoj ekonomskoj školi počinje raditi 2017. godine. Predaje tečajeve digitalne pismenosti, analize teksta te alata i tehnika za rad s velikom količinom tekstualnih informacija. Profesionalni interesi: analiza velikih podataka. Obrazovanje 2018. Prvostupnik: Nacionalno istraživačko sveučilište Visoka ekonomska škola, specijalnost "Primijenjena matematika i računarstvo"
1. Priprema podataka za obuku
Danas strojno učenje djeluje učinkovito kada imamo velike količine označenih podataka. Ovaj tjedan ćemo pogledati koji formati podataka i oznake postoje i kako se te oznake mogu prikupljati
2. Obuka klasičnih modela na velikim podacima
Ovaj tjedan ćemo naučiti kako trenirati klasične algoritme (linearne modele i stabla odlučivanja) na velikim podacima.
3. Izgradnja sustava preporuka
Pogledat ćemo kako možemo paralelizirati klasične algoritme koji se koriste u sustavima preporuka.
4. Analiza velikih količina tekstualnih informacija
Razmotrimo probleme strojnog učenja na tekstovima. Razgovarajmo o pretprocesiranju teksta i kako dobiti strukturirani prikaz tekstualnih podataka pomoću modela kao što su word2vec i BERT.
5. Uvježbavanje dubokih neuronskih mreža
Naučit ćemo kako paralelizirati obuku modernih neuronskih mreža, kako unutra rade Horovod i Parameter Server te govoriti o Transfer Learningu.