Strojno učenje u praksi - tečaj 41 500 rub. iz IBS Training Center, trening 24 sata, Datum 26. studenog 2023.
Miscelanea / / December 02, 2023
Tečaj je izgrađen oko nekoliko praktičnih slučajeva koji sadrže tablice s početnim podacima.
Za svaki slučaj prolazimo kroz cijeli životni ciklus projekta strojnog učenja:
istraživanje, čišćenje i priprema podataka,
odabir metode obuke koja odgovara zadatku (linearna regresija za regresiju, slučajna šuma za klasifikaciju, K-srednje vrijednosti i DBSCAN za klasteriranje),
trening odabranom metodom,
evaluacija rezultata,
optimizacija modela,
prezentacija rezultata kupcu.
Tijekom diskusijskog dijela kolegija raspravljamo o praktičnim problemima s kojima se studenti suočavaju, a koji se mogu riješiti uz pomoć razmatranih metoda.
Tema završena:
1. Pregled zadatka (teorija – 1 sat)
Koje probleme strojno učenje dobro rješava, a koje probleme pokušava riješiti?
Što se događa ako, umjesto Data Scientista, zaposlite nestručnjaka za to područje (samo programera/analitičara/upravitelja) s očekivanjem da će učiti u procesu.
2. Priprema, čišćenje, istraživanje podataka (teorija – 1 sat, praksa – 1 sat)
Kako razumjeti izvorne poslovne podatke (i općenito otkriti bilo kakav redoslijed u njima).
Redoslijed obrade.
Što se može i treba delegirati domenskim analitičarima, a što najbolje radi sam Data Scientist.
Prioriteti za rješavanje konkretnog problema.
3. Klasifikatori i regresori (teorija – 2 sata, praksa – 2 sata)
Praktični dio - dobro formalizirani zadaci s pripremljenim podacima.
Razlika između zadataka (binarna/nebinarna/probabilistička klasifikacija, regresija), preraspodjela zadataka između razreda.
Primjeri klasifikacije praktičnih problema.
4. Klasterizacija (teorija – 1 sat, praksa – 2 sata)
Gdje i kako provesti klasteriranje: istraživanje podataka, provjera problema, provjera rezultata.
Koji se slučajevi mogu svesti na grupiranje.
5. Evaluacija modela (teorija – 1 sat, praksa – 1 sat)
Poslovna metrika i tehnička metrika.
Metrike za probleme klasifikacije i regresije, matrica pogrešaka.
Unutarnje i vanjske metrike kvalitete klasteriranja.
Unakrsna provjera valjanosti.
Procjena prekvalifikacije.
6. Optimizacija (teorija – 5 sati, praksa – 3 sata)
Što jedan model čini boljim od drugog: parametri, karakteristike, sastavi.
Upravljanje postavkama.
Praksa odabira značajki.
Pregled alata za pronalaženje najboljih parametara, značajki i metoda.
7. Dijagrami, izvješća, rad sa zadacima uživo (teorija – 2 sata, praksa – 2 sata)
Kako jasno objasniti što se događa: sebi, timu, klijentu.
Još ljepših odgovora na besmislena pitanja.
Kako predstaviti tri terabajta rezultata na jednom slajdu.
Poluautomatski testovi, koje su kontrolne točke procesa stvarno potrebne.
Od zadataka uživo do cjelovitog procesa istraživanja i razvoja (“Istraživanje i razvoj u praksi”) - analiza i analiza zadataka iz publike.