Data Scientist od nule do PRO - tečaj 233 640 RUB. iz SkillFactoryja, obuka 24 mjeseca, Datum 15. kolovoza 2023.
Miscelanea / / November 29, 2023
Nakon osnovnog tečaja moći ćete odabrati užu specijalizaciju iz Data Science - ML Engineer, CV Engineer ili NLP Engineer
M.L. inženjer — Programer strojnog učenja
Razviti model predviđanja kreditnog rejtinga
Riješite problem klasifikacije spam SMS poruka
Razviti sustav za preporuku odgovarajućih proizvoda pri kupnji
Izgradite model povećanja prodaje u maloprodaji
Stvorite slike na temelju opisa teksta koristeći DALL-E neuronsku mrežu
CV inženjer — Stručnjak za računalni vid
Naučiti rješavati sve osnovne probleme iz područja računalnog vida
Steći ćete znanja o stvarnom tijeku rada s CV modelima, aktualnim pristupima i naprednim alatima potrebnim za izradu CV usluga
U konačnom projektu izraditi virtualnog trenera koji može procijeniti ispravnost vježbi na videu
NLP inženjer — Specijalist za obradu prirodnog jezika
Upoznajte obradu prirodnog jezika
Steknite razumijevanje NLP zadataka - klasifikacija, sažimanje i generiranje teksta, stvaranje sustava za strojno prevođenje i sustava za odgovaranje na pitanja
U završnom projektu samostalno ćete razviti alate za automatizirano pretraživanje konteksta na zadane teme.
BAZA
U ovoj fazi naučit ćete osnove programiranja u Pythonu, naučiti kako pretprocesirati i analizirati podatke te se također upoznati s glavnim zadacima data scientista.
Uvod - 1 tjedan
Moći ćete sami formulirati stvarne ciljeve učenja, saznati koja je vrijednost DS-a za posao, upoznati se s glavnim zadaćama podatkovnog znanstvenika i razumjeti kako razvoj bilo koje projekt DS.
UVOD-1. Kako učinkovito učiti - uvođenje u obuku
UVOD-2. Pregled profesije. Vrste problema u znanosti o podacima. Faze i pristupi razvoju projekta Data Science
Dizajn razvoja - 5 tjedana
Naučit ćete raditi s osnovnim tipovima podataka koristeći Python i moći ćete koristiti konstrukcije petlje, uvjetne izjave i funkcije u svom svakodnevnom radu.
PYTHON-1. Osnove Pythona
PYTHON-2. Uranjanje u vrste podataka
PYTHON-3. Uvjetne izjave
PYTHON-4. Ciklusi
PYTHON-5. Funkcije i funkcionalno programiranje
PYTHON-6. Praksa
PYTHON-7. Vodič za stil za Python (bonus)
Osnove matematike - 7 tjedana
MATEMATIKA-1. Brojevi i izrazi
MATEMATIKA-2. Jednadžbe i nejednadžbe
MATEMATIKA-3. Osnovni pojmovi teorije funkcija
MATEMATIKA-4. Osnove geometrije: planimetrija, trigonometrija i stereometrija
MATEMATIKA-5. Skupovi, logika i elementi statistike
MATEMATIKA-6. Kombinatorika i osnove teorije vjerojatnosti
MATEMATIKA-7. Rješavanje problema
Rad s podacima - 8 tjedana
U ovoj fazi svladat ćete osnovne podatkovne vještine: kako pripremiti, očistiti i transformirati podatke tako da budu prikladni za analizu. Kad smo već kod analize: podatke ćete analizirati pomoću popularnih biblioteka Matplotlib, Seaborn, Plotly.
PYTHON-8. Alati za znanost podataka
PYTHON-9. NumPy biblioteka
PYTHON-10. Uvod u Pande
PYTHON-11. Osnovne tehnike rada s podacima u Pandama
PYTHON-12. Napredne podatkovne tehnike u Pandas
PYTHON-13. Čišćenje podataka
PYTHON-14. Vizualizacija podataka
PYTHON-15. Načela OOP-a u Pythonu i kod za otklanjanje pogrešaka (izborni modul)
Projekt 1. Analitika skupova podataka o zatvorenim pitanjima
Učitavanje podataka - 6 tjedana
Moći ćete preuzeti podatke iz različitih formata i izvora. A SQL, strukturirani upitni jezik, pomoći će vam u tome. Naučit ćete koristiti agregatne funkcije, spojeve tablica i složene spojeve.
PYTHON-16. Kako preuzeti podatke iz datoteka različitih formata
PYTHON-17. Dohvaćanje podataka iz web izvora i API-ja
SQL-0. Pozdrav SQL!
SQL-1. Osnove SQL-a
SQL-2. Agregatne funkcije
SQL-3. Spajanje tablica
SQL-4. Složeni spojevi
Projekt 2. Učitavanje novih podataka. Pročišćavanje analize
Statistička analiza podataka - 7 tjedana
Vaš fokus će biti analiza obavještajnih podataka (EDA). Upoznat ćete se sa svim fazama takve analize i naučiti kako je provoditi pomoću biblioteka Statsmodels, Scikit Learn, Seaborn, Matplotlib, SciPy, Pandas. Osim toga, moći ćete raditi na Kaggleu, popularnom servisu za sudjelovanje u natjecanjima.
EDA-1. Uvod u analizu obavještajnih podataka. Algoritmi i metode EDA
EDA-2. Matematička statistika u kontekstu EDA. Vrste obilježja
EDA-3. Inženjering značajki
EDA-4. Statistička analiza podataka u Pythonu
EDA-5. Statistička analiza podataka u Pythonu. 2. dio
EDA-6. Dizajn pokusa
EDA-7. Kaggle platforma
Projekt 2
Uvod u strojno učenje - 9 tjedana
Upoznat ćete se s ML bibliotekama za modeliranje ovisnosti podataka. Moći ćete uvježbati glavne tipove ML modela, izvršiti validaciju, interpretirati rezultate rada i odabrati važne značajke (feature important).
ML-1. Teorija strojnog učenja
ML-2. Nadzirano učenje: Regresija
ML-3. Nadzirano učenje: Klasifikacija
ML-4. Učenje bez nadzora: tehnike grupiranja i smanjenja dimenzionalnosti
ML-5. Validacija podataka i evaluacija modela
ML-6. Selekcija i selekcija svojstava
ML-7. Optimiziranje hiperparametara modela
ML-8. ML kuharica
Projekt 3. Problem klasifikacije
GLAVNA JEDINICA
Linearna algebra, matematička analiza, diskretna matematika - zvuči zastrašujuće, ali nemojte se bojati: analizirat ćemo sve te predmete i naučiti vas kako s njima raditi! U drugom stupnju uronit ćete u matematiku i osnove strojnog učenja, naučiti više o DS zanimanjima te kroz profesionalno usmjeravanje odabrati drugu godinu studija.
Matematika i strojno učenje. 1. dio - 6 tjedana
Moći ćete rješavati praktične probleme koristeći ručni izračun i Python (vektorski i matrični izračuni, rad sa skupovima, proučavanje funkcija pomoću diferencijalne analize).
MATEMATIKA&ML-1. Linearna algebra u kontekstu linearnih metoda. 1. dio
MATEMATIKA&ML-2. Linearna algebra u kontekstu linearnih metoda. 2. dio
MATEMATIKA&ML-3. Matematička analiza u kontekstu optimizacijskog problema 1. dio
MATEMATIKA&ML-4. Matematička analiza u kontekstu optimizacijskog problema. 2. dio
MATEMATIKA&ML-5. Matematička analiza u kontekstu optimizacijskog problema. dio 3
Projekt 4. Problem regresije
Matematika i strojno učenje. 2. dio - 6 tjedana
Upoznat ćete osnovne pojmove teorije vjerojatnosti i matematičke statistike, algoritme klasteriranje, te naučiti ocijeniti kvalitetu provedenog klasteriranja i prezentirati rezultate grafički oblik.
MATEMATIKA&ML-6. Teorija vjerojatnosti u kontekstu Naivnog Bayesovog klasifikatora
MATEMATIKA&ML-7. Algoritmi temeljeni na stablima odlučivanja
MATEMATIKA&ML-8. Pojačavanje i slaganje
MATEMATIKA&ML-9. Tehnike grupiranja i smanjenja dimenzionalnosti. 1. dio
MATEMATIKA&ML-10. Tehnike grupiranja i smanjenja dimenzionalnosti. 2. dio
Projekt 5. Metode ansambla
Diskretna matematika - 4 tjedna
MATH&MGU-1 Skupovi i kombinatorika
MATH&MGU-2 Logika
MATH&MGU-3 Grafikoni. 1. dio
MATH&MGU-4 Grafikoni. 2. dio
ML u poslovanju - 8 tjedana
Naučit ćete koristiti ML knjižnice za rješavanje problema vremenskih serija i sustava preporuka. Moći ćete uvježbati ML model i potvrditi ga, kao i stvoriti radni prototip i pokrenuti model u web sučelju. Također steknite vještine A/B testiranja kako biste mogli procijeniti model.
MATEMATIKA&ML-11. Vremenske serije. 1. dio
MATEMATIKA&ML-12. Vremenske serije. 2. dio
MATEMATIKA&ML-13. Preporučni sustavi. 1. dio
MATEMATIKA&ML-14. Preporučni sustavi. 2. dio
PROD-1. Priprema modela za proizvodnju
PROD-2. PrototipStreamlit+Heroku
PROD-3. Poslovno razumijevanje. Slučaj
Projekt 6. Tema za odabir: vremenske serije ili sustavi preporuka
PROFESIONALNA RAZINA
U trećoj fazi upoznati ćete se s jednom od metoda strojnog učenja - dubokim učenjem (DL). Također vas očekuje punopravni blok odabrane specijalizacije: možete svladati vještine strojnog učenja (ML), upoznati rutinu CV-a (kompjutorski vid) ili se usavršiti u NLP*, prirodno procesiranje Jezik.
Druga godina studija - 3 usmjerenja na izbor
Profesionalno usmjeravanje
ML, CV ili NLP: u ovoj fazi konačno morate odlučiti kojim ćete putem krenuti. Reći ćemo vam o svakoj specijalizaciji i ponuditi vam da riješite nekoliko praktičnih problema kako biste se lakše odlučili.
Staza ML - inženjer
U ML stazi naučit ćete rješavati dubinske probleme strojnog učenja, ovladati kompetencijama podatkovnog inženjera i usavršiti svoje vještine u radu s Python bibliotekama. Također ćete naučiti kako izraditi MVP (minimalno održivu verziju proizvoda), naučiti sve zamršenosti izlaza ML modela u proizvodnju i naučiti kako ML inženjeri rade u stvarnom životu.
Uvod u duboko učenje
Osnove podatkovnog inženjerstva
Dodatna poglavlja o Pythonu i ML-u
Ekonomska procjena učinaka i razvoj MVP
ML u proizvodnju
Detaljno proučavanje razvoja ML-a i diplomski rad na odabranu temu
Trag CV - inženjer
Na CV stazi naučit ćete rješavati probleme računalnog vida kao što su klasifikacija slika, segmentacija i detekcija, generiranje i stilizacija slike, restauracija i poboljšanje kvalitete fotografije. Osim toga, naučit ćete kako uvesti neuronske mreže u proizvodnju.
Uvod u duboko učenje
Osnove podatkovnog inženjerstva
Dodatna poglavlja o Pythonu i ML-u
Ekonomska procjena učinaka i razvoj MVP
ML u proizvodnju
Detaljno proučavanje razvoja ML-a i diplomski rad na odabranu temu
Trag NLP - inženjer
Tijekom obuke na NLP stazi naučit ćete kako riješiti glavne probleme obrade prirodnog jezika, u uključujući klasifikaciju, sažimanje i generiranje teksta, strojno prevođenje i stvaranje dijaloga sustava
Uvod u duboko učenje
Matematika neuronske mreže za NLP
Hard i softver za rješavanje NLP problema
NLP zadaci i algoritmi
Neuronske mreže u proizvodnji
Detaljno proučavanje razvoja NLP-a i diplomski rad na odabranu temu
Ako odaberete CV ili ML specijalizaciju, NLP tečaj možete pohađati bez mentorske podrške besplatno.
Duboko učenje i neuronske mreže
Gdje se koriste neuronske mreže? Kako trenirati neuronsku mrežu? Što je duboko učenje? Odgovore na ova pitanja saznat ćete u bonus dijelu DL-a.
Uvod u podatkovni inženjering
Naučit ćete razliku između uloga data scientista i data engineera, koje alate potonji koristi u svom radu te koje zadatke rješava svakodnevno. Riječi "pahuljica", "zvijezda" i "jezero" dobit će nova značenja :)