10 sramotnih pitanja o neuronskim mrežama: odgovori stručnjaka za strojno učenje Igora Kotenkova
Miscelanea / / August 08, 2023
Prikupili smo sve što ste htjeli znati, ali ste bili presramežljivi pitati.
U novom niz Članci poznatih stručnjaka odgovaraju na pitanja koja je obično neugodno postaviti: čini se da svi već znaju za to, a ispitivač će izgledati glupo.
Ovaj put razgovarali smo sa stručnjakom za umjetnu inteligenciju Igorom Kotenkovim. Saznat ćete možete li svoju digitalnu kopiju sačuvati za svoje praunuke, zašto se neuronima ne može 100% vjerovati i prijeti li svijetu opasnost od pobune strojeva.
Igor Kotenkov
1. Kako funkcioniraju neuronske mreže? To je neka vrsta magije. Kako se ChatGPT uopće mogao napraviti? A Midjourney ili DALL-E?
Neuronska mreža je matematički model osmišljen s ciljem razumijevanja načina na koji funkcionira mozak živog organizma. Istina, za osnovu su uzete najosnovnije ideje s početka druge polovice 20. stoljeća, koje se danas mogu nazvati nerelevantnima ili previše pojednostavljenima.
Čak i naziv "neuralna mreža" dolazi od riječi "neuron" - to je naziv jedne od glavnih funkcionalnih jedinica mozga. Same neuronske mreže sastoje se od čvorova – umjetnih neurona. Stoga možemo reći da su mnoge ideje modernih arhitektura "provirile" iz same prirode.
Ali što je još važnije, neuronska mreža je matematički model. A budući da se radi o nečemu što je povezano s matematikom, onda možemo upotrijebiti svu snagu matematičkog aparata kako bismo saznali ili ocijenili svojstva takvog modela. Neuronsku mrežu možete smatrati funkcijom, a funkcija je također matematički objekt. Najjednostavniji i najrazumljiviji primjer: funkcija koja, recimo, uzima bilo koji broj kao ulaz i dodaje mu 2: f (4) = 6, f (10) = 12.
Ali takvu je funkciju vrlo lako programirati, čak se i dijete može nositi s njom nakon nekoliko sati učenja jezika. programiranje. A razlog je što se takva funkcija vrlo lako formalizira, detaljno opisuje jednostavnim i razumljivim jezikom.
Međutim, postoje neki zadaci kojima ne znamo niti pristupiti. Na primjer, mogu vam dati fotografije mačaka i pasa pomiješane, a vi ih možete bez problema razvrstati u dvije hrpe. No čime se točno vodite pri određivanju odgovora? Oboje su pahuljasti. Obje vrste imaju rep, uši, dva oka. Možda veličina? Ali postoje vrlo mali psi, postoje velike mačke.
Ne možemo opisati mnoge zadatke stvarnog svijeta, ne znamo ovisnost našeg promatranja i nekog uvjetnog "točnog" odgovora.
Samo znamo kako dati ovaj odgovor – i to je to, bez razmišljanja kako će ispasti.
Tu u pomoć dolaze neuronske mreže. Te se matematičke funkcije obučavaju iz podataka. Ne morate opisivati odnos između ulaza i izlaza. Jednostavno pripremite dvije hrpe fotografija i model trenira da daje točne odgovore. Ona sama uči pronaći tu vezu, sama je pronalazi, oslanjajući se na greškeTko to. Pobrkali ste bengalsku mačku i rotvajlera? Pa bit će bolje drugi put!
Proces učenja neuronske mreže je takva prilagodba “neurona” kako bi naučili kako riješiti problem i dati točan odgovor. I ono što je najvažnije: postoji teorijski dokaz da dovoljno velika neuronska mreža s dovoljno velikim skupom podataka može naučiti bilo koju složenu funkciju. Ali najvažnija stvar ovdje je računalna snaga (jer neuron može biti vrlo velik) i dostupnost označenih podataka. Naime označeni, odnosno imaju klasu “pas”, mačka ili kako već.
Ne razumijemo u potpunosti kako modeli funkcioniraju - najsloženiji i veliki modeli poput ChatGPT gotovo neanalizibilan.
Najbolji istraživači upravo sada rade na izazovu "razumijevanja" unutarnjeg funkcioniranja svojih procesa.
Ali znamo za koji su zadatak modeli trenirani, koju su pogrešku pokušali minimizirati tijekom treninga. Za ChatGPT zadatak se sastoji od dva. Prvi je predviđanje sljedeće riječi prema kontekstu: "mama je oprala ..." Što? To je ono što model treba predvidjeti.
Drugi zadatak je osigurati da odgovori nisu uvredljivi, ali da u isto vrijeme ostanu korisni i razumljivi. Zato je model postao viralan - izravno je osposobljen za generiranje teksta kakav se ljudima sviđa!
Možete pročitati više o tome kako ChatGPT radi u mom članak.
2. Mogu li neuroni misliti?
Znanstvenici još uvijek ne razumiju što znači "misliti" ili "rasuđivati" i kako uopće funkcionira intelekt. Stoga je teško procijeniti ima li model poput ChatGPT-a takva svojstva.
Zamislimo situaciju: prilazite vratima svog stana. Imate li ideju da trebate izvaditi ključ iz lijevog džepa ruksaka da biste otvorili vrata? Možemo li reći da je opis i prezentacija radnji misaoni proces? U biti, uspostavili smo odnos trenutnog stanja i željenog cilja (otvorena vrata). Ako mislite da je odgovor na gornje pitanje potvrdan, onda bi moj odgovor bio isti. 🙂
Druga je stvar kada su u pitanju inovativna razmišljanja koja prije nisu bila izražena ili nisu tako česta. Uostalom, na primjer, lako možete zamjeriti gornjem primjeru: „Da, pročitao sam ovaj model 100500 puta na internetu i u knjige. Naravno da zna! Ništa iznenađujuće." Usput, kako si znao? Je li to zato što su vam to roditelji pokazivali u djetinjstvu, a vi ste taj proces promatrali stotinama dana zaredom?
U ovom slučaju nema točnog odgovora. A stvar je u tome da ne uzimamo u obzir jednu važnu komponentu: vjerojatnost.
Koliko je vjerojatno da će model generirati misao koja odgovara vašoj specifičnoj definiciji "misli"?
Uostalom, neuron poput ChatGPT-a može se natjerati da generira milijun različitih odgovora na isti zahtjev. Na primjer, "dođite na ideju za znanstveno istraživanje». Ako je jedna od milijun generacija zaista zanimljiva i nova, računa li se to kao dokaz da model može iznjedriti ideju? Ali kako će se razlikovati od papige koja izvikuje nasumične riječi koje ne-ne i koje se zbrajaju u nešto razumljivo?
S druge strane, ljudi također ne odaju uvijek točne misli - neke fraze vode u slijepu ulicu i ne završavaju ništa. Zašto neuronske mreže to ne mogu oprostiti? Pa, jedna nova ideja od milijun generiranih je stvarno loša... Ali što ako 100 od milijun? Tisuću? Gdje je ta granica?
Ovo je ono što ne znamo. Trend je da isprva mislimo da će strojevima biti teško riješiti problem X. Na primjer, da biste položili Turingov test, gdje samo trebate razgovarati s osobom pola sata. Zatim, s razvojem tehnologije, ljudi dolaze do načina rješavanja, odnosno osposobljavanja modela za zadatak. A mi kažemo: “Pa to je zapravo bio pogrešan test, evo ti novi, neuroni ga sigurno neće moći proći!” I situacija se ponavlja.
Te tehnologije koje su sada, prije 80 godina, bile bi percipirane kao čudo. I sada se svim silama trudimo pomaknuti granicu "razumnosti" kako ne bismo sami sebi priznali da strojevi već znaju misliti. Zapravo, čak je moguće da prvo nešto izmislimo, a zatim post factum i retrospektivno definiramo kao AI.
3. Ako neuroni mogu crtati i pisati poeziju, onda mogu biti kreativni i gotovo poput ljudi?
Odgovor se zapravo uvelike oslanja na gore navedene informacije. Što je kreativnost? Koliko je kreativnosti u prosječnoj osobi? Jeste li sigurni da domar iz Sibira zna stvarati? I zašto?
Što ako model može proizvesti pjesmu ili sliku koja će, uvjetno, doći do finala gradskog natječaja za pisce amatere ili dječje likovne umjetnike? A ako se to dogodi ne svaki put, nego jednom od stotinu?
Većina ovih pitanja je diskutabilna. Ako vam se čini da je odgovor očit, pokušajte intervjuirati svoje prijatelje i rodbinu. S vrlo velikom vjerojatnošću, njihovo gledište neće se podudarati s vašim. A ovdje glavna stvar nije svađa.
4. Je li moguće vjerovati odgovorima neuronskih mreža i više ne guglati?
Sve ovisi o tome kako se modeli koriste. Ako im postavite pitanje bez konteksta, bez popratnih informacija u upitu i očekujete odgovor na teme u kojima je činjenična točnost važna, i ne opći ton odgovora (na primjer, slijed događaja unutar određenog razdoblja, ali bez točnog navođenja mjesta i datuma), tada je odgovor Ne.
Po domaćem procijenjen OpenAI, u takvim situacijama najbolji model do sada, GPT-4, odgovara točno u oko 70-80% slučajeva, ovisno o temi pitanja.
Može se činiti da su ove brojke jako daleko od idealne 100% stvarne "točnosti". No zapravo, ovo je veliki skok u odnosu na prethodnu generaciju modela (ChatGPT, temeljen na GPT-3.5 arhitekturi) - oni su imali točnost od 40-50%. Ispostavilo se da je takav skok napravljen u okviru 6-8 mjeseci istraživanja.
Jasno je da što se više približavamo 100%, to će biti teže napraviti neke korekcije kako se ne bi nešto “pokvarilo” u razumijevanju i poznavanju modela.
Međutim, sve navedeno odnosi se na pitanja bez konteksta. Na primjer, možete pitati: “Kada je bilo Einstein? Model bi se trebao oslanjati samo na interno znanje koje je u njega "ukomponirano" u fazi dugotrajne obuke na podacima sa svih strana interneta. Dakle, osoba neće moći odgovoriti! Ali kad bi mi dali stranicu s Wikipedije, onda bih je mogao pročitati i odgovoriti prema izvoru informacija. Tada bi točnost odgovora bila blizu 100% (korigirana za točnost izvora).
Sukladno tome, ako je modelu priložen kontekst u kojem su sadržane informacije, tada će odgovor biti mnogo pouzdaniji.
Ali što ako pustimo model guglati i pronaći izvore informacija na internetu? Pa da sama pronađe izvor i na temelju njega izgradi odgovor? Pa ovo je već učinjeno! Dakle, ne možete sami guglati, već delegirati dio internetske pretrage samom GPT‑4. Međutim, to zahtijeva plaćenu pretplatu.
Što se tiče daljnjeg napretka u razvoju pouzdanosti činjeničnih informacija unutar modela, generalni direktor OpenAI-ja Sam Altman daje procjena 1,5-2 godine za rješavanje ovog problema od strane tima istraživača. Jako ćemo mu se veseliti! Ali za sada imajte na umu da ne morate 100% vjerovati onome što je napisao neuron i provjerite barem izvore.
5. Je li istina da neuronske mreže kradu crteže pravih umjetnika?
I da i ne - o tome se obje sukobljene strane aktivno svađaju na sudovima diljem svijeta. Sa sigurnošću se može reći da slike nisu izravno pohranjene u modelima, pojavljuje se samo "budnost".
U ovom planu neuroni vrlo slični ljudima koji prvo proučavaju umjetnost, različite stilove, gledaju radove autora, a zatim pokušavaju imitirati.
Međutim, modeli uče, kao što smo već saznali, po principu minimizacije pogrešaka. A ako tijekom treninga model vidi istu (ili vrlo sličnu) sliku stotinama puta, onda je, s njezine točke gledišta, najbolja strategija zapamtiti sliku.
Uzmimo primjer: vaš profesor u umjetničkoj školi odabrao je vrlo čudnu strategiju. Svaki dan nacrtate dvije slike: prva je uvijek unikatna, u novom stilu, a druga je Mona Lisa. Nakon godinu dana pokušavaš evaluirati naučeno. Budući da ste Mona Lisu nacrtali više od 300 puta, zapamtili ste gotovo sve detalje i sada je možete reproducirati. Neće biti baš original, a sigurno ćete dodati nešto svoje. Boje bit će malo drugačiji.
A sada se od vas traži da nacrtate nešto što je bilo prije 100 dana (i što ste jednom vidjeli). Reproducirati ćete ono što je potrebno mnogo manje točno. Samo zato što ruka nije punjena.
Isto je i s neuronima: oni uče na isti način na svim slikama, samo su neke češće, što znači da se i model češće finira tijekom treninga. Ovo se ne odnosi samo na slike umjetnika - na bilo koju sliku (čak i oglašavanje) u uzorku za obuku. Sada postoje metode za uklanjanje duplikata (jer je vježbanje na njima u najmanju ruku neučinkovito), ali nisu savršene. Istraživanja pokazuju da postoje slike koje se pojavljuju 400-500 puta tijekom vježbanja.
Moja presuda: neuronske mreže ne kradu slike, već samo crteže smatraju primjerima. Što je primjer popularniji, model ga točnije reproducira.
Ljudi rade isto tijekom treninga: gledaju ljepotu, proučavaju detalje, stilove različitih umjetnici. Ali za umjetnike ili fotografe koji su pola života proveli učeći zanat, gledište je često radikalno drugačije od gore opisanog.
6. Je li istina da je “sve izgubljeno” i da će neuronske mreže ljudima oduzeti posao? Kome je najviše stalo?
Važno je odvojiti samo "neuralne mreže" koje obavljaju određene zadatke od neuronskih mreža opće namjene poput ChatGPT-a. Potonji su vrlo dobri u praćenju uputa i sposobni su učiti iz primjera u kontekstu. Istina, sada je veličina njihove "memorije" ograničena na 10-50 stranica teksta, kao i vještine refleksije i planiranje.
Ali ako se nečiji posao svodi na rutinsko izvršavanje instrukcija i to je lako naučiti u par dana čitajući članke (ili ako cijeli internet je ispunjen tim informacijama), a cijena rada je iznad prosjeka - onda uskoro takav posao automatizirati.
No automatizacija sama po sebi ne znači potpunu zamjenu ljudi. Samo dio rutinskog rada može se optimizirati.
Osoba će početi dobivati zanimljivije i kreativnije zadatke s kojima se stroj (do sada) ne može nositi.
Ako navodimo primjere, onda u skupinu promjenjivih ili zamjenjivih profesije Uključio bih, recimo, porezne asistente-konzultante koji pomažu u pripremi deklaracije i provjeravaju tipične pogreške, utvrđuju nedosljednosti. Promjene su moguće u takvoj specijalnosti kao što je voditelj podataka o kliničkim ispitivanjima - suština rada je u ispunjavanju izvješća i njihovom usklađivanju s tablicom standarda.
Ali kuhar ili vozač autobusa bit će traženi mnogo dulje jednostavno zato što mogu povezati neuronske mreže i stvarnost fizički svijet je prilično kompliciran, posebno u smislu zakona i propisa - hvala birokratima što su se udaljili Kriza AI!
Velike promjene očekuju se u industrijama koje su povezane s tiskanim materijalima i tekstualnim informacijama: novinarstvo, obrazovanje. S vrlo velikom vjerojatnošću za prvo, neuroni će vrlo brzo napisati nacrte sa skupom teza, u kojima će ljudi već unijeti bitne izmjene.
Najviše me vesele promjene u području obrazovanja. Jesti istraživanje, koji pokazuju da kvaliteta obrazovanja izravno ovisi o "osobnosti" pristupa i tome koliko vremena nastavnik posvećuje pojedinom učeniku. Najjednostavniji primjer: nastava u grupama od 30 ljudi po udžbeniku puno je lošija od individualne tutor za konkretne potrebe (iako po istom programu kao u udžbeniku). S razvojem umjetne inteligencije čovječanstvo će imati priliku pružiti personaliziranog asistenta svakom učeniku. To je jednostavno nevjerojatno! Uloga nastavnika pomaknut će se, kako ja to vidim, na stratešku i kontrolnu: određivanje općeg programa i redoslijeda učenja, provjera znanja i tako dalje.
7. Je li moguće učitati svoju svijest u računalo, napraviti digitalnog blizanca i živjeti vječno?
U smislu u kojem se to zamišlja na temelju znanstvene fantastike, br. Možete samo naučiti modela da oponaša vaš stil komunikacije, nauči vaše šale. Možda će modeli razine GPT-4 čak moći izmisliti nove uokvirene u vaš jedinstveni stil i način prezentacije, ali to očito ne znači potpuni prijenos svijesti.
Mi kao čovječanstvo, opet, ne znamo što je svijest, gdje je pohranjena, po čemu se razlikuje od drugih, što čini mene – mene, a tebe – tebe. Ako se iznenada ispostavi da je sve to samo skup sjećanja i iskustava, pomnoženih individualnim karakteristikama percepcije, tada će najvjerojatnije biti moguće nekako prenijeti znanje na neuronske mreže tako da one simuliraju budući život na njihovu osnovu.
8. Je li opasno uploadati svoj glas, izgled, svoj tekstualni stil govora u neuronsku mrežu? Čini se da se takav digitalni identitet može ukrasti.
U njih ne možete doslovno ništa preuzeti. Možete ih istrenirati (ili ponovno istrenirati) na takav način da rezultati budu sličniji vašem izgledu, glasu ili tekstu. A tako istrenirani model doista se može ukrasti, odnosno jednostavno kopirati skriptu i skup parametara za pokretanje na drugom računalu.
Možete čak i generirati video sa zahtjevom transfer novca na tuđi račun, u što će povjerovati vaš rođak: najbolji deepfake i algoritmi za kloniranje glasa već su dosegli tu razinu. Istina, potrebne su tisuće dolara i deseci sati snimanja, ali ipak.
Općenito, razvojem tehnologije pitanje identifikacije i potvrde identiteta postaje sve važnije.
I pokušavaju to riješiti na ovaj ili onaj način. Na primjer, postoji startup WorldCoin (zapravo, proizvodi kriptovalutu), u koji je uložio šef OpenAI-ja Sam Altman. Smisao pokretanja je da će svaki podatak o osobi biti potpisan vlastitim ključem za naknadnu identifikaciju. Isto će vrijediti i za masovne medije, kako bi se pouzdano znalo je li ova vijest istinita ili lažna.
Ali, nažalost, dok je sve to u fazi prototipova. I ne smatram da će duboko uvođenje sustava u sve industrije biti implementirano na horizontu sljedećeg desetljeća, jednostavno zato što je previše komplicirano i široko.
9. Mogu li neuroni početi štetiti i preuzeti svijet?
Opasnost nije trenutni razvoj događaja, već ono što će ga pratiti daljnjim razvojem. Trenutno nisu izumljene metode za kontrolu rada neuronskih mreža. Uzmimo, na primjer, vrlo jednostavan zadatak: pobrinuti se da model ne psuje. Baš nikad. Ne postoji metoda koja će vam omogućiti da slijedite takvo pravilo. Do sada možete pronaći različite načine kako ga svejedno "uzgajati".
Sada zamislite da govorimo o GPT-8 uvjetno, čije će vještine biti usporedive s vještinama najsposobnijih i najpametnijih ljudi. Neuronska mreža može programirati, koristiti internet, zna psihologija i razumije kako ljudi razmišljaju. Ako mu date odriješene ruke i ne postavite mu konkretan zadatak, što će onda učiniti? Što ako otkrije da se ne može kontrolirati?
Vjerojatnost lošeg razvoja događaja prema procjenama nije tako velika. Inače, općeprihvaćene ocjene nema - iako se svi svađaju oko detalja, oko štetnih posljedica i sl. Sada nazivaju približne brojke od 0,01% do 10%.
Po mom mišljenju, to su ogromni rizici, pod pretpostavkom da je najnegativniji scenarij uništenje čovječanstva.
Zanimljivo, ChatGPT i GPT-4 su proizvodi koje su kreirali timovi koji rade na problemima "usklađivanja" namjera ljudi i neurona (detalje možete pronaći ovdje). Zato modeli tako dobro slušaju upute, pokušavaju ne biti grubi, postavljaju razjašnjavajuća pitanja, ali to je još uvijek jako daleko od idealnog. Problem kontrole nije ni upola riješen. I dok ne znamo rješava li se uopće, i ako da, kojim metodama. Ovo je najvruća tema istraživanja današnjice.
10. Može li se neuronska mreža zaljubiti u osobu?
S trenutnim pristupima i arhitekturama neurona, br. Oni generiraju samo tekst koji je najvjerojatniji kao nastavak ulaznog teksta. Ako ubacite prvo poglavlje ljubavne priče, prepisujući je pod svoju osobnost, i zamolite model da odgovori na vaše ljubavno pismo, ona će se nositi s tim. Ali ne zato što sam se zaljubio, već zato što se najtočnije uklapa u kontekst i zahtjev "napiši mi pismo!". Zapamtite da modeli uče generirati tekst koji slijedi upute.
Štoviše, neuronske mreže u osnovnoj verziji nemaju memorija - između dva različita pokretanja sve zaborave i vrate se na "tvorničke postavke". Memorija se može dodavati umjetno, kao sa strane, tako da se u model ubaci, recimo, 10 stranica najrelevantnijih "uspomena". Ali onda se ispostavi da jednostavno unosimo skup događaja u izvorni model i kažemo: "Kako biste se ponašali u takvim uvjetima?" Manekenka nema nikakvih osjećaja.
Pročitajte također🧐
- Gdje i kako se koristi umjetna inteligencija: 6 primjera iz života
- 9 naivnih pitanja o umjetnoj inteligenciji
- 8 mitova o umjetnoj inteligenciji u koje čak i programeri vjeruju