Maxim Polyakov: od čega se sastoje tražilice i kako je Google postao glavni (i još uvijek jest)
Miscelanea / / April 14, 2023
Jedina prijetnja globalnom lideru je pojava neuronskih mreža.
Što je veća količina informacija na webu, više su nam potrebne tražilice. Prvo mjesto među njima odavno je čvrsto zauzeo Google. Zašto je njegov izgled napravio revoluciju i što očekivati od razvoja web alata u budućnosti, rekao je profesor MGIMO-a i medijski menadžer Maxim Polyakov. Lifehacker je napravio sažetak svog predavanja na interdisciplinarnoj konferenciji Screenshot_2023, koji se održao u Moskvi 25. i 26. ožujka.
Maksim Poljakov
Novinar, medijski menadžer, profesor na Odsjeku za međunarodno novinarstvo MGIMO-a.
Kada su i zašto korisnici trebali tražilice
Količina informacija na planeti Zemlji neprestano se povećava. Stoljećima su se podaci prikupljali na analognim uređajima - prvo u rukopisima i knjigama, kasnije - na vinilnim pločama, na filmskim i video kasetama.
Godine 1993. bilo ih je digitalna pohrana podataka. I od tada udio digitalnih informacija raste. 2002. godine dolazi prekretnica: količina podataka u digitalnim izvorima postaje jednaka analognim izvorima. Digitalno doba je počelo. Od tada je zaliha digitalnih podataka eksponencijalno rasla, a s time se povećala i ukupna količina informacija na planetu.
Pojavljuje se problem: nije jasno kako u ovoj ogromnoj količini informacija brzo pronaći ono što vam treba. To je ono što tražilice rade.
Godine 1998., kada je Google prvi put ušao na tržište, postojalo je nekoliko usluga pretraživanja na internetu. Na primjer, portali AltaVista i Lycos bili su dostupni u Rusiji, a ukupno je bilo više od desetak takvih resursa: Netscape, Ask Jeeves, AOL, MSN i drugi. Google postao jedan od njih i pobijedio konkurente.
Zaključke o tome koliko je bolja od ostalih tražilica, još 1999. godine iznio je španjolski znanstvenik Ramon Salvera. Krajem 90-ih naišao je na zanimljivu disertaciju sa Sveučilišta Stanford. Zvao se "Istraživački radovi o Googleu i web bazi" i objavljen je 1997. godine. Njegovi autori bili su postdiplomci Sergey Brin i Larry Page.
Salvera je pročitao disertaciju i testirao niz za pretraživanje. I odmah je napisao članak za gradske novine "Navarski dnevnik" koji je nazvao "Google revolucija".
Ramon i ja razgovarali smo u čemu je tajna Googlea, a ja s vama dijelim zaključke - moje i njegove.
Maksim Poljakov
Kako su tražilice radile prije Googlea
Unesite u traku za pretraživanje zahtjev - na primjer, "željezarija". Algoritam pronalazi dokumente koji sadrže ovu frazu. Zatim, tražilica broji koliko se puta ključne riječi ponavljaju na stranici. Oni dokumenti, gdje ima više takvih referenci, spadaju u prve redove broja.
Važno: tražilica ne zna koje su to stranice - možda web stranice trgovina ili možda samo resursi koji pišu o gradnji. Stoga algoritam ne može odrediti koliko će korisni dokumenti u rezultatima pretraživanja biti korisni korisniku. Kao rezultat toga, osoba dobije dugačak popis stranica i mora otvoriti svaku stranicu i dugo tražiti one prave među njima.
Kako je Google iz temelja promijenio pravila pretraživanja
Glavna stvar koja se pojavila u Googleu je PageRank, novi algoritam pretraživanja. Brin i Page su zaključili da se ne bi isplatilo pretraživati na Internetu pojedinačne dokumente redom na zahtjev, a zatim ih izdavati na popisu. Morate ih istražiti sve odjednom. Istodobno, važno je s općeg popisa odabrati one koji će biti najznačajniji za korisnika.
Najteže je pronaći pravi kriterij koji bi pokazao autoritet dokumenta. Da bi to učinili, autori su razvili posebnu formulu i nazvali dobivenu vrijednost PR-a - PageRank.
Revolucionarno otkriće tvoraca Googlea - izbor kriterija za procjenu važnosti dokumenta. Postali su karike.
Glavna stvar koja je uzeta u obzir u novom algoritmu je koliko se puta drugi resursi odnose na dokument. Onaj koji se najčešće spominje postaje prvi na ljestvici i prepoznaje se kao najmjerodavniji. Na primjer, ako sedam od deset stranice odnosi se na jednog, onda je vođa on.
Kao rezultat, odabrano je nekoliko čvorova koji imaju najviše veza. Nadalje, formula uzima u obzir spominje li naš pronađeni "broj jedan" neke dokumente. Ako postoje takve stranice, one odmah rastu na ljestvici. Veze na dokumente s vrha popisa uvijek teže od veza s izvorima ispod.
Eventualno korisnik u rezultatima pretraživanja vidi stranice koje su mu stvarno korisne. Ne treba trošiti vrijeme na analizu stranica na kojima se spominju ključne riječi – Google je to već učinio za njega.
Korisniku nije potrebno 20 minuta ili sat vremena da s popisa odabere željenu stranicu. Ovo je postala jedna od ubojitih prednosti Googlea. Ova se tražilica, bez ikakve reklame, odmah proširila svijetom, svi su je slali jedni drugima i govorili: "Pa probaj, vidi kako radi."
Maksim Poljakov
Kako je Google došao na vrh i zašto drži vodstvo
Osnivači Googlea nisu stvorili samo algoritam pretraživanja. Razvili su arhitekturu tvrtke i osmislili glavne principe njezina rada.
Brin i Page registrirali su Google 1998. i počeli graditi svoju budućnost. korporacija u garaži Susan, Brinove prijateljice. Na bijeloj ploči dečki su napisali: "Fokusiraj se na korisnika." Malo kasnije formulirali su misiju tvrtke.
Naš cilj je sistematizirati sve informacije dostupne u svijetu i učiniti ih dostupnima i praktičnima za korištenje.
Sergey Brin i Larry Page
Za Google je od samog početka prioritet bio onaj tko postavlja upit za pretraživanje, a ne organizacije koje su izradile stranice i čekaju nove kupce. Stoga je tvrtka odmah odlučila: oglašavanje trebaju biti jasno odvojeni od rezultata pretraživanja, a osoba ne smije brkati organske rezultate pretraživanja s plaćenim oglasima. Ovo je pravilo privuklo korisnike i pomoglo u povećanju publike.
Vrlo je važno. Ljudi dolaze samo zbog kvalitetne pretrage. Ne pronaći relevantan oglas za željezariju, već pronaći pravu trgovinu koja je sada potrebna.
Maksim Poljakov
Tvrtka je brzo primila prvu ulaganja. Google je početkom 2001. godine ušao među deset najpopularnijih internetskih resursa i lako se popeo do pete linije. Godine 2004. projekt prestaje biti "garažni" i izlazi na burzu. Korporacija je 2006. kupila YouTube i tvrtku koja je razvila operativni sustav Android. Ove su akvizicije ubrzale rast.
U ožujku 2006. Google se popeo na prvo mjesto među svim internetskim resursima. U studenom 2009. nakratko je izgubio prvenstvo od Yahooa!, ali je u siječnju 2010. vratio svoju poziciju i još uvijek je na čelu.
Danas Google za korisnike predstavlja nekoliko platformi:
- Algoritam pretraživanja.
- Usluga kontekstualnog oglašavanja.
- preglednik.
- Operativni sustav za pametne telefone.
- Deseci usluga za obične korisnike i tvrtke: pošta, karte, dokumenti, proračunske tablice i još mnogo toga.
Važan razlog uspjeha tvrtke je korporativna kultura.
Brin i Page su pri odabiru novog zaposlenika predložili provođenje misaonog eksperimenta: zamislite da s tom osobom morate provesti šest sati u zračnoj luci jer let je odgođen. Koliko će mu biti ugodno?
Na taj su način stvorili okruženje u kojem se ljudi uklapaju. To je bilo potrebno za razvoj tvrtke i nastanak inovacija.
Sve je to dovelo do toga da danas u svim zahtjevima korisnika prema tražilicama Google zauzima 92,21%. Ovo je globalni monopol.
Ono što je dobro o "Yandexu" - glavnom konkurentu Googlea u Rusiji
Postoje samo dvije zemlje u kojima Google ima ozbiljne konkurente, a kompanija im ne može ništa. Ovo je Kina - tamo se 68,66% pretraga odvija na lokalnom portalu Baidu. A Rusija - imamo više od 45% zahtjeva koje prima "Yandex".
Ovu tražilicu stvorili su Ilya Segalovich i Arkady Volozh 1997. godine - dakle, gotovo istovremeno s Googleom. Danas je Yandex stranica broj 1 u Rusiji.
Kao i Google, to je sustav platforme. Platforma objedinjuje nekoliko različitih usluga koje pokrivaju različite potrebe klijenta. I ovdje je na prvom mjestu tražilica algoritam. Vrlo je dobar, ali o tome kako radi ne zna se toliko koliko o Google algoritmu.
Nedavno kažu: “Mi uopće ne znamo kako naš algoritam radi - ovo je Matrix Net, naša neuronska mreža, radi s njom i stalno se poboljšava.” Poznato je da dobro djeluje, ali ne znamo od čega se sastoji.
Maksim Poljakov
Osim tražilice, Yandex ima platformu za oglašavanje i preglednik. Plus dodatne usluge: pošta, karte, disk, tržište i drugi. Najveću zaradu danas donose Yandex Taxi i usluge dostave.
Što mijenja ChatGPT u našem odnosu s tražilicama
2023. godine, dakle upravo sada, događa se još jedna revolucija. Google je i dalje lider, i još neko vrijeme će zadržati prvo mjesto, ali ne znamo što će biti dalje.
Neke stvari su se promijenile 2023. Pojavila se neuronska mreža. ChatGPT je pokrenuo tako nepokolebljivu industriju kao što je pretraživanje i kontekstualno oglašavanje.
Maksim Poljakov
U veljači CEO Microsoft Satya Nadella je tijekom govora u uredu svoje tvrtke najavio da je započela nova era. Prema njemu, cjelokupna povijest web tehnologija podijeljena je u tri faze:
- Osobno računalo + server.
- Mobilne tehnologije + sustavi za pohranu u oblaku.
- Umjetna inteligencija.
Na samom smo početku novog, trećeg doba. Zna se čak i datum početka - Satya Nadella je to rekao 8. veljače 2023. godine.
ChatGPT stekao milijun korisnika u 5 dana. Ovo je najbrži uspon u povijesti Interneta. Prethodnom lideru, Instagramu*, trebalo je 75 dana da postigne isti rezultat.
Neuronska mreža sada je integrirana u tražilicu Bing. Pitanje u traci za pretraživanje zvuči ovako: "Pitaj me bilo što" ili "Pitaj me nešto." ChatGPT odgovara na složena pitanja, i to detaljno. Štoviše, može se nositi sa zadacima koji su se prethodno koristili u Turingov test. Prije toga, uvijek je pomagao razlikovati osobu od strojnog algoritma, ali sada se sve promijenilo.
Sergey Brin vratio se u Google nakon pet godina odmora. Morao se vratiti na posao jer je zbog pojave neuronskih mreža u tvrtki proglašen crveni stupanj upozorenja. Google se pokušava aktivirati bard — vlastiti chatbot. Vjeruje se da su njegovi parametri pet puta veći od mogućnosti GPT-a. Ali ova neuronska mreža još nije u potpunosti operativna.
Svijet se okrenuo na drugu stranu i Google će kao globalni monopol vjerojatno prestati postojati. Ali da vidimo. Mogući su razni scenariji.
Maksim Poljakov
* Aktivnosti Meta Platforms Inc. i njegove društvene mreže Facebook i Instagram zabranjene su na području Ruske Federacije.
Pročitajte također🧐
- 8 tražilica koje su bolje od Googlea
- Gdje možete ugraditi ChatGPT i zašto: 5 opcija
- Tehnološka posebnost: je li istina da će nam tehnologija uskoro izmaknuti kontroli