Strojni jezik: kako Siri pokupi svoj glas?
Makradar Tehnologije / / December 19, 2019
Google, Apple, Microsoft, pa čak i Amazon aktivno razvijaju svoje govorne usluge. Svježe pečena na iOS 7 je isti Siri, samo nove funkcije i... glas. Pitate li se kako je ovaj proces? Kao što su računala uči govor? ovo prava umjetnost.
Za svaki od glasova Siri - vaš glumac. Nakon što je završio svoju ulogu u artikulaciji, rad je tek počela... Čovjekov glas nastavlja svoj put. Priča o ovom putovanju, i od ljudi i robota - jedan od najsloženijih tehnoloških procesa, koji se ne može provesti prije deset godina.
Neka je upoznati se sa direktorom dizajna i razvoja govorne Nuance, to je jedan od najvećih neovisnih tvrtki u svijetu koje se bave prepoznavanja govora i teksta u govor. Brant Ward (J. Brant Ward) koristi se skladatelj, sastaviti stranke za gudačkih kvarteta za sintisajzer, a sada ga je sastavlja primjenom sintetskih glasove. On radi u govoru sintezu industrije u Silicijskoj dolini već više od desetljeća.
Tekst u govor - vrlo konkurentne industrije i njezinih zaposlenika je vrlo tajnovit. Iako u svijetu i smatra da Nijansa stvara glas Siri za Ward i njegov kolega David Vasquez (David Vazquez) izbjegne direktan odgovor. Ipak, složili su se da objasniti, barem u općim uvjetima, kako je proces stvaranja nevjerojatnih glasova stroj.
Nepotrebno je reći, nema potrebe da se artikulira i napisati svaku riječ iz rječnika. No, kada je riječ o primjeni, koje treba čitati bilo kakve vijesti u vaš newsletter ili pronašli nešto za vas na internetu, to je jednostavno dužan govoriti svaku riječ u rječniku.
Većina prijedloga su odabrani na „bogatstvo fonetike” - to jest, oni sadrže mnoge različite kombinacije fonema. „Činjenica je, više podataka imamo, više realan rezultat će biti”, - kaže Ward.
Nakon što je tekst snimljen uživo glasovni glumac (mučan proces koji može potrajati i nekoliko mjeseci), počinje vrlo težak posao. Riječi i rečenice su analizirani, podijeljene po kategorijama i snimljene u velikoj bazi podataka. U ovom složenom poslu koji su uključeni tim posvećenih lingvista, kao i koristiti svoj jezični softver.
Kada se sve to učinio, jedinica Nuance prevesti tekst u govor stvara bitne riječi i fraza koje je glumac može Nikad zapravo izgovorio, ali zvuči vrlo sličan govoru glumca, jer tehnički je glas glumac.
Postupak je govor bez svijesti. Mi to učiniti bez razmišljanja o tome kako nastaje taj proces: situacija u kojoj je naš jezik, koji odnosi su sagrađena između fonema, i tako dalje - za jednostavno i učinkovito izražavanje složenih ideja i emocije. No, kako bi se računalo podići zvuk ljudskih glasova, svi ovi faktori moraju biti uzeti u obzir. Kao jedan profesor lingvistike, je zadatak „Titanica”.
Vi ne bi trebali misliti: „Govorim na računalo.” Vi obično ne morate razmišljati o tome.
„Moja djeca u interakciji s od Siri, kao da je živo biće... Oni ne osjećaju razliku,” - kaže Ward.
Do sada, i prijateljstva između ljudi i robota - kao što su ljudi. Mnogi ljudi bi željeli ako Siri može prepoznati emocionalno stanje govornika, a na neki način reagirati na to (na primjer, uključivati umirujuće glas način). Zamislite - razgovarati s robotom, koji moralno vas tapkanje na glavi. Možda, Nuance već razmišlja o tome ...