Microsoftin esittely englannista kiinaan-kääntäjä, joka pitää äänesi ja aksenttisi

Star Trek -tulkki

Kiinassa järjestetyssä tapahtumassa Microsoftin tutkimuspäällikkö Rick Rashid on osoittanut reaaliaikaisen englannista mandariiniin puheesta puheeksi -koneen. Käännös ei ole vain erittäin tarkka, vaan ohjelmisto säilyttää myös käyttäjän aksentin ja intonaation. Emme puhu vain digitalisoidusta, robottikääntäjästä - tämä on tiukasti alueen ulottuvuuksissa Tohtori Who tai Star Trek yleiskäännös.



Paras tapa arvostaa tätä tekniikkaa on katsoa alla oleva video. Noin kuusi ensimmäistä minuuttia Rick Rashid selittää tietokonekäännöksen perustavanlaatuisia vaikeuksia, ja sitten viimeiset minuutit osoittavat ohjelmiston englannista mandariiniin puheesta puheeksi -koneen. Valitettavasti en puhu kiinaa, joten en voi todistaa käännöksen oikeellisuutta, mutta yleisö - noin 2000 kiinalaista opiskelijaa - vaikuttaa melko vaikuttuneelta. Ammattimainen englannin / kiinan tulkki huomautti myös, että atk-käännös on yllättävän hyvä; ei aivan inhimillisen käännöksen tasolle, mutta se on lähestymässä.



On tietysti paljon teknisiä velhoja kulissien takana. Aluksi ohjelmisto on koulutettava - sekä muutaman tunnin äidinkielen, kiinan puhumisen että tunnin Rick Rashidin puhutun englannin kanssa. Tästä johtuen ohjelmisto hajottaa puheenne olennaisesti pienimpiin komponentteihin (foneemeihin) ja yhdistää ne sitten kiinankielisen vastaavan kanssa luomalla iso kartta englannin ja mandariinin kielistä. Tämän jälkeen ohjelmisto muuntaa todellisen lavalla esityksen aikana puheensa tekstiksi (kuten näet vasemmalla näytöllä), tekstinsä mandariinitekstiksi (oikea näyttö) ja sitten harjoituksen aikana luodun Rashid / Chinese-muunnoksen. prosessia käytetään muuttamaan tekstiä puhutuiksi sanoiksi.



Lopputuloksessa on ehdottomasti vahva vihje digitalisoidusta, robottisesta Microsoft Samista, mutta on yllättävää, kuinka suuri osa Rashidin aksentista, sävystä ja intonaatiosta säilyy.

Tarkkuuden suhteen Microsoft sanoo, että koko järjestelmässä virheprosentti on noin yksi sana kahdeksasta - parannus 30% verrattuna yhden sanan viiteen edelliseen parempaan. Tällaisen dramaattisen parannuksen mahdollisti Syvät hermoverkot , koneoppimistekniikan, jonka on suunnitellut Geoffrey Hinton Toronton yliopistosta. Syvä hermoverkko on pohjimmiltaan keinotekoinen hermoverkko (ohjelmisto, joka mallintaa tuhansia toisiinsa yhteydessä olevia ”hermosoluja”), mutta muutamalla muutoksella, jotta se jäljittelee tarkemmin ihmisen aivojen käyttäytymistä.

Suuri kysymys on, milloin Microsoft Researchin puheesta puheeksi käännösohjelmisto todella löytää tiensä markkinoille - ja kyllä, jos mietit, ohjelmisto ei rajoitu vain englantiin ja kiinaan; kaikkia Microsoft Speech Platformin tukemia 26 kieltä voidaan käyttää, mukaan lukien mandariinista englantiin. Ilmeisin käyttötapaus olisi Windows Phone 8 (tai 9?) -Älypuhelimessasi tai Skype: Voisit kutsua yrityksen Kiinaan, Saksaan tai Brasiliaan, puhua normaalisti englanniksi ja he kuulevat äänesi paikallisella kielellä . Voit käyttää älypuhelinta myös yleiskääntäjänä matkoilla. Kuten alla voit nähdä, Microsoft leikkii reaaliaikaisella puhelimelta puhelimelle käännöksellä aina vuonna 2010:

Oletettavasti Microsoft työskentelee tällaisten sovellusten parissa - mutta sitä todennäköisesti pidättävät käytännön näkökohdat, kuten puheesta puheeksi-käännöksen edellyttämä prosessointiteho tai helppokäyttöisen käyttöliittymän tarjoaminen koulutus- / oppimisprosessille. Itse koulutusprosessi saattaa vaatia enemmän prosessointitehoa kuin kotikäyttäjä pystyy toteuttamaan. Pilviä on kuitenkin aina!

Copyright © Kaikki Oikeudet Pidätetään | 2007es.com