Video: Skype Translate demo at Microsoft's Worldwide Partner Conference 2014 (November 2024)
Als u de computerrevolutie vanaf het begin van de microprocessor zou volgen, zou u weten dat er een aantal vroege beloften is die nog moeten worden nagekomen.
Een van deze is on-the-fly vertaalde spraak, waar je iets in het Engels zegt en het wordt bijna in realtime herhaald in een andere taal, zoals Spaans. Hoewel het nog steeds bezig is, is Microsoft nu een stap dichterbij met Skype Translator, waarvan de eerste fase deze week live is gegaan.
Als dit dichtbij het werken komt en geen grap is, is het het product van het decennium. Op dit moment ondersteunt Skype Translator vertalingen Spaans-Engels en Engels-Spaans, maar er volgen nog meer talen.
Het typische probleem met dit soort dingen is het schandalige moeilijkheidsniveau. Ik heb nog geen fatsoenlijk vertaalpakket gezien dat tekst-naar-tekst vertalingen doet die goed werken. Spraakvertaling heeft een heel ander moeilijkheidsniveau, vooral in realtime.
Microsoft heeft een film met twee kinderen die in het Spaans en Engels spreken, waardoor het lijkt alsof het goed werkt. Maar ik zag bijna twintig jaar geleden een soortgelijk systeem van IBM dat nooit het daglicht zag. IBM's versie werd ontwikkeld in de jaren 1990, toen er een spraakherkenningsmanie was onder leiding van Lernout & Hauspie, een bedrijf dat failliet ging - voordat het in 2001 een fraudeschandaal brak. Maar daarvoor kocht het elke spraaktechnologie bedrijf dat het zou kunnen, inclusief Dragon Systems, Berkeley Speech Technologies, Fonix, Dictaphone en anderen. Microsoft had een belang van 8 procent in L&H en eindigde met een aantal van de technologieën als cadeau bij een faillissement.
Bekijk de ellendige computer-naar-tekst computervertalingen van Google en anderen. Tekst kan en kan de meest voor de hand liggende fouten niet vermijden. Niets van dit alles benadert de complexiteit van spraakvertaling, hetgeen zware signaalverwerking met zich meebrengt.
Ik ben een wijnverzamelaar en bezoek regelmatig Franse wijnwebsites. Mijn Frans is alleen goed, dus ik schakel de vertaling vaak in om het lezen van de site te versnellen. Hier zijn we in 2014 en geen van de vertalers kan achterhalen dat de vertaling van Château Margaux Château Margaux is, niet Kasteel Margaux. Hoe moeilijk is het om een algemeen gebruikt woord dat in een juiste naam wordt gebruikt, zoals château, meestal verwijzend naar een specifieke wijnmakerij, te onthouden en niet te vertalen in het woord kasteel? Blijkbaar is het onmogelijk. Ze doen het allemaal.
Hoe moeilijk is het om een uitzondering te schrijven in de code die de vertaler vertelt dat het op een website staat over Bordeaux-wijn? Terwijl op die site het woord kasteel niet betekent kasteel. Vaak probeert de vertaler ook de rest van de naam van het kasteel te decoderen, met belachelijke resultaten. Het beste wat u over het algemeen met tekstvertaling kunt doen, is een idee krijgen van wat de site zegt.
Stel jezelf de vraag: als tekst zo moeilijk is, hoe gaat Microsoft dan om met spraak?
Het is bijna onmogelijk, zelfs in dezelfde taal. Neem de Google Voice-telefoonservice. Het heeft een functie voor het nemen van spraak naar tekst. Ik heb nog nooit een voice-to-text-bericht ontvangen dat zelfs in de buurt komt van wat de persoon eigenlijk zei. Niet een keer.
Ik zal toegeven dat stemherkenning in een stille ruimte duidelijk en duidelijk spreekt. Ik gebruik het voor sms-berichten op mijn Android-telefoon. Maar in een echt gesprek praat niemand zo. Ik bewonder Microsoft dat hij dit heeft uitgerold. Maar het zal niet werken zoals geadverteerd.
Dat gezegd hebbende, het is tenminste iets om mee te spelen. Het kan zelfs leiden tot een nieuwe generatie onderzoek. Dus ik zal niet te veel klagen.
Iedereen wil dit. Laten we eraan werken.