Video: Spraakgestuurd typen - Spraak naar tekst met Nederlandse leestekens (November 2024)
Een van de meest indrukwekkende demo's bij Google I / O was Duplex, een kunstmatige intelligentie die vestigingen naar bedrijven - in dit geval een kapsalon en een restaurant - belde om afspraken te boeken. De mensen aan de andere kant van de lijn waren blijkbaar niets wijzer en Duplex ging uitdagingen gemakkelijk aan, zoals toen het restaurant zei dat het geen reserveringen voor kleine partijen accepteerde.
Deze specifieke AI-aankondiging kreeg veel aandacht op Google I / O, maar AI en machine learning waren gangbaar in alle producten en diensten die op de ontwikkelaarsconferentie werden getoond. Kijk maar eens naar deze grafiek, die Google heeft getoond tijdens een AI-gericht analistenevenement de dag voordat I / O werd geopend.
Er waren tijdens dat evenement nog twee andere dingen die ik als potentiële spelwisselaars beschouw.
De eerste is hoe AI wordt toegepast op de vertaling van stem naar tekst. Het doel is om dit met 99% nauwkeurigheid te krijgen met AI en ML in de komende jaren. Dat gezegd hebbende, de demo's waarin ze opmerkingen in verschillende G-Suite-toepassingen dicteerden, waren al behoorlijk nauwkeurig. We zagen ook een meer diepgaande demo van Smart Compose, waarbij een persoon een zin in Gmail schrijft en Smart Compose de volgende zin voor u schrijft op basis van de context van de eerste zin.
Google begrijpt het belang van spraak-naar-tekst in relatie tot ons dagelijks leven. Een nauwkeurige spraak-naar-tekst-interface is van cruciaal belang bij het beantwoorden van een bericht tijdens het rijden. Het is een zinvolle manier om te reageren op een e-mail of sms op wearables of smartphones. Het wordt uiteindelijk een waardevolle input bij het gebruik van mixed reality-brillen, waarbij spraak als onderdeel van het navigatieproces en spraak-naar-tekst nodig is voor verschillende soorten AR-toepassingen.
De tweede is hoe AI en ML worden gebruikt in Google Translate, wat echt transformerend zal zijn wanneer vertalingen in realtime plaatsvinden. Als een internationale reiziger die alleen Engels spreekt, zou dit type vertaling een uitkomst zijn. Er zijn enkele draagbare apparaten die proberen te vertalen wat je zegt in een lokale taal, maar ze hebben momenteel veel beperkingen.
Google heeft dit soort vertalingen in het oog, dus het is veilig om te zeggen dat we binnenkort een echte doorbraak kunnen zien in een meer accurate taalvertaling op Android-telefoons. Apple heeft ook AI- en ML-onderzoek gaande rond verschillende aspecten van spraak- en tekstvertaling, zodat ook dit, samen met potentiële partners, op een dag een mobiele vertaaloplossing voor iOS zou kunnen leveren.
AI en ML zullen een dramatische impact hebben op de vertaling van spraak naar tekst, en het meest prominente effect ervan kan zijn als onderdeel van de gebruikersinterface in AR en VR of een bril met een gemengde realiteit. Persoonlijk boeien de taalvertalingen me het meest, omdat het mijn wereld gemakkelijker zou maken om te reizen.