Huis Vooruit denken Intelligente assistenten: wat komt er na siri?

Intelligente assistenten: wat komt er na siri?

Video: Google Assistant vs Apple Siri: Smart Assistant Battle 2020 Edition! (November 2024)

Video: Google Assistant vs Apple Siri: Smart Assistant Battle 2020 Edition! (November 2024)
Anonim

Intelligente assistenten - Siri, Google Now, Cortana en dergelijke - zijn enkele jaren geleden overgestapt van curiosa en salontrucs naar essentiële tools die veel mensen in hun dagelijks leven gebruiken. Vorige week kwam ik langs bij de Intelligent Assistants Conference in New York, gepresenteerd door Opus Research, en was onder de indruk van de vooruitgang die de software boekt in verschillende industrieën, waaronder de vooruitgang van financiële, verzekerings- en medische bedrijven bij het bouwen van specifieke agenten.

Opus Research-oprichter Dan Miller legde uit dat veel van de kerntechnologieën, zoals spraakherkenning, al meer dan 20 jaar bestaan. Hoewel hij onlangs enkele grote verbeteringen heeft gezien, in plaats van een revolutie, zei hij: "We zijn op een evolutionair pad", met veel producten op een continuüm met verschillende mogelijkheden. Hij merkte op dat er honderden intelligente bedrijfsassistenten zijn die kunnen worden gebruikt voor een eenvoudig tekstgebaseerd gesprek in gewoon Engels met behulp van een vaste gegevensset, en voor dingen zoals het navigeren op een website of een veelgestelde vraag. Aan de andere kant van het spectrum zijn er waarschijnlijk slechts enkele tientallen "dynamische, menselijk aanvoelende apps" die meer conversatie- en contextbewust zijn.

Miller wees op aanvragen die op de conferentie prijzen hebben gewonnen. Amtrak's Julie begon jaren geleden als een interactieve voice-response telefoondienstagent, maar is nu uitgegroeid tot een agent die op de website werkt om reizigers door Amtrak.com te leiden, op basis van een agent van Next IT. Telefonica Mexico heeft een agent genaamd Nico die een avatar heeft en ook ondersteuning biedt via Twitter en Facebook, gebaseerd op het platform van AgentBot. ING Nederland heeft Inge, een app waarmee u uw bankrekening kunt controleren of geld kunt overboeken via spraak, met behulp van biometrische spraaktechnologie van Nuance, om uw identiteit te verifiëren.

Eervolle vermeldingen omvatten zorgtoepassingen, zoals een app die u helpt bij het kiezen van een zorgplan. Andere toepassingen waar ik tijdens de show van hoorde, zijn Domino's Pizza, met een app genaamd Dom waarmee je spraak kunt gebruiken om pizza te bestellen; en BMW, die een virtuele agent heeft als onderdeel van zijn Up2drive-autofinancieringsarm.

Brett Beraneck van Nuance sprak over hoe de vooruitgang in diepgaande neurale netwerken dingen zoals natuurlijk taalbegrip en spraakherkenning heeft verbeterd, en hoe dit nu samenkomt om veel meer interesse in het veld mogelijk te maken. De Nina-assistent van Nuance was een vroeg voorbeeld en is sindsdien uitgegroeid tot een groot aantal specifieke toepassingen, variërend van interactieve spraakresponssystemen bij verzekeringsmaatschappijen tot winkel-apps. Elk van deze toepassingen heeft een andere persoonlijkheid, afhankelijk van wat het u probeert te helpen.

Een grote nieuwe functie die hij besprak, was stembiometrie, waarbij je stem een ​​wachtwoord vervangt. Hij vertelde over hoe bedrijven zoals ING in Europa agenten ontwikkelen die niet alleen spraakherkenning en natuurlijke taalverwerking gebruiken, maar ook spraak beginnen te gebruiken om de persoon die belt te herkennen. Hij zei dat dit zowel veiliger als natuurlijker was dan een traditioneel wachtwoord.

Hoewel recente studies bezorgd zijn dat spraakopnames dergelijke systemen voor de gek kunnen houden, merkte Nuance op dat de technologie van vandaag functies bevat die zijn bedoeld om afwijkingen van opgenomen stem op te vangen en wees op andere studies die een ander standpunt innamen. Trouwens, zei hij, ontwerpers kunnen verschillende niveaus van stembiometrie gebruiken voor verschillende functies, zoals het gebruiken van eenvoudige herkenning om een ​​rekeningsaldo te controleren, of je vragen om een ​​willekeurige reeks woorden terug te herhalen voor significante geldoverdrachten.

Stembiometrie lijkt zeker een beetje grip te krijgen. Tijdens het Gartner Symposium van vorige week bevatte een sessie over "coole klantcases" in financiële dienstverlening een Citibank-app die deze functie gebruikte.

MyWave heeft een assistent genaamd Frank, die bedoeld is om door meerdere bedrijven te worden ingeschakeld zodat u met hen op een meer gemoedelijke manier kunt communiceren, in plaats van dat elk bedrijf zijn eigen bedrijf ontwikkelt. Het eerste gebruik omvat een Nieuw-Zeelandse bank en een app genaamd Saveawatt, ontworpen om u te helpen bij het kiezen van uw elektriciteitsleverancier.

CEO Geraldine McBride legde uit dat het bedrijf assistenten probeert te creëren die de kloof tussen klanten en service-apps overbruggen, met wat het "klantbeheerde relaties" of CMR noemt, een spin op traditionele CRM-applicaties. Een groot verschil, zei ze, is dat de klant de leiding heeft over al zijn of haar gegevens, in plaats van het bedrijf.

Een ander relatief nieuw bedrijf, Expect Labs, heeft een product genaamd MindMeld dat werkt als een backend voor een aantal bedrijven die een spraakinterface willen aanbieden om traditionele interfaces te vervangen en vragen en antwoorden af ​​te handelen. Dit kan worden gebruikt voor verschillende toepassingen, zoals het bekijken van tv-programma's door alleen de naam te vragen en het systeem meerdere systemen te laten doorzoeken. (Fire TV van Amazon heeft enkele van deze functies, maar is niet geïntegreerd in uw settopbox voor kabels, terwijl een van de investeerders in Expect Labs kabelbedrijf Liberty Global is.)

CEO Tim Tuttle legde uit dat MindMeld de spraakherkenning gebruikt die al op de meeste apparaten beschikbaar is en richt zich in plaats daarvan op natuurlijk taalbegrip en het bouwen van een kennisgrafiek van de beschikbare informatie. Hij zei dat het bedrijf het systeem probeert op te schalen om meer informatie uit meerdere bronnen op te nemen en de hiërarchieën van verschillende soorten informatie die deel uitmaken van de meeste van dergelijke systemen op te splitsen. Vragen echt begrijpen betekent dat je de intentie in verschillende categorieën kunt begrijpen, zei hij.

Een ding dat ik van een aantal aanwezigen hoorde, waren statistieken die suggereren dat ongeveer 10 procent van alle zoekopdrachten op internet nu via intelligence-agenten gebeurt. (AI-pionier Andrew Ng zei vorig jaar dat dit waar was voor gesproken zoekopdrachten in Baidu en verschillende mensen zeiden dat dit nu ook waar was bij Google, maar ik heb geen bevestiging uit de eerste hand gehoord.)

Vooruitkijkend zei Miller van Opus Research dat er nog veel werk aan de winkel was. De basisnauwkeurigheid van de systemen heeft veel ruimte voor verbetering, met name bij het verplaatsen van wat u zegt naar wat u bedoelt naar wat u als resultaat moet doen. Hij noemde een toespraak van Xerox PARC CEO Stephen Hoover op de conferentie, die zei dat de systemen van vandaag tot 90 procent nauwkeurig zijn in het begrijpen van wat we bedoelen, maar dat 10 procent nog steeds een probleem is, want dat is wat de meeste mensen onthouden bij het omgaan met een systeem. En Miller zei dat er ruimte is voor betere personalisatie, want als het systeem weet met wie het praat, kan het betere resultaten opleveren. Hij merkte bijvoorbeeld op dat Facebook weet wie het systeem gebruikt omdat u bent ingelogd; en zei dat naadloos dit doen met meer agenten belangrijker zal worden.

Het is zeker een fascinerende categorie, en ik verwacht dat we allemaal veel meer tijd zullen spenderen aan het praten met onze telefoons en computers, en interactie met agenten die niet helemaal menselijk zijn. Ik vind dit een van de meest intrigerende trends in computers tegenwoordig.

Intelligente assistenten: wat komt er na siri?