Er is een beetje een spraakcommando -strijd op dit moment in de mobiele ruimte, met Apple’s Digital Siri Assistant en Google’s Voice Search Gebruikmakend tegen elkaar voor de genegenheden van gebruikers. Beide komen met hun eigen set van voor- en nadelen en zullen alleen maar beter worden naarmate we de toekomst binnengaan, maar het lijkt erop dat de onderzoeks- en ontwikkelingsteams van Microsoft hebben gewerkt aan iets dat achter de schermen van hun eigen stem heeft gewerkt dat de weg zou kunnen veranderen Mensen communiceren met elkaar.
Hoewel Siri veel krachtiger is dan de spraak zoeken van Google op het iOS-platform, werken ze allebei over het algemeen op dezelfde manier door hoorbare opdrachten van de gebruiker vast te leggen voordat ze die commando publiceren en verwerking op een back-end server voordat het resultaat wordt gespeeld Terug naar de gebruiker en op het verzoek handelen. Een video is gepost door Microsoft met een presentatie van Rick Rashid die de verbeteringen schetst die het bedrijf heeft aangebracht op het gebied van natuurlijke gebruikersinterfaces met behulp van menselijke spraak.
Computersystemen die begrijpen dat menselijke spraak geen nieuwe uitvinding is. We hebben in de loop der jaren veel releases gezien die aanzienlijke vooruitgang op dit gebied laten zien, waarbij Siri en Google Voice Search een paar van de meest recente voorbeelden zijn van hoe deze technologie in de echte wereld kan worden toegepast. Microsoft heeft echter stilletjes geprobeerd om dingen een paar stappen te ondernemen door een systeem te bouwen rond technologieën die niet alleen menselijke spraak kunnen herkennen, maar het ook vertalen in tekst van een vreemde taal en vervolgens de woorden in die taal herhalen met behulp van een gesynthetiseerde stem gegenereerd om als de luidspreker te klinken.
De demonstratie op het podium met de Chief Research Officer van Microsoft toont de technologie in actie door zijn gesproken Engelse woorden te herkennen, ze om te zetten in het Chinees op het geprojecteerde display en vervolgens hoorbaar exact dezelfde zin in het Mandarijn aankondigde. Dat alles is verbluffend genoeg, maar dan worden de dingen bovendien een beetje genomen als je je realiseert dat Rashid en zijn collega’s het systeem met meer dan een uur van zijn eigen spraakgegevens hebben gevoed om het systeem in staat te stellen de zin in het Mandarijn te herhalen met behulp van de zijne Eigen stem!
De technologie is niet het beste en het maakt nog steeds fouten, maar het is echt verbluffend om te beseffen dat dit mogelijk is. De toekomst van menselijke interactie is absoluut aan de horizon.
(via TechnetBlog)
U kunt ons volgen op Twitter, ons toevoegen aan uw cirkel op Google+ of zoals onze Facebook -pagina leuk vinden om uzelf op de hoogte te houden van alle huidige van Microsoft, Google, Apple en het web.