« Alexa » d’Amazon est plus intelligente et comprend beaucoup mieux les intentions des utilisateurs !

Amazon essaie de rendre son assistante vocale, Alexa, plus intelligente. Plus précisément, il acquerra la capacité de saisir le rythme naturel de la parole, de gérer des conversations avec plusieurs personnes, de comprendre le langage naturel et d’apprendre des utilisateurs. Si l’objectif initial est la maison intelligente, « Alexa for Business » suivra probablement.

Voici Alexa et le nouveau cerveau d’Echo.
Caractéristiques du processeur de bord neural AZ1 derrière Alexa et le nouvel Echo

La semaine dernière, Amazon a annoncé une nouvelle série d’orateurs intelligents pour Echo, ainsi qu’une nouvelle version d’Alexa et des améliorations de l’intelligence artificielle (IA).

Le nouvel Echo évolue dans le sens d’un dispositif informatique de pointe dans la maison intelligente. Par exemple, l’Echo est alimenté par le nouveau processeur neural AZ1 de la société, qui consomme 20 fois moins d’énergie que la génération précédente, tout en doublant les performances du traitement de la voix et en réduisant la consommation de mémoire de 85%.

Grâce à ce processeur et aux capacités d’intelligence artificielle de l’entreprise, Echo entend s’intégrer encore davantage dans son environnement. Selon Dave Limp, vice-président senior des appareils et services de la société, le nouvel Echo est désormais « axé sur les opportunités ».

L’entreprise vise à faire d’Alexa un membre de la famille avec des fonctionnalités telles que Reading Sidekick, qui aide les enfants à lire, et l’amélioration des compétences de conversation afin qu’ils n’aient pas à crier « Alexa » encore et encore.

Rohit Prasad, vice-président et responsable scientifique d’Alexa AI au sein de la société, a décrit les caractéristiques suivantes d’Alexa

  • Il trouve des indices dans les interactions des utilisateurs, reconnaît ses propres erreurs et tente de les corriger.
  • Il apprend des humains en posant des questions supplémentaires en réponse ou s’il manque de connaissances sur le mode qu’il a appris.
  • Comprendre les pauses et lire de nouveaux contextes grâce à l’utilisation de l’apprentissage profond (DL).
  • Parlez et adaptez-vous plus naturellement.
  • Mode de suivi lors de l’interaction avec les humains.

Selon M. Prasad, Alexa peut utiliser des repères visuels et sonores pour déterminer la meilleure action, et « la capacité à capturer le timing naturel des mots dans une conversation permet aux gens d’interagir avec Alexa à leur propre rythme », selon M. Prasad.

Dans l’interview, Prasad a déclaré que les capacités supplémentaires d’Alexa sont le résultat des progrès de l’IA et bénéficient également de la technologie conversationnelle. Il a déclaré que chacune des nouvelles capacités qui ont été ajoutées a pris des mois, voire des années dans le laboratoire. Par exemple, on dit que la capacité d’apprentissage instantané d’Alexa a mis trois à quatre ans à se développer.

Il a également déclaré qu’il a fallu des années pour établir la technologie sous-jacente en ce qui concerne la capacité d’Alexa à interpréter le contexte et à affiner la façon dont elle parle aux utilisateurs.

La capacité d’Alexa à saisir le rythme naturel de la parole dans une conversation a nécessité de multiples technologies, a-t-il dit. Par exemple, M. Prasad a déclaré qu’Alexa sépare la parole du bruit pour obtenir des indices linguistiques et utilise également des indices visuels lorsque c’est possible, a précisé M. Prasad.

Prasad a déclaré qu’en plus des modèles d’IA et des résultats logiciels, le processeur neural AZ1 d’Amazon contribue également aux nouvelles fonctionnalités d’Alexa, « Le processeur de cet appareil [Echo] sera important dans les conversations rapides », a-t-il dit, ajoutant que « le même processeur dans l’appareil L’accélérateur neural du système prend des décisions beaucoup plus rapidement », a-t-il poursuivi. Il y a également un avantage en termes de protection de la vie privée, car les données sont stockées/effacées dans l’environnement local.


La poursuite de l’informatique ambiante commence à la maison.
Limp a cité les nouveaux Echo et « Echo Show 10 » dans son aperçu, mais le thème qui revient tout au long de l’émission est que ces appareils suivront l’utilisateur comme un être humain.

Rohit Prasad en plein entraînement d'Alexa
Rohit Prasad en plein entraînement d’Alexa

L’interconnexion entre Alexa et Amazon sera renforcée.

Par conséquent, les nouveaux processeurs neuronaux fonctionneront tous sur un environnement local, mais seront capables de reconnaître la présence de mouvement, a déclaré M. Limp. Et il a ajouté que des dispositifs comme l’Echo Show continueront à utiliser des repères visuels, en plus du mouvement intelligent, pour maintenir l’utilisateur au centre des choses.

Il pourrait également être utilisé dans des contextes professionnels, tels que le carillon Amazon, l’intégration avec Zoom et les appels de groupe.

La semaine dernière, l’annonce du nouvel Echo était centrée sur l’idée d’une Alexa plus intelligente et de l’intégrer dans la famille. Mais on peut penser qu’Alexa for Business suivra de près la prochaine génération d’environnements de travail et de bureaux hybrides.

Amazon a lancé Alexa for Business il y a plus d’un an et a ajouté des fonctionnalités une par une via les services Web d’Amazon (AWS). Alexa Skill Blueprints » a été publié en avril 2018 dans le but de permettre à chacun de développer des compétences, et a été mis à jour en 2019 pour rendre ces compétences disponibles sur le « Alexa Skills Store ».

M. Prasad n’a pas parlé de spéculation sur la feuille de route d’Alexa for Business, mais il a déclaré que les nouvelles capacités d’Alexa autour d’Echo peuvent être appliquées à l’environnement de bureau tout en améliorant la productivité. Cela dit, les nouvelles capacités d’Alexa devraient être adaptables à des cas d’utilisation commerciale encore à découvrir, et M. Prasad a déclaré : « Alexa est très prometteur dans la mesure où il peut fondamentalement vous apprendre tout ce que vous voulez », a-t-il dit.