Header Ads Widget

Ticker

6/recent/ticker-posts

Los asistentes virtuales aprovechan el poder de los desarrolladores de terceros

 

Asistentes virtuales aprovechan el poder del desarrollador de terceros

En un artículo reciente hablamos sobre la domótica y el concepto de asistentes virtuales . Aunque Alexa de Amazon es una de las asistentes virtuales (VA) más emocionantes, todavía no es la más conocida; ese honor tiene que ser para Siri de Apple , que actualmente está experimentando grandes cambios.

En junio de 2016, en su última WWDC, Apple anunció que las aplicaciones de terceros ahora pueden ser (con varias limitaciones clave) operadas por Siri. Eso está muy lejos de la situación anterior: Siri anterior a iOS 10 se puede usar para lanzar aplicaciones nativas de Apple, pero eso es todo. Para lo que se promociona como un gran movimiento, la respuesta ha sido mixta en el mejor de los casos: Seeking Alpha y ArsTechnica han llamado a SiriKit "anticuado" pero lleno de "potencial sin explotar" respectivamente.

Tal vez eso no sea sorprendente, ya que otros servicios como Google Now y Alexa ya están haciendo mucho de lo que Apple parece sugerir que es totalmente nuevo. En esta publicación, veremos algunas de las mecánicas de SiriKit y cómo se compara con productos similares en el mercado, arrojando luz sobre cómo los asistentes de IA con actitudes de puerta abierta hacia los desarrolladores externos se están configurando para el éxito futuro.

SiriKit: conceptos básicos y limitaciones

Como se puede ver en la Guía de programación de SiriKit, SiriKit actualmente funciona con siete dominios diferentes :

  • Reserva de viajes (por ejemplo, servicios de uso compartido de automóviles y taxis)
  • Mensajería
  • Búsqueda de fotos
  • Pagos
  • Llamadas VoIP
  • Entrenamientos
  • Reservas de restaurantes (solo a través de Apple Maps)
  • Clima / Audio (por ejemplo, cambiar el termostato del automóvil o la estación de radio)

A primera vista, esto parece una colección heterogénea de servicios con pocos hilos comunes que los mantienen unidos. Sin embargo, después de pensar un poco más, queda claro que Apple ve a Siri como un asistente digital multifacético que es capaz de competir con servicios como Alexa de Amazon.

Sirikit de Apple

SiriKit de Apple pronto adoptará aplicaciones de terceros

SiriKit se basa en los marcos de interfaz de usuario Intents e Intents , con definiciones de cómo funciona cada intent. Apple proporciona el ejemplo del dominio Payments, que se basa en una intención de enviar pagos y otra de recibir. Esto significa que, en teoría, debe evitar enviar un pago accidentalmente cuando intenta recibir uno.

Actualmente, Siri solo es capaz de interactuar con aplicaciones a través de lo que se conoce como la extensión Intents , que se compone principalmente de tres objetos:

  • An intent objectdefine la intención del usuario y contiene los datos que Siri recopiló del usuario.
  • handler objectes un objeto personalizado que define y usa para resolver, confirmar y manejar una intención.
  • response objectes un objeto de datos que contiene su respuesta a una intención. Cuando todo funciona como se supone que debe hacerlo, este proceso parece estar bien. Pero ¿qué pasa cuando no lo es?

Digamos que el reconocimiento de voz de Siri recibe con precisión el 95% de un comando, pero falla en el último obstáculo, eligiendo el nombre incorrecto de una lista de contactos. El proceso descrito anteriormente es tan rígido que es casi seguro que los usuarios tengan que descartar todo lo que estaba correcto y comenzar de nuevo.

Vocabulario personalizado

Uno de los problemas con los asistentes virtuales se deriva del hecho de que esperamos que interactúen como un ser humano más. No puedes hacerle a un asistente virtual una pregunta como "¿a qué hora comienza el juego?" porque carece del conocimiento contextual para comprender que estás hablando del juego de tu equipo deportivo favorito.

Una característica interesante de SiriKit, diseñada en parte para anular algunos de los problemas causados ​​por malentendidos, es que permite a los desarrolladores especificar vocabulario personalizado , es decir, definir un término personalizado y las circunstancias en las que podría usarse. Sin embargo, actualmente, estas categorías se limitan a nombres de contactos, etiquetas de fotos / nombres de álbumes, nombres de ejercicios y opciones de conducción.

Desafortunadamente, este es otro ejemplo de cómo Apple restringe lo que los desarrolladores pueden hacer con SiriKit. Incluso la lista de dominios compatibles de SiriKit se siente bastante limitada: ¿no hay control de mapeo, audio o video? Seeking Alpha señala lo restrictivo que se siente SiriKit:

Compare SiriKit con el kit de habilidades de Alexa de Amazon : a diferencia de SiriKit, los desarrolladores tienen total libertad sobre las habilidades que desean desarrollar. En junio, se habían registrado más de 1.000 habilidades de terceros . Además, Alexa puede gestionar conversaciones complejas de varias etapas.

Lea también: Cómo las API están rompiendo las barreras a la automatización del hogar inteligente

Alexa, Cortana y Google Now

Los usuarios se hacen eco del sentimiento positivo hacia Alexa , uno de los cuales dijo lo siguiente sobre su centro de Amazon Echo cuando habló con The Guardian : “Cuando ella [Alexa] hace algo mal, no es como una máquina expendedora rota. Mi frustración con ella es más como con un humano que está aprendiendo ".

Siri ha sido el blanco de las bromas durante tanto tiempo: "Le pedí a Siri que hiciera X, ¡y mira con qué salió!" - que es difícil imaginar que la gente lo vea bajo este tipo de luz. Rene Ritchie de iMore comenta que:

El lenguaje natural, la inferencia secuencial y la interfaz de voz son tecnologías increíblemente habilitadoras, especialmente cuando se trata de accesibilidad e inclusión. Los necesitamos en todas partes.

Amazon Echo Dot ahora puede controlar a Alexa desde cualquier lugar de la casa

Echo dot de Amazon ahora puede controlar a Alexa desde cualquier lugar de la casa

Como tal, Siri, Google Now y Cortana tienen una ventaja sobre Alexa en que están disponibles tanto dentro del hogar como mientras las personas están en movimiento. Curiosamente, tanto Google como Apple están trabajando en productos para llevar a sus asistentes virtuales al hogar también, pero se habla poco de que Amazon esté tratando de llevar Alexa a los teléfonos inteligentes… todavía .

Ya hemos mencionado anteriormente que Alexa tiene más de 1,000 habilidades, y Cortana es capaz de integrarse con aplicaciones web y de Android, así como con aplicaciones universales de Windows 10. PC Mag analiza más de cerca cómo funciona Cortana detrás de escena y concluye que:

Para las aplicaciones de terceros, el cielo es el límite cuando se trata de lo que puede hacer una acción. Un ejemplo que dio Brown fue Peel, una aplicación de automatización del hogar cuya acción era encender las luces y encender la calefacción cuando Cortana sintió que estaba de camino a casa. También mencionó a Petzi, cuya acción es alimentar a su perro de forma remota.

Google Now también puede hacer cosas interesantes como esta, como agregar elementos a Wunderlist o Trello y enviar mensajes a través de WhatsApp, por lo que parece cada vez más probable que todos los jugadores principales en el espacio del asistente virtual inevitablemente (y rápidamente) necesiten para abrir las cosas tanto como sea posible a desarrolladores externos. Esto viene con su propio conjunto de riesgos ( exploits , contenido NSFW y procesos que no funcionan correctamente), pero estos son riesgos que Apple, Amazon, Microsoft, etc., pueden necesitar para seguir siendo competitivos.

Relacionado: Cree su propio asistente virtual de DevOps con cualquiera de estos más de 12 marcos

Entra Viv

SiriKit puede haber tenido un comienzo un poco lento, pero eso no significa que esté condenado al fracaso. Lejos de eso, Apple en realidad tiene un historial de ser lento al salir de las puertas solo para acelerar las cosas más adelante. Tome Apple Maps, por ejemplo, que inicialmente fue rechazado por la gran mayoría de los usuarios de iPhone a favor de Google Maps. Unos años después, Apple Maps es ahora 3 veces más popular en iOS que su equivalente de Google.

Viv de aspecto impresionante podría proporcionar "una interfaz inteligente para todo"

Viv de aspecto impresionante podría proporcionar "una
interfaz inteligente para todo"

Los pequeños pasos que Apple está dando en el espacio del vocabulario personalizado son emocionantes porque eventualmente pueden poner fin a esos abruptos "Lo siento, no entendí eso". mensajes. No es una verdadera inteligencia artificial, pero una biblioteca de vocabulario que "aprende" de la entrada de miles de programadores que trabajan con SiriKit es una posibilidad interesante: Siri actualmente solo funciona cuando los usuarios están conectados a Internet, por lo que la recopilación de entradas masivas de usuarios para analizar y mejorar su IA no es una idea nueva.

Lo realmente interesante de SiriKit, junto con Alexa, Google Now e incluso IBM Watson, es que sugiere que los comandos de voz llegaron para quedarse. Viv, una aplicación del ex empleado de Apple que creó Siri, ya está impresionando por su capacidad para comprender un lenguaje complejo y conversacional como "¿estaba lloviendo en Seattle hace tres jueves?"

Si alguna vez le has preguntado a Siri sobre los resultados de un evento deportivo reciente solo para que arroje los resultados de un enfrentamiento aleatorio de hace varios años, sabrás que está lejos de estar en este nivel de conversación.

Viv también tiene la capacidad de interactuar con varias aplicaciones de terceros , y se utiliza para enviar dinero a través de Venmo, ordenar flores y reservar un hotel durante una demostración en TechCrunch Disrupt 2016. Lo que queda por ver es si estas interacciones vendrán con algunos de las mismas limitaciones que tiene SiriKit o se comportará más como asistentes virtuales útiles, profundamente inteligentes que comprenden los comandos de las entradas del usuario.

El futuro de los asistentes virtuales

No importa qué tan avanzados se estén volviendo los asistentes virtuales, no hay forma de que los fabricantes de un sistema operativo puedan preparar a sus asistentes de IA para comprender todo lo que se les presenta. Es difícil imaginar, sin un montón de conocimiento contextual integrado, un asistente virtual que comprenda la diferencia entre "isla" y "pasillo" o la cubierta de un barco y uno que podría tener en su jardín trasero: homófonos, homónimos y homógrafos. siguen siendo una fuente común de frustración para cualquiera que utilice asistentes virtuales.

Hacer que la VA inteligente sea más emotiva a través de señales visuales es un objetivo continuo de Cortana

Hacer que los AV inteligentes sean más emotivos es un objetivo continuo de Cortana

Siendo ese el caso, el desarrollo de terceros y las API son, y seguirán siendo, cruciales para progresar a medida que aumentan el valor en la IA con nuevos casos de uso y capacidades imprevistas. Con el enfoque más transparente de Amazon hacia terceros y el excelente reconocimiento de voz y la amplitud de conocimientos de Google Now, Apple tiene mucho trabajo que hacer si espera competir. SiriKit es un paso en la dirección correcta, y el hecho de que Siri siga siendo, con mucho, el asistente virtual más utilizado, en la mayoría de los lugares, de todos modos , significa que Apple debería tener muchos datos con los que trabajar.

En última instancia, parece que el ganador de las guerras de VA puede que se reduzca no a quién tiene la mejor aplicación para teléfonos inteligentes o concentrador para el hogar, sino a quién ofrece la mejor experiencia general en todos los dispositivos en la Internet de las cosas en evolución Esto debe significar inevitablemente API abiertas que permitan la integración de voz para los muchos dispositivos en el mercado; dado que la hiperespecialización y los fabricantes de dispositivos competidores continuarán, es necesario cierto grado de estandarización para un sistema cohesivo.

En otras palabras, Apple y Amazon probablemente no harán que ese cuidador inteligente de huevos o botella de vino sea capaz de hablar contigo, pero alguien más podría hacerlo si la API está ahí para hacerlo.

Publicar un comentario

0 Comentarios