Header Ads Widget

Ticker

6/recent/ticker-posts

Siri-Ous Business: Cómo Los Asistentes Virtuales Se Están Volviendo Gradualmente Invaluables

 No utilizo asistentes virtuales. En el fondo, tal vez, soy escéptico de que soy lo suficientemente importante como para garantizar un asistente, virtual o de otro tipo, o tal vez es solo que mi experiencia al hablar con mis dispositivos ha sido un poco decepcionante. Desde Siri y Google Now hasta saludar alegremente a mi Xbox One, me he quedado sintiéndome cohibido sin la recompensa suficiente para hacer que todo el galimatías parezca valioso.

Así que, con cierta intriga ajena, asistí a una serie de charlas de Nuance, uno de los fabricantes de software de transcripción y reconocimiento de voz más grandes del mundo. Puede que no suenen como un nombre familiar, pero la lista de clientes con los que trabajan es tan extensa que parece más rápido enumerar las empresas con las que no trabajan en lugar de las que sí lo hacen. No obstante, aquí hay una selección que dista mucho de ser extensa: Roku, Panasonic, LG, Samsung, Lexus, Ford, BMW, Toyota, Vodafone, BT, T-Mobile, Domino's, Coca-Cola, Barclays, Citi, Delta, Air France, FedEx. , AT&T, BMW y el NHS. En resumen, incluso si el nombre Nuance no te suena, es probable que hayas tratado con ellos de alguna manera. Las IA se ocupan de 14 mil millones de interacciones con clientes al año, en 80 idiomas diferentes.

Si le preocupa que el mismo asistente virtual que escoge los ingredientes de su pizza también esté trabajando en el NHS, puede respirar aliviado. Aunque hay algunos elementos compartidos, las diversas inteligencias artificiales tienen funciones muy diferentes: aquí no hay IA para todos los oficios. Esta es la razón por la que Nils Lenke, director senior de investigación corporativa de Nuance Communications, no tiene mucho que ver con la idea de que la IA se apoderará del mundo en el corto plazo, a pesar de que la compañía sigue de cerca las cosas, coorganizando la Winograd Schema Challenge: el sucesor de la prueba de Turing.nuance_nils_lenke

“La tecnología subyacente es muy similar, pero una vez que se ha entrenado un sistema, solo puede realizar una tarea”, explica. “Este sistema Go es muy bueno para jugar Go , pero no puede reconocer rostros ni comprender el habla. Nosotros [los humanos] resolvemos todos nuestros problemas con el mismo cerebro, pero esto no es lo que hacen estos sistemas. Es por eso que hay un largo camino para imitar la inteligencia humana, si es que alguna vez. "

De hecho, es posible que la falta de voluntad de los diseñadores de otros asistentes virtuales para aceptar estas limitaciones sea la raíz de por qué he encontrado mis experiencias hasta la fecha tan decepcionantes. Le dije esto a Lenke: "Exactamente, están tratando de hervir el océano, ¿verdad?" Si el asistente es demasiado genérico, sugiere Lenke, a menudo no está seguro de qué esperar realmente a continuación y dónde se encuentran sus limitaciones.

En cambio, parece que limitar el alcance de un asistente virtual lo hace más útil. “Con, digamos, un asistente de conductor, queda bastante claro cuáles son los problemas de un conductor. Todos quieren gasolina, todos necesitan saber lo que dice el tablero, todos necesitan algo de comer: es mucho más fácil construir algo que sea útil para los conductores ". 

“Hace un año no hubo mucho llamado a que los asistentes virtuales pronunciaran correctamente el nombre de Jeremy Corbyn, señala, mientras que cualquier IA que te informe sobre las noticias de hoy debería saber cómo decir correctamente el nombre del líder laborista”.

Esta simplificación se reduce incluso al vocabulario incluido. John West, arquitecto principal de soluciones de Nuance, me dice que para que las voces sintetizadas de los asistentes virtuales suenen fluidas, el diccionario se revisa a menudo para garantizar que se atiendan las tendencias actuales. Hace un año no hubo mucha necesidad de que los asistentes virtuales pronunciaran correctamente el nombre de Jeremy Corbyn, señala, mientras que cualquier IA que le informa sobre las noticias de hoy debería saber cómo decir correctamente el nombre del líder laborista. Esto, según Lenke, es otra razón por la que es preferible que un asistente virtual esté especializado: “Intentas anticipar cuál es el dominio y generas una voz basada en muestras de ese dominio. Si intentas tener una voz que pueda decir todo de todos los dominios, la calidad puede deteriorarse ".nuance_dragon_drive

"En cuanto al género de los asistentes virtuales, eso a menudo se reduce a diferencias culturales por país, algunos de los cuales tienen puntos de vista muy establecidos y prescritos sobre qué género es el adecuado para cada tarea".

Hablando de voces, algo que siempre me ha llamado la atención sobre los asistentes virtuales es la necesidad de que tengan tonos masculinos o femeninos. De todos modos, ¿qué lugar tiene el género para una inteligencia artificial? “Es una elección deliberada que debe tomar”, dice Lenke, y una sobre la que cada cliente tiene la última palabra. "Puedes decir que vas por la ilusión de un ser humano, o puedes decir 'Quiero que la gente vea que es un robot', así que le das una voz robótica y no hay ninguna persona involucrada". En cuanto al género, eso a menudo se reduce a diferencias culturales por país, algunos de los cuales tienen puntos de vista muy establecidos y prescritos sobre qué género es el adecuado para cada tarea. Una vez más, la elección del cliente, y no el lugar de Nuance para imponer sus propias filosofías a un cliente determinado.

Las propias voces suenan ricas, fluidas y naturales en las demos que se muestran. Teóricamente, ¿algún cliente podría estar tratando de hacerlos pasar por humanos, o al menos no mencionar que son un bot en una mentira por omisión? “Permítanme ponerlo de esta manera: yo personalmente no recomendaría hacer eso”, advierte Lenke.

Pero, ¿qué tan útiles están resultando ser los asistentes virtuales? Nuance tiene varios ejemplos clave de mejoras en el negocio, desde la biometría de voz que supera la contraseña, hasta el aumento de la satisfacción laboral de los trabajadores del centro de llamadas porque sus tediosas preguntas preliminares se resuelven automáticamente. Pero quizás el más invaluable es el de la salud, una de las áreas más importantes de la empresa.

“Los médicos del Reino Unido realizan el trabajo administrativo de tres horas y media al día”, explica Frederik Brabant, director de información médica de Nuance. Me muestran un par de demostraciones, una en la que un médico puede completar 20 recetas alrededor de un tercio más rápido usando comandos de voz, y otra en la que un profesional de la salud recibe toda la información pertinente sobre sus diversos pacientes en un iPad. Semánticamente, el sistema incluso parece indicar a los médicos detalles que pueden haber olvidado: qué tipo de diabetes, por ejemplo, para que sus notas tengan sentido cuando se transfieran. Esto puede conducir a un aumento de los ingresos, según Brabant, de entre un 6 y un 8% de media.

El objetivo aquí es facilitar el trabajo de los médicos, en lugar de reemplazar o aumentar su experiencia profesional. “Los médicos odian eso. No queremos recibir instrucciones. La máquina nunca debería decir 'estudiaste siete años de medicina, pero ...' ”A pesar de las limitaciones de un NHS que todavía se basa principalmente en papel, más del 80% de los fideicomisos de la 

Reino Unido con distintos grados de integración. Sin embargo, en términos de futuro, hay usos más allá de la administración. Si trabaja en una cirugía, no puede acceder a información importante con las manos por razones obvias de higiene, por lo que un asistente de voz tiene mucho sentido.nuance_localization_lab

Y es aquí donde realmente entrarán en juego los otros avances que la compañía busca hacer en el futuro: hacer que el software sea más inteligente y lógico. Un ejemplo que me dan: si le dices a tu automóvil: "Reserva una mesa en Joe's Pizza después de mi última reunión y dile a Tom que me encontrará allí", en realidad estás confiando en una mezcla embriagadora de gran conocimiento, semántica enrutamiento, planificación, semántica y diálogo. Debe consultar su calendario para conocer la hora de la última reunión, consultar un mapa para ver dónde está Joe's Pizza en relación con la ubicación de la reunión, buscar el número del restaurante e intentar reservar, luego buscar los datos de contacto de Tom y enviar un mensaje . Eso es impresionante tal como está, pero quieren que el automóvil pueda encontrar alternativas italianas de calidad si Joe's Pizza está reservado y sugerir horarios que funcionen para todos. Teóricamente esto no está muy lejos, y del mismo modo, un teléfono inteligente que puede decirle a un médico el recuento de glóbulos rojos de un paciente sobre la marcha está exasperantemente cerca. Sin embargo, los médicos deben perder su apego al papel y el bolígrafo e ir primero al 100% digital.

"En teoría, esto no está muy lejos, y del mismo modo, un teléfono inteligente que puede decirle a un médico el recuento de glóbulos rojos de un paciente sobre la marcha está exasperantemente cerca".

"Personalmente, creo que habrá muchas oportunidades para el Reino Unido en los próximos cuatro o cinco años en la transición digital, y que las nuevas tecnologías como el reconocimiento de voz y el procesamiento del lenguaje natural lo llevarán al siguiente nivel", concluye Brabant.

Después de dejar el evento y regresar a la oficina, decido darle otra oportunidad a los asistentes virtuales. "OK Google", digo, "llévame a Goodge Street". Y lo hace en un tiempo doblemente rápido, dejándome preguntándome si, después de todo, tal vez haya una vacante para un asistente virtual en mi oficina personal.

Publicar un comentario

0 Comentarios