abril 14, 2019 - Futurizable | Sngular
Enlaces rápidos
  • Blockchain
  • Big Data
  • Educación
  • Robótica
  • Espacio

Daily Archives abril 14, 2019

La voz como interfaz en la era de la transformación digital

Publicado el 14 abril, 2019

Nos encontramos ante un momento de constante cambio derivado de la transformación digital. Los avances en inteligencia artificial, el uso de los datos para la toma más efectiva de decisiones o la conexión de nuestros dispositivos con la nube (IoT), han ido transformando distintas áreas de la actividad humana a una velocidad insólita. En este contexto, aparece la necesidad de encontrar formas de facilitar nuestra relación con la tecnología y hallar nuevos casos de uso que ofrezcan valor a las personas, convirtiendo la capacidad técnica en utilidad. Una de las formas más presentes de lograr simplificar esta relación humanizándola es utilizar la interfaz voz.

Mucho se ha avanzado desde que en 1920 se consiguió que el perro de juguete “Radio Rex” se asomase al pronunciar su nombre. La precisión en el reconocimiento de voz se estancó durante muchos años llevando al usuario a malas experiencias y frustraciones en la interacción. En 2010 se aumentó en gran medida esta precisión con el uso de deep learning y en 2017 Google consiguió una precisión del 95 %. Es cierto que el habla depende del lenguaje y el enfoque general del mercado global son las interacciones centradas en el inglés. En acentos muy cerrados de este idioma la precisión bajaba un 30 % y en español aún queda camino para alcanzar la misma fluidez.

Grandes tecnológicas como Apple, Amazon, Google, Microsoft, Samsung o IBM llevan ya tiempo poniendo foco en el desarrollo de plataformas de procesamiento de lenguaje natural con sus propios asistentes. Entran ahora en nuestros hogares a través de los smart speakers de Amazon y Google, transformando el uso de la voz como interfaz mainstream.

No obstante, la interfaz voz no es adecuada para cualquier interacción. Hay que entender cuándo resuelve de forma más rápida que la pantalla el problema del usuario, o incluso si conviene hacer una interacción multicanal en la que se utilizan diferentes canales. Por ejemplo, el diálogo funciona bien para reservar las salas de una empresa, pero no resulta tan efectivo si se quiere obtener un listado de las salas que hay. Aún así, vamos a ver un cambio de paradigma en la forma en la que interactuamos con la tecnología tan grande como cuando aparecieron los smartphones y sus apps.

Esta revolución tecnológica abre las puertas a nuevos casos de uso, a nuevos modelos de negocio y, por tanto, a una oportunidad para las marcas. ¿Cuál es el tamaño de mercado y las tendencias en el sector? ¿En qué áreas tendrá mayor impacto? ¿Qué valoran más los usuarios? ¿Cómo podríamos monetizar ese valor a través de este canal? ¿Cómo conseguimos llegar a nuestros usuarios? ¿Cuáles son algunos de los casos de uso de mayor impacto?

Las respuestas a estas preguntas se han recogido en un informe con el objetivo de compartir algunos aprendizajes sobre el mercado de la voz como canal de comunicación entre personas e inteligencias artificiales, para poder entender en qué mercados y en qué casos de uso invertir a la hora de desarrollar productos a través de la interfaz voz. Para acceder a él tan sólo es necesario completar un rápida encuesta que ayudará a seguir profundizando en este estudio.

Etiquetas: ,