Procesamiento del lenguaje natural y el futuro de la voz en la tecnología
Las computadoras son increíbles cuando se trata de compilar y analizar datos estructurados, como ecuaciones matemáticas o registros financieros. Su humilde PC hogareña puede realizar procesamiento de datos estructurados más rápidamente que incluso los matemáticos más hábiles. Sin embargo, cuando se trata de procesar información no estructurada, como conversaciones cotidianas, las computadoras están muy lejos de nosotros, los humanos.
Eso está comenzando a cambiar lentamente a medida que las tecnologías clave, incluidas la Inteligencia Artificial (IA) y el Procesamiento del Lenguaje Natural (PNL), evolucionan y avanzan. El desarrollo de estas tecnologías tendrá un gran impacto del uso de la voz en la tecnología del Protocolo de Voz sobre Internet (VoIP), que ya ha interrumpido una variedad de industrias y servicios.
VoIP le permite realizar transmisiones de voz y multimedia a través de Internet. Esto significa que los clientes pueden ponerse en contacto fácilmente con empresas, representantes de servicio al cliente y otras partes relevantes. Mientras tanto, las empresas pueden reducir los costos de infraestructura y coordinar actividades en todo el mundo.
A medida que el Internet de las cosas (IoT) crezca y más personas se conecten a la World Wide Web, la tecnología de voz solo se hará más prominente. Esto es especialmente cierto dados los avances en el procesamiento del lenguaje natural que permiten que las computadoras procesen cada vez más conversaciones y comandos audibles.
Echemos un vistazo a cómo el procesamiento del lenguaje natural y las tecnologías de voz (incluido VoIP) afectarán a la sociedad.
El procesamiento del lenguaje natural, o PNL para abreviar, es un subcampo de la inteligencia artificial y la informática. Con NLP, los investigadores están trabajando para desarrollar software y hardware que puedan procesar grandes cantidades de datos en lenguaje natural.
Tan poderosas como son las computadoras, no son conscientes y carecen de la comprensión intuitiva del lenguaje que poseen los humanos. Dado que los datos del lenguaje natural no están estructurados y dependen en gran medida del contexto del mundo real, es especialmente difícil de analizar para las computadoras.
Las computadoras funcionan con reglas estrictas, respondiendo preguntas directas y ejecutando comandos simples. Echemos un vistazo a un ejemplo clásico de código python:
Imprimir “hola, mundo”
“Imprimir” le dice a la computadora qué hacer: imprimir algo. Los apóstrofes [‘’] informan a la computadora qué se debe imprimir y “hola mundo” es lo que se imprime realmente. Para una computadora, esta línea de código es muy fácil de entender. La gran mayoría de los programas de computadora se programan usando comandos simples y directos.
Por supuesto, un programa de software podría contener millones de comandos simples que interactúan entre sí. Escribir tantos comandos es difícil para nosotros los humanos. Comprender cómo se relacionan y encajan todos juntos también es un desafío para nosotros, pero es relativamente sencillo para las computadoras.
Sin embargo, cuando se trata de lenguajes naturales, las computadoras luchan mientras que los humanos sobresalen. Los lenguajes naturales implican una miríada de reglas complejas. Sin embargo, estas reglas a menudo son flexibles y dependen en gran medida del contexto. Además, los idiomas pueden evolucionar rápidamente y los significados pueden cambiar.
Considere esta afirmación:
“Estaba en llamas en el trabajo hoy”.
Para un humano, la declaración anterior es bastante fácil de entender. Cuando el orador dice “en llamas”, quiere decir que fue muy productiva y realizó mucho trabajo. Sabemos esto debido al contexto de la declaración.
Las computadoras analizan las cosas mucho más literalmente. Un programa de software simple no entendería el contexto. Analizaría la declaración anterior y concluiría que la persona estaba literalmente en llamas. Entonces, ¿cómo se enseña a las computadoras a entender el contexto?
Aquí es donde entra en juego el procesamiento del lenguaje natural. El objetivo final de la PNL es permitir que las computadoras descifren y comprendan el lenguaje humano. Cuando sea apropiado, el software también responderá y ejecutará acciones basadas en lenguaje natural.
Echemos un vistazo más profundo a cómo funciona realmente la PNL.
¿Cómo funciona el procesamiento del lenguaje natural?
Con PNL, un humano puede hablar con una máquina que luego capturará el audio. A partir de ahí, el audio se convierte en texto y luego se procesa. En esta etapa, el software NLP intentará analizar las palabras de texto y descifrar el significado. Posteriormente, el software puede responder a las preguntas y / o comandos que comprende.
Supongamos que quiere saber cómo será el clima el viernes, por lo que le pregunta a su teléfono inteligente habilitado para PNL “qué tiempo hará este viernes en San Francisco”. El programa de PNL utilizará análisis semántico para determinar el texto en realidad medio. El software de PNL puede identificar “qué” reconocer que está haciendo una pregunta. “Tiempo” y “este viernes”, le dice al software de qué se trata la pregunta, mientras que “San Francisco” proporciona la ubicación.
A partir de ahí, el software de PNL puede consultar con una fuente de datos para encontrar el clima para el próximo viernes en San Francisco. Una vez que el software localiza esta información, puede devolvérsela, probablemente convirtiendo los datos en audio. Y así como sabes, tienes la respuesta a tu pregunta.
El escenario anterior puede parecer simple, en papel. Para los humanos, el proceso anterior sería realmente muy simple. Sin embargo, escribir los algoritmos que permiten que una computadora realmente realice lo anterior es excepcionalmente difícil. De hecho, la PNL es uno de los campos más difíciles de la inteligencia artificial.
La ciencia detrás de la PNL es bastante compleja. En general, los programas de PNL utilizarán tokenización para dividir el texto en fragmentos más pequeños. Luego, la normalización se utiliza para eliminar la puntuación innecesaria, expandir las contracciones y similares. El lenguaje también puede ser derivado o reducido a palabras madre (caminar se convierte en caminar). Estos pasos facilitan el análisis semántico, aunque la PNL sigue siendo uno de los campos más avanzados y desafiantes de la IA.
Por supuesto, el trabajo más desafiante a menudo produce los resultados más gratificantes. La PNL podría revolucionar las interacciones humano-computadora y VoIP sería una gran parte de eso.
El procesamiento del lenguaje natural tendrá un impacto dramático en la voz en la tecnología.
A medida que las computadoras aprendan a comprender el lenguaje humano, podrán interactuar más directamente con nosotros. Como resultado, se enredarán más profundamente en nuestra vida diaria. AI y ML en tecnología de voz también permitirán más interacciones humano-computadora.
VoIP permite la transmisión de voz y multimedia a través de Internet. Los días de depender de las líneas telefónicas han pasado hace mucho tiempo y muchas empresas han pasado a VoIP. A primera vista, VoIP puede parecer simplemente una alternativa a la transmisión de datos simple, pero el impacto de esta tecnología es mucho más profundo. VoIP ya ha permitido a las empresas reducir costos, coordinar actividades en todo el mundo y aumentar los contactos con los clientes.
Con NLP, Voice ML y tecnología AI, y VoIP podría volverse aún más disruptivo. Para comprender mejor el impacto del procesamiento del lenguaje natural y VoIP, consideremos un caso de uso específico. Estas tecnologías han sido especialmente útiles para el servicio al cliente, permitiendo a los clientes ponerse en contacto rápida y fácilmente con los departamentos de servicio al cliente.
En el pasado, llamar al servicio al cliente a menudo significaba navegar a través de complicados menús telefónicos y similares. Ahora, sin embargo, los clientes pueden contactar al servicio al cliente directamente a través de una aplicación o sitio web usando VoIP. Dado que el 60 por ciento de los estadounidenses se habrán contactado con un departamento de servicio al cliente en el último mes, VoIP podría beneficiar a muchas personas.
Sin embargo, mantener departamentos de servicio al cliente puede ser costoso.
Se proyecta que la industria de la subcontratación de servicios al cliente por sí sola tendrá un valor de $ 84.7 mil millones para 2020. Las empresas están gastando muchos miles de millones más para mantener sus propios departamentos internos de servicio al cliente. En última instancia, esto se puede resolver mediante el uso de herramientas de tecnología de voz ML e AI para resolver problemas simples, ayudar a las empresas a mejorar su calificación de servicio al cliente (CSAT) y mejorar la experiencia del cliente.
Tradicionalmente, el servicio al cliente ha sido un rol laboral específico para el ser humano. No puede automatizar una conversación orgánica y natural. O puedes? El procesamiento del lenguaje natural, el software habilitado con inteligencia artificial y el aprendizaje automático podrán responder las preguntas de las personas.
Los bots habilitados para PNL ya han sido una bendición para el servicio al cliente.
Ahora, permiten a los clientes hacer preguntas simples, como “¿cuáles son sus horarios comerciales”, “¿Puedo ajustar una reserva”, “Tal vez solicite un reembolso”, etc. Muchos centros de llamadas también están utilizando PNL para permitir que las personas hagan preguntas simples por teléfono. Esto reduce la necesidad de que los agentes de servicios humanos dediquen su tiempo a responder preguntas repetitivas y monótonas, y reduce el esfuerzo del cliente.
A medida que la PNL evoluciona, las personas podrán hacer preguntas cada vez más matizadas. Para los clientes, esto significa que podrán encontrar las respuestas a sus preguntas más rápidamente. Mientras tanto, las empresas pueden disfrutar de ahorros de costos, ya que pueden mantener departamentos de servicio al cliente más pequeños. Las empresas pueden pasar los ahorros de costos a los clientes en forma de precios más bajos.
Entonces, ¿esta tecnología de voz ML y VoIP se limita estrictamente a la atención al cliente y similares? Absolutamente no. Cada vez se utiliza más para facilitar otras actividades, como el comercio electrónico. Esto, a su vez, proporcionará más oportunidades para que el procesamiento del lenguaje natural tenga un impacto.
Por ejemplo, algunos dispositivos ahora le permiten realizar pedidos de comercio electrónico a través de comandos de voz. Con estos dispositivos, ya no tiene que iniciar sesión en su computadora o teléfono inteligente para realizar un pedido. En cambio, simplemente puede hablar con el dispositivo, que luego enviará sus comandos hablados a la nube donde se procesan a través del software NLP.
Cuando haces una pregunta o haces un pedido, el software intentará entender lo que estás diciendo. Cuando le pide al dispositivo que haga un pedido de toallas de papel, por ejemplo, utilizará PNL para determinar qué desea y cuál es la respuesta correcta. En este caso, el dispositivo le enviará más toallas de papel.
El procesamiento del lenguaje natural requiere computadoras que sean mucho más potentes que las que se encuentran en la mayoría de los dispositivos locales. En cambio, las conversaciones audibles se procesan en la nube. VoIP ofrece un método para facilitar la transmisión de datos de audio desde un dispositivo local a la nube donde se puede procesar.
Esto significa que esta tecnología podría ser vital para permitir las interacciones humano-computadora. Del mismo modo, la PNL permitirá que estas interacciones sean más matizadas y orgánicas. Como resultado, las interacciones humano-computadora se volverán más comunes y útiles.
Cisco estima que alrededor de 50 mil millones de dispositivos estarán conectados a Internet para 2020.
Los teléfonos inteligentes y las tabletas son probablemente los dispositivos más familiares para la mayoría de los consumidores. Sin embargo, cada vez más, los refrigeradores, hornos, calentadores de agua y otros dispositivos se están conectando a la red.
Con NLP y ML, podremos interactuar más directamente con todos estos dispositivos.
Eso podría significar apagar el horno o pedir más leche. O si tiene un problema con uno de sus electrodomésticos, digamos que el motor del compresor emite un sonido extraño, puede usar VoIP para llamar al servicio al cliente.
En lugar de esperar en la línea para hablar con un representante, se podría usar un bot de tecnología basado en ML. El software puede determinar que tiene un problema grave que debe resolver un técnico, lo que le permitiría programar una cita. Todo esto podría facilitarse con VoIP, AI y ML. En ningún momento tendrías que interactuar con otra persona. Esto significa que su problema puede abordarse de manera rápida y eficiente.
Este es un beneficio tanto para el cliente como para la empresa. Como cliente, su problema se resuelve más rápidamente. Para la empresa, esto significa un cliente satisfecho y costos reducidos de servicio al cliente. Como resultado, los programas de software AI, ML y VoIP se integrarán cada vez más en nuestra vida cotidiana.
De hecho, Replicant AI está desarrollando soluciones de inteligencia artificial para centros de llamadas que estarán equipadas con capacidades avanzadas de PNL. Con nuestra solución AI y ML, los centros de llamadas podrán automatizar muchas de las tareas más tediosas, permitiendo a los representantes de servicio al cliente centrarse en temas más desafiantes.
Los casos de uso y las interacciones anteriores podrían tener un impacto dramático en nuestra vida diaria.
Sin embargo, apenas estamos comenzando a comprender todo el potencial del procesamiento del lenguaje natural y el ML de voz. Hace treinta años, pocas personas entendían cuánto revolucionaría Internet la sociedad.
Del mismo modo, el alcance total del impacto de NLP y Voice ML sigue siendo desconocido. Sin embargo, dado el potencial de reducir costos, enriquecer experiencias y resolver problemas, estas dos tecnologías juntas probablemente tendrán un efecto dramático y positivo en nuestras vidas.