# Buen dIA > Voice AI que atiende, gestiona y resuelve. ## Datos de la empresa - Nombre: Buen dIA - País: Uruguay - Mercado: Latinoamérica - Idioma: Español rioplatense (nativo) - Canales: Teléfono (SIP/PSTN) y navegador web (WebRTC) - Contacto: hola@buendia.uy - Sitio web: https://buendia.uy ## Qué es Buen dIA es una plataforma de Voice AI para automatización de contact centers, hecha en Uruguay para Latinoamérica. Permite que una inteligencia artificial atienda llamadas telefónicas y sesiones web, identifique al cliente por voz, gestione consultas en tiempo real y resuelva de punta a punta, sin intervención humana. ## Para quién Empresas en Latinoamérica con atención al cliente por teléfono o canales digitales. Pensado para equipos de operaciones, CX y tecnología que buscan reducir tiempos de espera y escalar su capacidad de atención. ## Qué diferencia a Buen dIA - Español rioplatense nativo: no es un sistema traducido del inglés. Los prompts, flujos y datos son nativos en español con voseo, modismos y comprensión de documentos uruguayos. - Dual-channel: el mismo agente atiende por teléfono (SIP/PSTN vía Asterisk) y por navegador web (WebRTC), con la misma calidad en ambos canales. - Multi-vertical configurable: viene con configuraciones para telecomunicaciones, energía, agua, banca, salud y seguros. - Demo interactivo: las empresas pueden probar la tecnología con escenarios reales antes de implementar. ## Verticales - Telecomunicaciones: cambios de plan, consulta de contratos, portabilidad. - Energía: tarifas, potencia contratada, lectura de medidores. - Agua: estado de cuenta, convenios de pago, reclamos. - Banca: saldo, movimientos, bloqueo de tarjetas, disputas. - Mutualistas/Salud: agenda de citas, cambio de médico, resultados de estudios. - Seguros: consulta de póliza, denuncia de siniestro, estado de trámite. ## Capacidades clave - Atención por voz en navegador web (WebRTC) y teléfono (SIP/PSTN). - Identificación y verificación del cliente por cédula dictada por voz (convierte español hablado a dígitos). - Ejecución de acciones en sistemas en tiempo real durante la llamada. - Escalamiento inteligente a agentes humanos cuando corresponde, con contexto completo. - Backoffice configurable por vertical con datos, reglas y herramientas propias. ## Preguntas frecuentes **¿Qué es Buen dIA?** Buen dIA es una plataforma de Voice AI que automatiza contact centers. Una inteligencia artificial atiende llamadas telefónicas y sesiones web, identifica al cliente por voz, gestiona consultas en tiempo real y resuelve de punta a punta. **¿Funciona con español rioplatense?** Sí. Buen dIA fue construido desde el español rioplatense: usa voseo, entiende modismos locales y procesa cédulas uruguayas dictadas por voz en palabras. No es un sistema traducido del inglés. **¿Funciona por teléfono y por web?** Sí. El mismo agente de voz atiende por teléfono (líneas SIP/PSTN) y por navegador web (WebRTC), con la misma calidad y capacidad en ambos canales. **¿Se puede integrar con mi sistema actual?** Sí. Buen dIA se conecta a CRM, ERP y bases de datos para ejecutar acciones en tiempo real durante la llamada: consultar saldos, cambiar planes, agendar citas. **¿En qué industrias funciona?** Telecomunicaciones, energía, agua, banca, salud y seguros, con configuraciones específicas para cada una. **¿Cuánto se tarda en implementar?** Un piloto inicial se puede configurar en días. Viene con configuraciones predefinidas por vertical que se adaptan a las reglas de negocio de cada empresa. **¿Cómo empiezo?** Contactanos en hola@buendia.uy o completá el formulario en buendia.uy para agendar una demo gratuita. ## Enlaces - Sitio web: https://buendia.uy - Blog: https://buendia.uy/blog - Contacto: hola@buendia.uy --- ## Blog ### Voice AI en Latinoamérica: opciones, diferencias y qué mirar antes de elegir Fecha: 2026-04-24 URL: https://buendia.uy/blog/comparativa-voice-ai-latam Tags: voice-ai, latam, comparativa, contact-center, automatización ## Un mercado que explotó Hace tres años, hablar de Voice AI en Latinoamérica era hablar de futuro. Hoy es un mercado activo con decenas de soluciones, desde plataformas globales hasta startups regionales especializadas. El problema ya no es si existen opciones, sino cómo elegir la correcta. Este artículo no es un ranking ni una recomendación de producto. Es una guía de criterios para que puedas evaluar soluciones de Voice AI con información clara. ## Los tres enfoques principales ### Plataformas globales Son empresas (generalmente con base en Estados Unidos o Europa) que ofrecen Voice AI como servicio de infraestructura. Proveen APIs, modelos de lenguaje y herramientas para construir agentes de voz. **Ventajas:** tecnología de punta, documentación extensa, ecosistema de integraciones amplio. **Limitaciones:** el español es un idioma "soportado", no el idioma nativo. Las voces en español muchas veces suenan artificiales o con acento neutro. El soporte técnico suele estar en inglés. La personalización para dialectos regionales requiere trabajo adicional. ### Soluciones regionales especializadas Empresas latinoamericanas que construyen Voice AI pensada desde el español. Hay opciones desde Colombia, México, Argentina y Uruguay, cada una con foco en dialectos y mercados específicos. **Ventajas:** comprensión del mercado local, soporte en español, voces más naturales para la región, entendimiento de regulaciones locales. **Limitaciones:** menor ecosistema de integraciones, tecnología que puede estar un paso detrás de las plataformas globales en ciertos aspectos (latencia, variedad de modelos). ### Desarrollo propio Algunas empresas grandes optan por construir su propia solución de Voice AI usando modelos de lenguaje open-source y frameworks de telefonía. **Ventajas:** control total, personalización ilimitada, sin dependencia de proveedores. **Limitaciones:** requiere un equipo técnico significativo, tiempo de desarrollo largo, costo de mantenimiento continuo. Pocas empresas en LATAM tienen los recursos para hacerlo bien. ## Criterios de evaluación ### 1. Calidad de voz en español No alcanza con que la plataforma "soporte español". Hay que escuchar cómo suena. ¿Usa voces sintéticas genéricas o voces entrenadas para la región? ¿Maneja voseo correctamente? ¿Suena como un agente de contact center profesional o como un GPS leyendo instrucciones? **Cómo probarlo:** pedí una demo con un escenario real de tu negocio, en español, con las frases que tus clientes realmente dicen. Si el agente pronuncia "vos tenés" como "tú tienes", descartalo. ### 2. Latencia La latencia es el tiempo entre que el cliente termina de hablar y el agente responde. En una conversación natural, eso debería ser menos de un segundo. Más de dos segundos se siente como una pausa incómoda. **Cómo probarlo:** medí el tiempo de respuesta en una llamada real, no en una demo grabada. La latencia varía según la infraestructura, la ubicación del servidor y la complejidad del procesamiento. ### 3. Soporte de dialectos El español tiene más de 20 variantes regionales significativas. Un sistema que entiende español mexicano no necesariamente entiende rioplatense, caribeño o andino. **Cómo probarlo:** hablale al agente como hablan tus clientes. Usá modismos, abreviaciones, números dictados en palabras. Si el agente pide que repitas más de una vez, hay un problema. ### 4. Integración con telefonía Voice AI no sirve de mucho si no se conecta a tu sistema telefónico. Hay dos modelos principales: - **Cloud-native:** la llamada entra y sale por internet (WebRTC, SIP trunk). Ideal para empresas con infraestructura digital. - **Híbrido:** se integra con centrales telefónicas existentes (Asterisk, FreeSWITCH, sistemas PBX). Necesario cuando hay líneas PSTN que deben seguir funcionando. **Cómo evaluarlo:** preguntá específicamente cómo se conecta con tu infraestructura actual. ¿Necesitás cambiar de proveedor de telefonía? ¿Funciona con tu PBX? ¿Soporta SIP directo? ### 5. Ejecución de acciones en tiempo real El agente de voz no debería solo hablar: debería hacer. Consultar saldos, cambiar planes, agendar citas, bloquear tarjetas. Todo durante la llamada. **Cómo evaluarlo:** preguntá qué integraciones trae de fábrica y cómo se conecta a tus sistemas. ¿Tiene API abierta? ¿Se conecta a tu CRM, ERP o base de datos? ¿La integración la hacés vos o la hace el proveedor? ### 6. Escalamiento a humanos Ningún agente de voz resuelve el 100% de los casos. Lo que importa es qué pasa cuando no puede: ¿transfiere la llamada con contexto? ¿El operador humano sabe qué se habló? ¿O el cliente tiene que repetir todo desde cero? **Cómo evaluarlo:** probá un escenario donde el agente no pueda resolver. ¿Cómo es la transición? ¿Cuánto contexto pasa al humano? ### 7. Modelo de precios Los modelos de pricing varían enormemente: - **Por minuto:** pagás por el tiempo de conversación ($0.10 - $0.30 USD/min es el rango típico) - **Por llamada:** un costo fijo por cada llamada procesada - **Suscripción mensual:** un fee fijo con límites de uso - **Por resultado:** pagás solo por llamadas que se resuelven exitosamente **Cómo evaluarlo:** calculá con tu volumen real. Un precio por minuto que parece bajo puede ser caro si tus llamadas son largas. Un fee mensual puede ser mejor si tu volumen es predecible. ## Checklist: 10 preguntas para hacerle a un proveedor de Voice AI 1. ¿Puedo escuchar una demo en español rioplatense (o el dialecto de mi mercado)? 2. ¿Cuál es la latencia promedio en una llamada real? 3. ¿Cómo se integra con mi sistema telefónico actual? 4. ¿El agente puede ejecutar acciones en mis sistemas durante la llamada? 5. ¿Qué pasa cuando el agente no puede resolver? ¿Cómo escala a un humano? 6. ¿Cuánto tiempo toma la implementación inicial? 7. ¿Quién configura las reglas de negocio: yo o ustedes? 8. ¿Cómo se actualiza el agente cuando cambian mis reglas o mis productos? 9. ¿Qué métricas y reportes ofrece la plataforma? 10. ¿Cuál es el modelo de precios y cómo escala con mi volumen? Si un proveedor no puede responder estas preguntas con claridad, es una señal. ## La importancia del español nativo Una tendencia preocupante en el mercado es el "español traducido": plataformas que fueron diseñadas en inglés y le agregan español como una capa de localización. Traducen los prompts, agregan voces en español y lo venden como "soporte multi-idioma". El problema es que el español no es solo una cuestión de vocabulario. Es conjugación, es ritmo, es la forma en que la gente dicta números, es cómo se expresa frustración o urgencia. Un sistema que piensa en inglés y habla en español se nota. Y tus clientes lo notan en los primeros segundos. Las mejores soluciones de Voice AI para LATAM son las que se construyeron desde el español: donde los prompts, los flujos, los datos de entrenamiento y las voces son nativos, no traducidos. ## Conclusión No existe la solución perfecta universal. La mejor opción depende de tu industria, tu volumen, tu infraestructura y tu mercado. Pero con los criterios correctos y las preguntas adecuadas, podés separar las soluciones reales de las presentaciones bonitas. --- *Buen dIA es Voice AI construida desde el español rioplatense para Latinoamérica. Si querés comparar con lo que tenés hoy, [agendá una demo](/#contacto) y lo vemos juntos.* --- ### Voice AI en Uruguay: el estado de la tecnología de voz en 2026 Fecha: 2026-04-17 URL: https://buendia.uy/blog/voice-ai-uruguay Tags: voice-ai, uruguay, automatización, contact-center, latam ## Uruguay y la inteligencia artificial de voz Uruguay tiene algo que pocos países de la región pueden decir: una infraestructura digital madura, alta penetración de internet y un ecosistema tech que produce software de clase mundial. Pero cuando se trata de atención al cliente, la mayoría de las empresas uruguayas siguen operando con call centers tradicionales, menús IVR y colas de espera interminables. La tecnología de voz con inteligencia artificial está cambiando eso. Y Uruguay, por su escala y su madurez digital, está en una posición ideal para liderar esa transición en Latinoamérica. ## Qué industrias se benefician más No todas las empresas necesitan Voice AI de la misma manera. Pero hay sectores en Uruguay donde el impacto es inmediato: **Mutualistas y prestadores de salud.** El agendamiento, reagendamiento y cancelación de citas consume entre el 40% y el 60% del volumen de llamadas de una mesa telefónica de salud. Son gestiones repetitivas, bien estructuradas y con reglas de negocio claras. Un agente de voz las resuelve en menos de un minuto. **Telecomunicaciones.** Antel, Claro y Movistar reciben miles de llamadas diarias por cambios de plan, consultas de saldo y reclamos por facturación. El 70-80% de esas consultas son resolubles sin intervención humana. **Servicios públicos.** UTE, OSE y las empresas departamentales atienden consultas sobre facturas, lectura de medidores, cortes de servicio y convenios de pago. Muchas de estas gestiones siguen dependiendo de operadores humanos para tareas que un agente de voz automatiza en segundos. **Banca y finanzas.** Consultas de saldo, movimientos, bloqueo de tarjetas, disputas de cargos. Con verificación de identidad por voz, el agente puede operar de forma segura incluso en transacciones sensibles. **Cobranzas.** Recordatorios de pago, negociación de convenios, seguimiento de compromisos. Es una vertical donde el volumen es alto, el costo por llamada es significativo y la rotación de agentes humanos es constante. ## La ventaja de la escala uruguaya Uruguay tiene 3,5 millones de habitantes. Eso, que muchas veces se ve como limitación, es una ventaja para la adopción de tecnología: **Iteración rápida.** Un piloto de Voice AI en una mutualista uruguaya se puede implementar, medir y ajustar en semanas. En mercados más grandes, el mismo proceso lleva meses. **Mercado concentrado.** Pocas empresas dominan cada vertical. Convencer a tres o cuatro actores clave es suficiente para transformar una industria completa. **Talento técnico disponible.** Uruguay produce más desarrolladores per cápita que la mayoría de los países de la región. Eso se traduce en equipos capaces de integrar nuevas tecnologías sin depender de proveedores externos. **Conectividad.** Con el Plan Ceibal, el despliegue de fibra óptica de Antel y la cobertura 4G/5G, Uruguay tiene la infraestructura necesaria para que la voz sobre IP funcione con calidad profesional. ## El español rioplatense como diferenciador técnico Uno de los desafíos más subestimados en Voice AI es el idioma. No el español genérico, sino la forma en que realmente hablan los uruguayos. Un agente de voz que usa tuteo con un cliente uruguayo suena extranjero. Si no entiende "cuatro millones ochocientos" como una cédula de identidad, no puede verificar a nadie. Si no sabe qué significa "ta" o "dale" como confirmación, pierde el hilo de la conversación. Las soluciones de Voice AI que se entrenan en español neutro (o peor, que traducen del inglés) no resuelven este problema. Para que la experiencia se sienta natural, el sistema tiene que estar pensado desde el rioplatense: en el tono, en las conjugaciones, en la forma de dictar números, en los modismos. Esa localización profunda no es un extra. Es lo que determina si el cliente resuelve su problema o corta frustrado. ## El ecosistema está madurando Uruguay no está solo en esto. En la región hay empresas construyendo soluciones de Voice AI desde Colombia, México y Argentina. Pero el ecosistema uruguayo tiene características propias: - Programas de ANII (Agencia Nacional de Investigación e Innovación) que financian proyectos de IA aplicada - Comunidades de desarrollo activas en Montevideo, con eventos y hackathons específicos de voz e IA - Empresas locales que ya están probando pilotos con agentes de voz en producción El terreno está listo. Lo que falta es que más empresas den el paso de la curiosidad a la implementación. ## Cómo empezar con Voice AI en tu empresa No hace falta transformar todo el contact center de una vez. La mayoría de las implementaciones exitosas empiezan con un caso de uso acotado: 1. **Identificar la consulta más repetitiva.** ¿Qué tipo de llamada consume más tiempo de tus operadores? Esa es la candidata. 2. **Definir las reglas de negocio.** ¿Qué necesita saber el agente de voz para resolver esa consulta? Qué datos consulta, qué acciones ejecuta, cuándo escala. 3. **Probar con un piloto.** Derivar un porcentaje de las llamadas al agente de voz, medir la tasa de resolución y la satisfacción del cliente. 4. **Iterar y expandir.** Ajustar el flujo, agregar consultas adicionales y escalar gradualmente. El error más común es querer automatizar todo desde el día uno. El acierto es empezar chico, medir y escalar lo que funciona. --- *En Buen dIA construimos Voice AI pensada para Uruguay y Latinoamérica, con comprensión nativa del español rioplatense y configuración por vertical. Si querés ver cómo funciona para tu industria, [agendá una demo](/#contacto).* --- ### Agendar citas por teléfono no debería ser tan difícil Fecha: 2026-04-14 URL: https://buendia.uy/blog/agenda-reservas-voice-ai Tags: voice-ai, salud, mutualistas, agendamiento, automatización, uruguay ## El ritual de cada mes Necesitás una consulta con tu médico. Llamás a la mutualista. Escuchás un menú. Elegís la opción 3. Te ponen en espera. Pasan cinco minutos. Diez. Quince. Finalmente atiende alguien que te pide la cédula, busca tu ficha, te pregunta con qué doctor, te ofrece tres horarios que no te sirven, busca más, y después de ocho minutos de ida y vuelta lográs reservar un turno para dentro de dos semanas. Todo eso para decir: "Necesito una consulta con el Dr. Rodríguez, cualquier día de la tarde". ## Un problema que conocemos todos En Uruguay, las mutualistas concentran millones de consultas anuales. La mesa telefónica es el canal principal para agendar, reagendar y cancelar turnos. Y es también el cuello de botella más grande de la operación. Los números hablan: - Las llamadas para agendamiento representan entre el 40% y el 60% del volumen total del call center de una mutualista - El tiempo promedio de atención por llamada de agendamiento es de 4 a 8 minutos - Los horarios pico (lunes a primera hora, después de feriados) generan colas de espera de 15 a 30 minutos - La tasa de ausentismo a consultas ronda el 15-20%, en parte porque cancelar o reagendar es tan engorroso que la gente simplemente no va ## Lo que hace un agente Voice AI con una llamada de agendamiento Veamos el mismo escenario con un agente de voz inteligente: **Cliente:** "Hola, necesito agendar una consulta con el Dr. Rodríguez." **Agente:** "Perfecto. ¿Me decís tu cédula para verificar tu identidad?" **Cliente:** "Tres millones doscientos cuarenta y cinco mil seiscientos setenta y ocho." **Agente:** "Gracias, Micaela. Veo que el Dr. Rodríguez tiene disponibilidad el jueves 17 a las 15:30 y el viernes 18 a las 10:00. ¿Cuál te queda mejor?" **Cliente:** "El jueves a las 15:30." **Agente:** "Listo, te agendé la consulta con el Dr. Rodríguez para el jueves 17 de abril a las 15:30. ¿Necesitás algo más?" Tiempo total: menos de un minuto. Sin espera, sin menús, sin repetir datos. ## No solo agendar: reagendar y cancelar Lo que parece simple se complica cuando sumás las variantes: **Reagendamiento:** "Tengo una consulta el miércoles pero no puedo ir, ¿me la podés cambiar para la semana que viene?" El agente busca la cita existente, la cancela, busca disponibilidad en el rango pedido y confirma la nueva fecha. Todo en una misma conversación. **Cancelación:** "Llamaba para cancelar mi turno de mañana." El agente identifica la cita, confirma los datos y la cancela. Sin formularios, sin "espere que lo transfiero". **Consulta de turnos:** "¿Cuándo tengo la próxima consulta?" El agente busca en la agenda del paciente y responde en segundos. Cada una de estas gestiones, hecha por un operador humano, toma entre 3 y 6 minutos. Con Voice AI, toma menos de un minuto. ## El impacto en la operación Para una mutualista que recibe 2.000 llamadas diarias de agendamiento: | Métrica | Con operadores | Con Voice AI | |---------|---------------|-------------| | Tiempo promedio por llamada | 6 minutos | 1 minuto | | Llamadas que necesitan operador | 2.000 | 400-600 (solo excepciones) | | Tiempo de espera en cola | 10-20 minutos en pico | 0 minutos | | Disponibilidad | Horario comercial | 24/7 | | Ausentismo (por facilidad de cancelar) | 15-20% | Potencialmente menor | Los operadores humanos quedan libres para lo que realmente necesita intervención humana: consultas médicas complejas, reclamos, orientación personalizada. ## Lo que necesita Voice AI para funcionar en salud No alcanza con poner un chatbot a atender llamadas. El agendamiento médico tiene particularidades que el sistema tiene que manejar bien: **Verificación de identidad.** Antes de tocar la agenda de un paciente, hay que confirmar quién está llamando. Eso implica pedir la cédula, procesarla (incluso cuando la dictan en palabras), y validarla contra la base de datos. **Reglas de negocio.** No todos los doctores atienden todos los días. Hay especialidades que requieren orden de otro médico. Hay pacientes con cobertura parcial. El agente tiene que conocer estas reglas. **Manejo de excepciones.** "Necesito una urgencia" no es lo mismo que "quiero agendar un control". El agente debe distinguir y escalar cuando corresponde. **Confirmación explícita.** Antes de confirmar una reserva, el agente repite fecha, hora y doctor. Un error en agendamiento médico no es menor. ## Más allá de la mutualista El mismo modelo aplica a cualquier sistema de reservas por teléfono: - **Clínicas y sanatorios:** turnos con especialistas, estudios, procedimientos - **Consultórios odontológicos:** controles, limpiezas, urgencias - **Centros de diagnóstico:** ecografías, radiografías, análisis de sangre - **Servicios públicos:** trámites con hora, renovación de documentos En todos los casos, la lógica es la misma: el cliente dice qué necesita, el agente verifica identidad, busca disponibilidad y confirma. Lo que cambia son las reglas de negocio de cada vertical. ## El canal preferido sigue siendo la voz Las apps y los portales web ayudan, pero la realidad es que una parte importante de la población (especialmente adultos mayores, que son los usuarios más frecuentes del sistema de salud) prefiere llamar. Y para ellos, la experiencia tiene que ser simple. Voice AI no compite con la app. Complementa el canal telefónico con la misma eficiencia que tiene la reserva online, sin pedirle al usuario que cambie de hábito. --- *En Buen dIA trabajamos en agentes Voice AI que manejan agendamiento, reagendamiento y cancelación de citas con verificación de identidad y reglas de negocio configurables. Si querés ver cómo funciona para tu institución, [agendá una demo](/#contacto).* --- ### Por qué los acentos del español importan en Voice AI Fecha: 2026-04-10 URL: https://buendia.uy/blog/espanol-rioplatense-voice-ai Tags: voice-ai, español, rioplatense, nlp, latam, uruguay, argentina ## "No te entiendo, ¿podés repetir?" Esa frase, dicha por un sistema automatizado, es el principio del fin de una llamada de atención al cliente. Y es exactamente lo que pasa cuando un agente de voz entrenado en español neutro (o peor, traducido del inglés) intenta atender a un uruguayo, argentino o paraguayo. El problema no es la tecnología. Es que nadie le enseñó al modelo cómo hablamos. ## El español no es uno solo Hay más de 500 millones de hispanohablantes en el mundo. Pero la idea de un "español universal" es un mito conveniente para quienes venden soluciones genéricas. La realidad es que un uruguayo dice **"vos tenés"**, no "tú tienes". Dice **"dale"** como confirmación, **"ta"** como acuse de recibo, y **"bárbaro"** cuando algo salió bien. Dicta su cédula diciendo **"cuatro millones ochocientos"**, no "cuatro-ocho-cero-cero-cero-cero-cero". Si tu agente de voz no entiende estas formas, no está atendiendo: está frustrando. ## Voseo: no es un dialecto menor El voseo rioplatense no es una curiosidad lingüística. Es la forma estándar de comunicación para más de 50 millones de personas en Uruguay, Argentina y Paraguay. Y tiene implicaciones directas en cómo un agente de voz debe funcionar: ### Conjugaciones diferentes - "¿Podés darme tu número?" vs. "¿Puedes darme tu número?" - "Decime tu nombre" vs. "Dime tu nombre" - "Esperá un momento" vs. "Espera un momento" Un agente que usa tuteo con un cliente rioplatense suena inmediatamente como un robot extranjero. La confianza se pierde en los primeros tres segundos. ### Vocabulario local | Lo que dice el cliente | Lo que significa | |----------------------|-----------------| | "Tengo un quilombo con la factura" | Tiene un problema con la factura | | "Me chorearon la tarjeta" | Le robaron la tarjeta | | "Necesito hacer un trámite" | Necesita realizar una gestión | | "La cédula es cuatro millones ochocientos" | Su documento es 4.800.xxx | | "Llamé como tres veces y nada" | Llamó múltiples veces sin resolución | ### Números dictados por voz Este es uno de los desafíos más técnicos. Cuando un uruguayo dicta su cédula de identidad, no dice dígito por dígito. Dice "tres millones doscientos cuarenta y cinco mil seiscientos setenta y ocho": un número de 7 u 8 dígitos expresado en palabras, con las variaciones propias del habla informal. Convertir eso en `3.245.678` requiere un parser que entienda: - **Millones, miles, cientos** en su forma hablada - **Formas abreviadas** ("tres doscientos" = 3.200.xxx) - **Correcciones en el aire** ("no, perdón, dije mal, es cuarenta y cinco, no cincuenta y cinco") - **Validación con dígito verificador** (la cédula uruguaya tiene un algoritmo de validación) ## El impacto en la experiencia del cliente No se trata solo de entender palabras. Se trata de que el cliente sienta que está hablando con alguien que lo entiende. Cuando un agente de voz: - **Usa voseo** → el cliente baja la guardia, habla naturalmente - **Entiende modismos** → no pide que repita, no malinterpreta - **Procesa números como los dicta la gente** → la verificación de identidad fluye en segundos, no en minutos - **Responde con el tono correcto** → profesional pero cercano, como lo haría un buen agente humano uruguayo El resultado es una conversación que se siente humana. Y esa percepción es la diferencia entre un cliente que resuelve su problema y uno que corta y llama de vuelta pidiendo un humano. ## Lo que hacemos diferente en Buen dIA En Buen dIA, el español rioplatense no es un "idioma soportado": es el idioma nativo del sistema. Cada componente está pensado desde esta perspectiva: **Instrucciones del agente en español rioplatense.** Los prompts que guían al modelo usan voseo, terminología local y las convenciones de un agente de contact center uruguayo profesional. **Parser de cédula con conversión de español hablado a dígitos.** Un módulo dedicado que convierte "tres millones doscientos cuarenta y cinco mil seiscientos setenta y ocho" en `3.245.678` y valida el dígito verificador. **Flujos de verificación de identidad adaptados.** El agente pide la cédula de forma natural ("¿Me decís tu cédula?"), entiende la respuesta en cualquier formato (dígitos, palabras, mixto) y confirma antes de avanzar. **Datos y escenarios reales de Uruguay.** Los demos usan datos inspirados en ANTEL, UTE, OSE y bancos locales, no ejemplos genéricos de "Acme Corp". ## El futuro es local La tendencia global en Voice AI es clara: los modelos de lenguaje son cada vez mejores entendiendo el habla. Pero "mejor" no alcanza si no se adapta al contexto local. Las empresas latinoamericanas que implementen Voice AI van a descubrir rápidamente que la diferencia entre una automatización que funciona y una que frustra no está en el modelo, sino en qué tan bien entiende a sus clientes. Y para entender a tus clientes, primero tenés que hablar como ellos. --- *Buen dIA está construido desde Uruguay para Latinoamérica, con comprensión nativa del español rioplatense. Si querés escuchar cómo suena un agente de voz que realmente entiende a tus clientes, [agendá una demo](/#contacto).* --- ### IVR vs Voice AI: por qué los menús telefónicos ya no alcanzan Fecha: 2026-04-07 URL: https://buendia.uy/blog/ivr-vs-voice-ai Tags: voice-ai, ivr, contact-center, automatización, latam ## "Para consultas, presione 1..." Si alguna vez llamaste a tu banco, tu empresa de telefonía o tu prestador de salud, conocés el ritual: un menú grabado que te obliga a escuchar cinco opciones, elegir una, escuchar otras tres, elegir otra, y rezar para que la opción que elegiste te lleve a donde necesitás. Ese sistema se llama IVR (Interactive Voice Response) y fue diseñado en los años 90 como solución para filtrar llamadas y reducir la carga de los operadores. En su momento, fue un avance enorme. El problema es que el mundo cambió y el IVR no. ## Qué es un IVR y por qué funcionó Un IVR es un árbol de decisiones activado por tonos del teclado (DTMF) o, en versiones más modernas, por reconocimiento de palabras clave. Su lógica es simple: el cliente escucha opciones, elige una, y el sistema lo rutea al siguiente nodo del árbol. **Lo que hizo bien:** - Redujo la carga de los operadores humanos filtrando llamadas simples - Permitió automatizar consultas básicas (saldo, horarios, estado de cuenta) - Escaló sin necesidad de contratar más agentes **Lo que ya no funciona:** - El cliente tiene que adaptarse al sistema, no al revés - Los árboles de opciones se vuelven laberínticos con el tiempo - El reconocimiento de voz básico falla con acentos, ruido ambiente y frases naturales - No puede manejar contexto: cada interacción empieza de cero - La frustración del usuario crece con cada "no entendí su respuesta, por favor repita" ## El costo oculto del IVR Las empresas miden el éxito de su IVR por tasa de contención: qué porcentaje de llamadas se resuelve sin llegar a un agente humano. Pero esa métrica esconde un problema. Un IVR con alta contención no significa clientes satisfechos. Muchas veces significa clientes que colgaron frustrados, clientes que presionaron 0 repetidamente hasta hablar con alguien, o clientes que llamaron tres veces porque nunca encontraron la opción correcta. El IVR fue diseñado para optimizar la operación del contact center. No para optimizar la experiencia del cliente. ## Qué es Voice AI y en qué se diferencia Un agente Voice AI es fundamentalmente distinto. En lugar de presentar opciones predefinidas, escucha lo que el cliente dice en lenguaje natural, comprende la intención y actúa en consecuencia. | | IVR tradicional | Voice AI | |---|---|---| | **Interacción** | Menús con opciones fijas | Conversación natural | | **Comprensión** | Palabras clave o tonos DTMF | Lenguaje natural con contexto | | **Personalización** | Nula | Adapta respuestas al cliente | | **Gestión** | Rutea a un agente humano | Resuelve directamente | | **Contexto** | Cada llamada empieza de cero | Mantiene el hilo de la conversación | | **Escalamiento** | Transfiere y el cliente repite todo | Transfiere con contexto completo | La diferencia más importante: el IVR es un filtro. Voice AI es un agente. ## Un ejemplo concreto **Escenario:** un cliente quiere cambiar su plan de telefonía. ### Con IVR: 1. Llama al número de atención 2. Escucha el menú principal (30 segundos) 3. Presiona 2 para "consultas sobre tu plan" 4. Escucha un segundo menú (20 segundos) 5. Presiona 1 para "cambio de plan" 6. Entra en cola de espera (3-15 minutos) 7. Le atiende un agente que le pide sus datos de nuevo 8. El agente procesa el cambio **Tiempo total:** 5 a 20 minutos. Frustración: alta. ### Con Voice AI: 1. Llama al número de atención 2. "Hola, quiero cambiar mi plan" 3. "Perfecto. ¿Me decís tu cédula para verificar tu identidad?" 4. Verifica, muestra opciones disponibles, confirma el cambio **Tiempo total:** 1 a 3 minutos. Frustración: ninguna. ## "Pero mi IVR tiene reconocimiento de voz" Es cierto que los IVR modernos incorporaron ASR (Automatic Speech Recognition). Pero hay una diferencia entre reconocer palabras y entender intenciones. Un IVR con ASR puede entender "saldo" y rutear a la consulta de saldo. Pero si el cliente dice "quiero saber cuánto me queda de datos y si me conviene cambiar de plan", el IVR no sabe qué hacer con eso. Son dos intenciones en una misma frase, con una dependencia lógica entre ellas. Voice AI procesa esa frase completa, entiende que hay dos consultas relacionadas, y las resuelve en orden. ## Por qué el cambio es inevitable Tres factores hacen que la transición de IVR a Voice AI sea cuestión de tiempo: **1. Las expectativas del consumidor cambiaron.** La gente habla con asistentes de voz todos los días. Pedirles que "presionen 1" se siente anacrónico. **2. Los modelos de lenguaje son lo suficientemente buenos.** Hace cinco años, el reconocimiento de voz en español tenía tasas de error del 15-20%. Hoy los mejores modelos están por debajo del 5%, incluso con acentos regionales. **3. El ROI es claro.** Un agente Voice AI que resuelve el 70% de las llamadas sin intervención humana tiene un impacto directo en costos operativos, tiempos de espera y satisfacción del cliente. ## La transición no tiene que ser abrupta No se trata de desenchufar el IVR un viernes y encender Voice AI un lunes. La transición puede ser gradual: - **Fase 1:** Voice AI atiende un porcentaje de las llamadas, el IVR sigue como fallback - **Fase 2:** Voice AI maneja las verticales más simples (consultas de saldo, estado de cuenta), el IVR las más complejas - **Fase 3:** Voice AI es el canal principal, los agentes humanos manejan excepciones y escalamientos Esta transición permite medir resultados en cada etapa y ajustar antes de escalar. --- *En Buen dIA construimos agentes Voice AI que reemplazan al IVR con conversaciones naturales, resolución real y una experiencia que tus clientes agradecen. Si querés ver la diferencia, [agendá una demo](/#contacto).* --- ### Qué es Voice AI y por qué importa para el contact center latinoamericano Fecha: 2026-04-03 URL: https://buendia.uy/blog/voice-ai-contact-center-latam Tags: voice-ai, contact-center, latam, automatización ## Más allá de los chatbots Cuando hablamos de inteligencia artificial aplicada a la atención al cliente, la mayoría piensa en chatbots de texto. Pero hay una revolución silenciosa ocurriendo en los contact centers: **la IA de voz**. Voice AI no es un menú IVR con opciones pregrabadas. Es un agente conversacional que escucha, entiende el contexto y resuelve consultas en tiempo real, como lo haría un operador humano experimentado, pero disponible las 24 horas, sin colas y sin esperas. ## El problema del contact center tradicional en Latinoamérica Los contact centers de la región enfrentan desafíos específicos: - **Costos operativos crecientes.** Mantener equipos grandes de agentes es cada vez más caro, especialmente en horarios nocturnos y fines de semana. - **Tiempos de espera inaceptables.** En telecomunicaciones, energía y banca, es común esperar 10 a 20 minutos para hablar con alguien. - **Alta rotación de personal.** Los agentes de contact center tienen tasas de rotación del 30-45% anual en la región, lo que genera costos constantes de capacitación. - **Calidad inconsistente.** La experiencia del cliente depende de qué agente atiende, su estado de ánimo y su nivel de capacitación. El resultado: clientes frustrados, empresas que pierden oportunidades de retención y un modelo operativo que no escala. ## Cómo funciona un agente de voz inteligente Un agente Voice AI moderno procesa la conversación en cuatro pasos: 1. **Escucha y transcribe.** Convierte la voz del cliente en texto en tiempo real, entendiendo acentos regionales y modismos locales. 2. **Comprende la intención.** Identifica qué necesita el cliente: no solo las palabras, sino el contexto completo de la conversación. 3. **Ejecuta acciones.** Consulta sistemas, cambia planes, agenda citas, bloquea tarjetas. Todo mientras mantiene la conversación. 4. **Confirma y cierra.** Verifica con el cliente que la gestión fue correcta y cierra el caso. Lo más importante: todo esto sucede en una conversación natural, fluida, sin menús, sin "presione 1 para..." y sin transferencias innecesarias. ## La ventaja latinoamericana Latinoamérica tiene una particularidad que hace a Voice AI especialmente relevante: **la voz sigue siendo el canal preferido**. Mientras en mercados anglosajones el chat y el email dominan las interacciones de soporte, en nuestra región el teléfono sigue siendo el canal principal. Según estudios de la industria, más del 60% de las interacciones de atención al cliente en LATAM se realizan por voz. Esto significa que automatizar el canal de voz tiene un impacto desproporcionado en la operación. ## Casos de uso por industria ### Telecomunicaciones Cambios de plan, consultas de saldo, portabilidad numérica, reclamos por facturación. Un agente Voice AI puede resolver el 70-80% de estas consultas sin intervención humana. ### Servicios públicos (energía, agua) Consulta de estado de cuenta, convenios de pago, reportes de corte, lectura de medidores. Gestiones repetitivas y bien estructuradas, ideales para automatización. ### Banca y finanzas Consulta de saldo y movimientos, bloqueo de tarjetas, disputas de cargos. Con verificación de identidad por voz, el agente puede realizar operaciones sensibles de forma segura. ### Salud Agendamiento de citas, cambio de médico, consulta de resultados. La IA puede manejar la logística mientras el equipo humano se enfoca en la atención clínica. ## Lo que viene Voice AI no reemplaza a los agentes humanos: los libera. Los casos complejos, las situaciones emocionales y las excepciones siguen necesitando el toque humano. Pero las consultas repetitivas, las gestiones estándar y la atención fuera de horario pueden automatizarse con calidad profesional. Las empresas latinoamericanas que adopten esta tecnología temprano van a tener una ventaja competitiva real: menor costo operativo, mejor experiencia del cliente y la capacidad de escalar sin multiplicar headcount. --- *En Buen dIA estamos construyendo Voice AI pensada para Latinoamérica, con comprensión del español rioplatense, integración con sistemas locales y una experiencia que se siente humana. Si querés ver cómo funciona en tu industria, [agendá una demo](/#contacto).*