ensamblador

Posted on Feb 27 • Edited on Mar 2

El hábito más frecuente de los usuarios de WhatsApp (y como se puede manejar)

#amazonconnect #whatsapp #buffering #cdk

ensamblador

AWS Specialist Solutions Architect Applied AI @ AWS Opinions expressed are solely my own and do not express the views or opinions of my employer.

Aprende a optimizar las integraciones de WhatsApp con Amazon Connect mediante el buffering de mensajes rápidos consecutivos en un solo mensaje coherente. Esta guía paso a paso cubre la arquitectura completa usando AWS CDK, DynamoDB Streams, AWS Lambda, AWS End User Messaging Social y Amazon Connect. Reduce costos y ofrece una experiencia de conversación natural para tus agentes.

Cuando los clientes se comunican por WhatsApp, rara vez envían un solo mensaje. Escriben rápido: "Hola", "Necesito ayuda", "con mi pedido", "P12345". Cada uno de esos mensajes genera un evento de webhook separado y, sin ninguna optimización, cada uno crea un mensaje de chat independiente en Amazon Connect. ¿El resultado? Una conversación fragmentada, un agente confundido y costos innecesarios.

En los chats con IA, normalmente evitamos que los usuarios envíen mensajes adicionales mientras el agente aún está procesando. Lamentablemente, con mensajes asincrónicos y programáticos, no podemos controlar eso. Pero sí podemos controlar cuánto tiempo esperamos antes de empezar a responder. Este blog no solo aplica para escenarios de WhatsApp a Connect, sino para cualquier canal de chat que enfrente el mismo desafío: SMS, mensajes directos en redes sociales y más.

En este blog, aprenderás a resolver esto con una capa de buffering de mensajes que agrega mensajes rápidos consecutivos de WhatsApp en un solo mensaje coherente antes de reenviarlos a Amazon Connect.

Consulta el código en https://github.com/aws-samples

Lo que vas a construir

Una capa de buffering entre AWS End User Messaging Social y Amazon Connect que:

Captura los mensajes entrantes de WhatsApp en una tabla de DynamoDB
Usa DynamoDB Streams con una ventana de agregación (tumbling window) para almacenar mensajes en buffer
Agrega mensajes de texto consecutivos del mismo remitente en uno solo
Reenvía el mensaje combinado a Amazon Connect como un único mensaje de chat

El resultado final: los agentes ven una conversación limpia y natural en lugar de una avalancha de mensajes fragmentados.

Arquitectura

Así funciona el flujo:

Un mensaje de WhatsApp llega a través de AWS End User Messaging Social y se publica en un tema de SNS
Una función Lambda (on_raw_messages) almacena cada mensaje en una tabla de DynamoDB (raw_messages)
DynamoDB Streams activa una función Lambda (message_aggregator) usando una ventana de agregación como buffer
El agregador agrupa, ordena y concatena los mensajes de texto del mismo remitente
El mensaje agregado se reenvía al manejador de eventos de WhatsApp, que crea o actualiza la sesión de chat en Amazon Connect

El Problema

Cuando los usuarios envían múltiples mensajes en rápida sucesión:

Mensaje 1: Hola
Mensaje 2: Necesito ayuda
Mensaje 3: con mi pedido
Mensaje 4: P12345

Sin buffering, cada mensaje crea un mensaje de chat separado en Amazon Connect. Esto genera:

Una conversación fragmentada difícil de seguir para los agentes
Costos más altos (cada mensaje se factura individualmente)
Múltiples invocaciones de Lambda aguas abajo

La Solución: Cómo Funciona el Buffering

1. Almacenamiento de Mensajes raw

Los mensajes entrantes de WhatsApp se almacenan en una tabla de DynamoDB (raw_messages) con:

Clave de partición: from (número de teléfono del remitente)
Clave de ordenamiento: id (ID del mensaje)
TTL habilitado para limpieza automática
DynamoDB Streams habilitado con ventana de agregación

Usar from como clave de partición e id como clave de ordenamiento garantiza que los mensajes del mismo usuario se almacenen juntos y caigan en el mismo shard, por lo que se procesan secuencialmente por el stream.

La Lambda function que maneja esto es sencilla:

def lambda_handler(event, context):
    records = event.get("Records", [])

    for record in records:
        sns = record.get("Sns", {})
        sns_message = json.loads(sns.get("Message", "{}"), parse_float=decimal.Decimal)
        webhook_entry = json.loads(sns_message.get("whatsAppWebhookEntry", {}))

        for change in webhook_entry.get("changes", []):
            value = change.get("value", {})
            metadata = value.get("metadata", {})
            contacts = value.get("contacts", [])

            for message in value.get("messages", []):
                item = message.copy()
                item["metadata"] = metadata
                item["messaging_product"] = value.get("messaging_product")

                # Almacenar en DynamoDB
                table.put_item(Item=item)

    return {'statusCode': 200}

2. Procesamiento del Stream con Ventana de Agregación

La ventana de agregación (tumbling window) es la clave de la estrategia de buffering. DynamoDB Streams activa la Lambda message_aggregator, pero en lugar de invocarla por cada registro individual, la ventana de agregación espera un número configurable de segundos (por defecto: 20) antes de invocar la función con todos los registros acumulados en esa ventana.

Cada shard invoca una sola Lambda, por lo que los mensajes del mismo usuario dentro de esa ventana se procesan todos juntos.

3. Lógica de Agregación

El agregador agrupa los mensajes por remitente, los ordena por marca de tiempo y concatena los mensajes de texto consecutivos con saltos de línea. Los mensajes que no son de texto (imágenes, audio, documentos, etc.) se preservan como elementos separados.

Entrada:
  Mensaje 1: Hola
  Mensaje 2: Necesito ayuda
  Mensaje 3: con mi pedido
  Mensaje 4: P12345

Salida (mensaje agregado único):
  Hola
  Necesito ayuda
  con mi pedido
  P12345

La lógica principal de agregación:

def lambda_handler(event, context):
    raw_records = event.get("Records", [])

    records = []
    for record in raw_records:
        if record.get("eventName") == "INSERT":
            new_image = record.get("dynamodb", {}).get("NewImage", {})
            deserialized = deserialize_dynamodb(new_image)
            records.append(deserialized)

    if len(records) == 0:
        return {"state": event.get('state', {})}

    aggregated = aggregate_all_messages(records)

    # Reenviar cada mensaje agregado al manejador de eventos de WhatsApp
    for agg in aggregated:
        lambda_client.invoke(
            FunctionName=os.environ['WHATSAPP_EVENT_HANDLER'],
            InvocationType='Event',
            Payload=json.dumps(agg)
        )

    return {"state": event.get('state', {})}

4. Reenvío a Amazon Connect

Una vez agregados, la Lambda invoca asincrónicamente la función Lambda WhatsApp Inbound, que crea o actualiza la sesión de chat en Amazon Connect con el mensaje combinado. El agente ve un mensaje limpio en lugar de cuatro mensajes separados.

Beneficios

Flujo de conversación natural: Múltiples mensajes rápidos aparecen como un solo mensaje coherente
Optimización de costos: Menos mensajes aguas abajo significa menores costos de chat en Amazon Connect
Limpieza automática: El TTL elimina los mensajes en crudo automáticamente
Escalable: DynamoDB Streams maneja alto rendimiento (hasta 10,000 registros por stream)
Confiable: El procesamiento del stream asegura que no se pierdan mensajes (entrega al menos una vez)

Estimación de Costos

Escenario de ejemplo: 1,000 mensajes raw agregados en 250 mensajes (suponiendo una proporción de 4:1). Los mensajes son respondidos por un agente humano.

Componente	Sin Buffering	Con Buffering	Ahorro
DynamoDB + Streams	—	~$0.0013	—
Lambda (todas las funciones)	—	~$0.00078	—
Infraestructura de Buffering	$0.00	~$0.002	—
Llamadas API entrantes	1,000 llamadas	250 llamadas	75% menos llamadas
Costo Chat Connect (entrada)	$4.00	$1.00	$3.00
Total	$4.00	~$1.00	~$3.00 (75%)

Ten en cuenta que el costo total de la comunicación considera Connect entrada y salida, así como EUM entrada y salida. Aquí solo estamos reduciendo los mensajes de entrada de Amazon Connect Chat.

Costo de Connect Chat: $0.004 × msg (entrada) + $0.004 × msg (salida). Ver precios
Costo de EUM: $0.005 × msg (entrada) + $0.005 × msg (salida). Ver precios

Prerrequisitos

Antes de comenzar necesitarás:

Cuenta de WhatsApp Business

Para empezar, necesitas crear una nueva cuenta de WhatsApp Business (WABA) o migrar una existente a AWS. Los pasos principales se describen aquí. En resumen:

Tener o crear una cuenta de Meta Business
Acceder a la consola de AWS End User Messaging Social y vincular tu cuenta de negocio a través del portal integrado de Facebook
Asegurarte de tener un número de teléfono que pueda recibir verificación por SMS/voz y agregarlo a WhatsApp

⚠️ Importante: No uses tu número personal de WhatsApp para esto.

Una Instancia de Amazon Connect

Necesitas una instancia de Amazon Connect. Si aún no tienes una, puedes seguir esta guía para crear una.

Necesitarás el INSTANCE_ID de tu instancia. Puedes encontrarlo en la consola de Amazon Connect o en el ARN de la instancia:

arn:aws:connect:<region>:<account_id>:instance/INSTANCE_ID

Un Flujo de Chat para Manejar Mensajes

Crea o ten listo el flujo de contacto que define la experiencia del usuario. Sigue esta guía para crear un flujo de contacto de entrada (Inbound Contact Flow). El más sencillo funcionará.

Recuerda publicar el flujo.

Toma nota del INSTANCE_ID y CONTACT_FLOW_ID desde la pestaña de Detalles. Los valores están en el ARN del flujo:

arn:aws:connect:<region>:<account_id>:instance/INSTANCE_ID/contact-flow/CONTACT_FLOW_ID

Despliegue con AWS CDK

⚠️ Despliega en la misma región donde están configurados tus números de WhatsApp en AWS End User Messaging.

1. Clona el repositorio y navega al proyecto

git clone https://github.com/aws-samples/sample-whatsapp-end-user-messaging-connect-chat.git
cd sample-whatsapp-end-user-messaging-connect-chat/whatsapp-eum-connect-chat

2. Despliega con CDK

Sigue las instrucciones en la Guía de Despliegue con CDK.

Configuración Post-despliegue

Paso 1: Actualizar el Parámetro SSM

Después del despliegue, actualiza el parámetro SSM /whatsapp_eum_connect_chat/config con los detalles de tu Amazon Connect:

{
  "instance_id": "<tu-connect-instance-id>",
  "contact_flow_id": "<tu-contact-flow-id>",
  "chat_duration_minutes": 60,
  "ignore_reactions": "yes",
  "ignore_stickers": "yes"
}

Parámetro	Descripción
`instance_id`	El ID de tu instancia de Amazon Connect
`contact_flow_id`	El ID del flujo de contacto de entrada para chat
`chat_duration_minutes`	Cuánto tiempo permanece activa la sesión de chat (por defecto: 60)
`ignore_reactions`	Si se ignoran las reacciones de WhatsApp (por defecto: yes)
`ignore_stickers`	Si se ignoran los stickers de WhatsApp (por defecto: yes)

Paso 2: Agregar el Destino de Eventos

Después de desplegar el stack, usa el tema SNS creado como destino de eventos en la consola de AWS End User Messaging Social.

Ve a AWS Systems Manager Parameter Store y copia el valor de /whatsapp_eum_connect_chat/topic/in (comienza con arn:aws:sns)

En la consola de AWS End User Messaging Social, selecciona el destino Amazon SNS y pega el Topic ARN del paso anterior

Paso 3: Ajustar el Tiempo de Buffer (Opcional)

La ventana de buffer por defecto es de 20 segundos. Si deseas cambiarla, edita BUFFER_IN_SECONDS en config.py y vuelve a desplegar:

BUFFER_IN_SECONDS = 20  # Cambia este valor (en segundos)

Pruebas

Ve a tu instancia de Amazon Connect y abre el Panel de Control de Contactos (CCP). Envía un mensaje de WhatsApp al número de End User Messaging Social.

Intenta enviar una secuencia rápida de mensajes y observa cómo llegan como un solo mensaje agregado en Amazon Connect.

Próximos Pasos

Aunque este blog se enfoca en WhatsApp y Amazon Connect, el patrón de buffering aplica de forma amplia. Cualquier canal de chat donde los usuarios envíen mensajes rápidos y asincrónicos — SMS, mensajes directos en redes sociales o integraciones personalizadas — puede beneficiarse del mismo enfoque. Si no puedes evitar que los usuarios envíen múltiples mensajes mientras se procesa una respuesta, al menos puedes controlar cuánto tiempo esperas antes de actuar.

Algunas ideas para extender esta solución:

Ajustar la ventana de buffer según tu caso de uso (más corta para tiempo real, más larga para ahorro de costos)
Agregar una Cola de Mensajes Fallidos (Dead Letter Queue) para el procesamiento fallido del stream
Implementar lógica de agregación personalizada para tipos de mensajes específicos (por ejemplo, agrupar imágenes)
Combinar con la solución de WhatsApp Iniciado por el Agente para comunicación bidireccional completa

Recursos

ensamblador

AWS Specialist Solutions Architect Applied AI @ AWS Opinions expressed are solely my own and do not express the views or opinions of my employer.

DEV Community

El hábito más frecuente de los usuarios de WhatsApp (y como se puede manejar)

ensamblador

Lo que vas a construir

Arquitectura

El Problema

La Solución: Cómo Funciona el Buffering

1. Almacenamiento de Mensajes raw

2. Procesamiento del Stream con Ventana de Agregación

3. Lógica de Agregación

4. Reenvío a Amazon Connect

Beneficios

Estimación de Costos

Prerrequisitos

Cuenta de WhatsApp Business

Una Instancia de Amazon Connect

Un Flujo de Chat para Manejar Mensajes

Despliegue con AWS CDK

1. Clona el repositorio y navega al proyecto

2. Despliega con CDK

Configuración Post-despliegue

Paso 1: Actualizar el Parámetro SSM

Paso 2: Agregar el Destino de Eventos

Paso 3: Ajustar el Tiempo de Buffer (Opcional)

Pruebas

Próximos Pasos

Recursos

ensamblador

Top comments (0)

ensambladorFollow

Lo que vas a construir

Arquitectura

El Problema

La Solución: Cómo Funciona el Buffering

1. Almacenamiento de Mensajes raw

2. Procesamiento del Stream con Ventana de Agregación

3. Lógica de Agregación

4. Reenvío a Amazon Connect

Beneficios

Estimación de Costos

Prerrequisitos

Cuenta de WhatsApp Business

Una Instancia de Amazon Connect

Un Flujo de Chat para Manejar Mensajes

Despliegue con AWS CDK

1. Clona el repositorio y navega al proyecto

2. Despliega con CDK

Configuración Post-despliegue

Paso 1: Actualizar el Parámetro SSM

Paso 2: Agregar el Destino de Eventos

Paso 3: Ajustar el Tiempo de Buffer (Opcional)

Pruebas

Próximos Pasos

Recursos

ensambladorFollow

ensamblador

ensamblador