El envío de alto rendimiento a EventHubs que resultó en MessagingException / TimeoutException / Server no pudo procesar los errores de solicitud

Estamos experimentando muchas de estas excepciones enviando eventos a EventHubs durante el pico de tráfico:

"No se pudo enviar el evento a EventHub. Excepción: Microsoft.ServiceBus.Messaging.MessagingException: el servidor no pudo procesar la solicitud; vuelva a intentar la operación. Si el problema persiste, comuníquese con el administrador de Service Bus y proporcione la identificación de seguimiento". o "Error al enviar el evento a EventHub. Excepción: System.TimeoutException: la operación no se completó dentro del tiempo asignado"

Puedes verlo claramente aquí:

Como puede ver, tenemos muchos errores internos, errores de disponibilidad del servidor, solicitud fallida cuando los mensajes entrantes superan los 400K eventos / hora (o ~ 270 MB / hora). Esto no es solo un problema transitorio. Está claramente relacionado con el rendimiento.

Nuestro EH tiene 32 particiones, retención de mensajes de 7 días y 5 unidades de rendimiento asignadas. OperationTimeout está configurado en 5 minutos, y estamos utilizando la RetryPolicy predeterminada.

¿Hay algo que aún necesitemos modificar aquí? Estamos realmente preocupados por la escalabilidad de EH.

Gracias

Respuestas a la pregunta(2)

Su respuesta a la pregunta