推荐架构
客户RTA架构图

模块介绍
负载均衡
负载均衡用于承接来自于媒体的RTA请求,并将请求量相对平均的分配到内部的RTA DSP运算资源池。在典型场景中(全站点集下发,缓存1小时),媒体的并发请求量约为20-30W每秒,活跃连接数约5000,带宽约800-1000Mbps。选择更久的缓存时间以及选择合理的下发站点集可以降低对应资源的成本。
负载均衡是观察客户自身业务耗时的观测点,建议重点关注异常比例(非http 200返回数量)、平均耗时(合理值<=8ms),99耗时(合理值<=16ms)。
警告
当客户侧服务质量不佳时,可能会引起媒体侧的大量新建连接涌入。建议负载均衡留有一定的冗余,以应对突发增长的连接量/请求量。