近日,由天翼云弹性网络开拓者团队撰写的《Towards Better QoS and Lower Costs of P4 EIP Gateway at the Edge》论文被The 24th IEEE/ACM International Symposium on Cluster, Cloud, and Internet Computing (CCGrid 2024) 长文收录。
CCGrid是云计算领域较高水平的国际学术会议,也是中国计算机学会CCF推荐的国际会议之一。CCGrid平均每年收到数百篇来自世界各地的论文投稿,近三年的论文接收率分别为21%(2023年)、24%(2022年)、26.1%(2021年)。此次弹性网络开拓者团队所著论文被收录,代表着天翼云技术创新能力再获业界权威机构认可。
云网关是一种虚拟的数据包转发设备,在多租户环境中提供高性能和可靠的连接。在众多网关中,公网网关承载了弹性IP(EIP)网络功能,将租户的虚拟私有云(VPC)与公网相连接,如图1所示。
图1 公网网关包转发模型
管理已订阅EIP的流量是EIP网络的主要功能之一。目前常见的EIP解决方案基于纯软件,并部署在x86集群上,将EIP NF卸载至编程协议无关的数据包处理器(P4)交换机可以显著降低资本支出。然而,利用P4来管理和调整流量颇具挑战性:首先,P4规范尚未定义一个标准化的QoS策略库;其次,P4并非专为流量管理或流量整形设计;最后,就EIP的流量管理服务而言,P4交换芯片上的片上存储容量极其有限。
针对上述痛点,该论文提出了一种基于P4虚拟缓冲区(VBuf)的EIP流量管理设计方案,分析了将EIP网关的网络功能卸载到边缘云P4交换机的过程中P4芯片所面临的资源有限的挑战。针对该挑战,论文介绍了天翼云在确保云网关服务质量(QoS)方面的关键洞察和创新设计,该设计创新结合了通用流量整形(GTS)和承诺访问速率(CAR)的优点,基于P4芯片在虚拟网络数据平面上获得了完整的实现。最后,论文对验证QoS改进的评估实验进行了分析,实验结果表明,与CAR相比,该方法(图2中VB)可以将局部流量抖动降低4倍【如图2(a)所示】,将局部数据包丢失率降低10倍【如图2(b)所示】,并使得端侧TCP拥塞窗口变化更加平滑【如图2(c)所示】。
图2 流量验证实验中CAR与本文方法效果的对比
大流量下公网网关抖动
大流量下公网网关丢包率
端侧TCP拥塞窗口变化
天翼云弹性网络开拓者团队致力于云网络领域的架构创新及高新技术预备研发,未来将继续通过科技创新提升云网络的关键性能指标;同时,针对广泛的人工智能和机器学习业务应用,团队将结合云网融合和边缘计算,以提高网络在人工智能数据收集、模型训练、模型传递以及推理决策等方面的效率和准确度。
随着数字化转型深入,弹性网络为用户提供了高度可靠、灵活可扩展和强大的网络基础设施优势,在信息交流和数据传输中发挥着越来越重要的作用。未来,天翼云将不断加强关键核心技术自主攻关,以领先的技术和完善的服务,为用户高效上云、深度用云提供安全、智能、便捷的云服务。