性能工具之所以使用扩展的BPF,部分原因在于它的可编程性。BPF程序可以执行自定义等待时间计算和统计摘要。仅这些功能就可以构成一个有趣的工具,并且还有许多其他具有这些功能的跟踪工具。使BPF与众不同的是,它还高效且生产安全,并且内置于Linux内核中。使用BPF,您可以在生产环境中运行这些工具,而无需添加任何新的内核组件。
让我们看一些输出和一个图表,以了解性能工具如何使用BPF。该示例来自我发布的早期BPF工具bitehist,该工具以直方图的形式显示了磁盘I/O的大小:
[16]。那太差了。
步骤2到步骤4对于高I / O系统具有高性能开销。想象一下,每秒传输10,000个磁盘I / O跟踪记录到用户空间程序以进行分析和汇总。
使用BPF,bitesize程序的步骤为:
1. 在内核中:启用对磁盘I / O事件的检测,并附加一个由bitesize定义的自定义BPF程序。
2. 在内核中,对于每个事件:运行BPF程序。它仅获取字节字段,并将其保存到自定义BPF映射直方图中。
3. 在用户空间中:一次读取BPF地图直方图并打印出来。
此方法避免了将事件复制到用户空间并对其进行重新处理的开销。它还避免了复制未使用的元数据字段。复制到用户空间的唯一数据显示在上一个输出中:“ count”列,它是数字数组。