一、直播业务探针探测指标概述
为了提升直播、时移、回看等超高清业务的服务质量,同时能够先于用户发现直播业务的播放质量问题,一般需要在视频流入和流出的关键位置部署探针,以便于对视频流进行状态检测,实时探测当前视频流的信号质量。
同时针对关键指标数据设置告警阀值,当采集的数据指标超过阈值设置后,会通过短信、电话、企业微信、邮件等方式及时通知运维人员处理,从而保证直播业务服务过程中,能够及时发现问题,解决问题,进一步提升运维效率和用户体验。
基于livecached的业务服务架构模式,所有节点可支持边缘录制能力,本身就要对组播源进行解析处理后完成录制缓存,因此基于组播源的解析处理能力,可同步输出探针探测指标数据(相当于部署的探针),与监控告警约定数据结构方式,由监控告警部署采集器采集相应的探针指标数据,可统一再Grafana上进行探针指标数据的实时展示;同时在夜莺平台配置探针告警规则和阀值条件,当触发阈值后,可按约定告警方式向指定运维人员发起探针告警,便于及时发现并解决问题。
二、解析直播源输出探针探测指标数据整体业务架构说明
三、严重影响视频质量的探测指标相关说明
1、TS同步丢包
- 传输流同步丢失,主要是获取同步数据;
- 取决于能否获得同步所必需的同步字节数和无法同步失去的同步字节数;
- 连续检测到5 个正常同步视为同步, 连续检测到2 个以上不正确同步则为同步丢失错误;
- 只有同步达到一定的要求后才可以进行其他参数的测试;
- TS流同步丢失,标志着传输过程中会有部分数据丢失,直接影响解码后的画面质量;
- 接收端可能出现的现象:黑屏、静帧和马赛克,画面不流畅现象;
2、TS同步字节错误
- 该错误指的是同步字节值不是0x47;
- 在188 或204 字节后若不出现正确的同步字0x47, 则同步字节错误指示符置位;
- 同步字节错误传输数据仍是188 或204 包长, 但同步字头的0x47 被其他数字代替;
- 表明传输的部分数据有错误,严重时会导致解不出信号;
- 接收端可能出现的现象:黑屏、静帧和马赛克,画面不流畅现象;
3、PAT表格错误
- PAT是节目关联表,PAT的PID是固定的0x0000,该错误有3种具体类型:
类型1:PID为0x0000的PAT包,没有在0.5s内重复出现一次;
类型2:PID为0x0000的PAT包中无内容;
类型3:PID为0x0000的PAT包中的加密控制字段不是00; - 当PAT丢失或者被加扰,就无法搜索到TS流中有哪些节目,PAT超时,解码延迟将会增加;
- 与节目映射表相对应, 只示出组成传输流中视频、音频和数据流的各个PAT 丢失,则无法正常工作;
- 接收端可能出现的现象:搜索不到节目或者节目搜索错误;
4、连续计数错误
- 在这个指示符中有数据包顺序、数据包丢失等步骤的检查;
- TS 包头中的连续计数器是为了随着每个具有相同PID 的TS 包的增加而增加;
- TS 包头连续计数不正确, 表明当前传输流有丢包、包重叠、包顺序错现,最终造成终端解码错误;
- 接收端可能出现的现象:马赛克;
5、PMT表格错误
- PMT是节目映射表,标识并指示了组成每路业务的音频流、视频流的位置(PID), 及每路业务的节目时钟参考( PCR) 字段的位置。
- 定义传输流中包含的视音频及任一素材数据内容;
- 节目映射表同PAT, 在系统规范中规定有重复的间隔( 0.5s) , 错误大致可划分为重复间隔错误与PMTPID 包头中的加密控制字段不为零错误;
- PMT被加密,则无法搜索到相应节目;PMT超时,影响切换节目时间;
- 接收端可能出现的现象:搜索不到节目或者节目搜索错误;
6、PID错误
- 确认每一个出现的PID, 检测每一个PID 中是否有码流存在;
- 在每一个具体的PID 中, 都携带有实时的数据信息;
- 涉及到传输流被复用时, 特别是多路复用和解多路复用进程中, 此类错误比较常见,;
- 出现此错误在具体的分析仪器显示设置错误, 造成解码不完全错误;
- 没有PID就不能完成该路业务的解码;
- 接收端可能出现的现象:黑屏、静帧和马赛克等异常;
四、部分影响视频质量的探测指标相关说明
1、传输错误
- Transport error 指示符是布尔逻辑, 具有应可复位的二进制计数器, 对出错的TS 包进行计数;
- 传输错误指示为1 时, 表明在相应的传输流中有一个不可矫正传输错误, 重新置位后错误恢复, 传输指示为0;
- 对出错的错误进行统计估计, 出现一个错误, 就不进一步对误差包中得到进一步的出错指示;
- 接收端可能出现的现象:黑屏、静帧和马赛克,画面不流畅现象;
2、CRC循环冗余校验错误
- CRC 错误主要发生在PAT、PMT、NIT、EIT、BAT、SDT 或TOT 中, 用来指示相关表中的内容有没有被污染;
- 循环冗余校验错误指示无法矫正的错误, 在进一步的分析中不再给出提示;
- 接收端可能出现的现象:黑屏、静帧和马赛克,画面不流畅现象;
3、PCR不连续错误
- PCR 是节目时钟参考的英文缩写, 该参量和解码有关。
- 在解码以前的传输阶段中, 出现的都是离散的数字信号, 因此我们在分析PCR 的时候, 可以建立在一个比较单一、理想的环境中, 即编码和解码端的时钟配对问题和定时问题;
- 接收端可能出现的现象:视频音频不同步现象;
4、PCR间隔错误
- 接收PCR 中所含的不准的27MHz 时钟精度, 但不包含任何传输定时损伤, 测量时传输码流中PCR字节位置作为起点, 计算PCR 到达时间;
- 正负500ns的精度范围足够从系统时钟中恢复合成色度负载波;
- 精度必须高于500ns 但抖动量不得大于正负500ns,若是抖动量过大, 则会影响到系统时钟恢复以至于时钟失锁;
- 接收端可能出现的现象:视频音频不同步现象;
5、PTS错误
- PTS( 显示时间标记) 在PES 包头中出现的区, 它指示表示单元出现在系统目标解码器中的时间;
- 至少间隔700ms 出现一次, PTS 只有在TS 不加扰的时候才能正确的得出, 错误影响到帧图像的恢复;
- 接收端可能出现的现象:视频音频不同步现象;
6、CAT条件接收表错误
- CAT 是一个指针, 可以使综合解码器找到关于CAS 系统相关联的EMM信息, 若不出现CAT 表, 接收端无法正确接收管理控制信息;
- 错误的CAT 中TS包头中的加密控制段不为0, 但带有table- id=0x01 的部分不出现在PID 0x001 上出现带有table- id 不等于0x01 的部分;
- 也就是说相应的PID 为0x0001 的条件接收表CAT, 或在PID 为0x0001 的包中发现非CAT 表;
- 接收端可能出现的现象:无法正确处理CAT;
五、特定影响视频质量的探测指标相关说明
1、DF延迟抖动
- 该数值表明被测试视频流的延迟和抖动状况,DF的单位是毫秒(ms);
- DF将视频流抖动的变化换算为对视频传输和解码设备缓冲的需求;
- 被测视频流抖动越大,DF值越大;
- 当网络设备和解码器的缓冲区容纳的视频内容时间不小于被测视频流DF读数时,将不会出现视频播放质量的下降。
- 因为网络节点需要分配不小于DF值的缓冲用于平滑视频流抖动,所以DF的最大值为视频内容通过该网络节点的最小延迟;
2、MLR数据包丢失
- MLR的单位是每秒的媒体数据包丢失数量;
- 该数值表明被测试视频的传输丢包速率;
- 由于视频信息的数据包丢失将直接影响视频播放质量,理想情况下的IP视频流传输要求MLR的数值为零;
- 因为具体的视频播放设备对丢包可以通过视频解码中进行补偿或者丢包重传,在实际测试中MLR的阈值可以相应调整;
- MLR=媒体数据包丢失总数/采样周期,默认采样周期为1s;MPEG-2 TS数据包格式是指有效的MPEG 数据包(不包括填充MPEG Frame);
- 主要是用于衡量IP网络承载对于视频业务流质量的影响
3、断流
- 断流是指持续超过设定时间门限没有受到媒体流;
- 可以用来触发被测频道断流的告警
4、吞吐率
- 指数据传输时单位时间传送的数据位数,单位kbps或Mbps;
5、卡顿时长
- 卡顿持续的时间,单位毫秒;
六、IPTV解析直播源输出质量探测指标数据可视化展示
IPTV解析直播源输出质量探测指标数据可视化展示信息主要用于展示所有直播频道关键指标信息的整体视频质量的状况,包括基础数据展示、频道探测情况概览展示、DF延迟抖动指标、MLR数据包丢失指标、断流指标、TS同步丢失错误指标、TS同步字节错误指标、连续计数错误指标、PAT表格错误指标、PMT表格错误指标、PID错误指标,方便直观了解IPTV直播源的视频质量状况。
七、结语
IPTV解析直播源输出探针质量指标数据主要用于展示实时直播源(部署探针节点检测所有频道)的关键指标信息,通过对实时直播源频道的采集解析输出RFC 445 MDI指标和TR101-290一级关键指标信息的检测,相关探针探测指标基于监控告警数据可以再支撑平台大屏中进行展示,运维或业务人员通过大屏数据,及时对直播源相关质量问题进行预判和定位,为直播节目源故障诊断及业务质量监控预警提供依据。