自动监控和告警
自动监控
Fabric实现了Operation Service功能,向外界暴露反映节点内部运行情况的一些指标数据。 点融区块链云服务平台基于该项功能支持了自动监功能,让用户无需额外部署监控节点资源,就可以及时了解节点运行时的内部状况、掌握节点流量的动态变化。
在部署区块链时,您可以选择启用区块链节点监控功能。开启该功能后,在部署Orderer节点和Peer节点时, 将自动开启Orderer节点和Peer节点的Operation Service服务,并通过TLS双向认证的方式,保证Operation Service接口访问的安全性。 在部署完成之后,进入区块链详情,可以实时查看区块链节点运行的关键指标,如账本高度、背书请求处理速率、出块速率、交易处理速率等等。后续添加的Orderer 和Peer节点也会被自动地加入到监控列表中,用户可以查看这些新节点的指标数据。
以下为盟主在创建区块链时,启用区块链节点监控功能。
以下为成员在加入联盟链时,启用区块链节点监控功能。
当区块链部署成功后,进入区块链详情页面,点击左侧的监控菜单栏,便可以查看自己所管理的各个Orderer节点和Peer节点的监控数据。
点融区块链云服务平台已为您精心设计了以下关键指标以反映您的节点的内部工作情况,您可以切换通道以及切换不同的时间区间来查看这些指标数据。 目前最长支持查看15天以内的监控数据。
- Orderer节点交易处理速率
- Orderer节点出块耗时分布
- Peer节点当前账本高度
- Peer节点已处理的交易总数
- Peer节点背书请求平均处理速率
- Peer节点失败的背书请求数量(指定通道上所有合约)
- Peer节点背书请求处理耗时分布
- Peer节点交易平均处理速率
- Peer节点区块处理耗时分布
自动告警
点融区块链云服务平台可以在用户创建区块链之后,自动检查区块链各个节点的运行状况。如果发现任何故障,系统会在用户控制台"告警"页面显示告警信息,并且给用户发送相应的手机短信和电子邮件通知。注意,为了防止误报, 系统会多次确认故障后才报警,因此故障发生后,系统可能无法立即告警,告警延迟的时间可能会有数分钟的时间。点击下图“详情”,可以查看该告警的详细信息,包括故障节点地址、故障类型、告警产生时间、建议的故障处理方法等。
用户排除故障之后,系统会自动重新检测并且清除故障。用户也可以手动清楚故障,但是请确保故障已经排除, 否则系统会产生新的告警。