
问题定位流程【免费下载链接】docs该仓库用于维护cann公共文档项目地址: https://gitcode.com/cann/docs图 1定位流程推理结果错误为了后续定位问题需要重新执行推理用于获取模型的Dump数据。获取模型的Dump数据需要调用acl接口打开Dump开关详细描述请参见《精度调试工具》。配置精度模式。配置模型高精度模式后推理获取模型的Dump数据。推理后如果精度达标则进行步骤2.b如果精度不达标则进行步骤3。配置模型高精度模式后推理可能会影响推理性能如果在精度达标的同时需要保持性能则执行2.b~2.d配置部分算子保持原始网络中的数据类型。配置模型高精度模式请参见配置网络模型的高精度模式。使用精度比对工具比对高精度模式下的Dump数据与1获取的Dump数据。工具的使用请参见《精度调试工具》。根据上一步中的比对结果识别计算有差异的算子。一般来说每次识别一个差异算子首个余弦相似度较低的算子例如低于0.95找到差异算子后执行推理推理的同时获取Dump数据用来与高精度模式下的Dump数据比对继续找到下一个差异算子。需要循环执行该步骤直至没有差异算子。对于有差异的算子配置该部分算子保持原始网络中的数据类型再重新推理。配置部分算子的高精度模式请参见配置部分算子保持原始网络中的数据类型。关闭数据缓存优化功能。恢复模型的原有精度模式后关闭数据缓存优化功能后推理如果精度达标则进行步骤3.b如果精度不达标则进行步骤4。当前默认开启数据缓存优化开启数据缓存优化可提高计算效率、提升性能但由于部分算子在实现上可能存在未考虑的场景导致影响精度因此在出现精度问题时可以尝试关闭数据缓存优化。如果关闭数据缓存优化功能后精度达标则还是需要识别出问题算子再联系技术支持进一步分析、解决算子问题解决算子问题后建议保持开启数据缓存优化。您可以获取日志后单击Link联系技术支持。关闭数据缓存优化功能请参见关闭数据缓存优化。使用精度比对工具比对关闭数据缓存优化功能后的Dump数据与1获取的Dump数据。工具的使用请参见《精度调试工具》。根据上一步中的比对结果识别计算有差异的算子。联系技术支持提供有差异的算子进一步分析。您可以获取日志后单击Link联系技术支持。关闭融合规则功能。恢复启用数据缓存优化功能关闭融合规则功能后推理如果精度达标则进行步骤4.b如果精度不达标则进行步骤5。当前默认开启融合规则开启融合规则可提高计算效率、提升性能但算子之间可能会融合融合后的部分算子在实现上可能存在未考虑的场景导致影响精度因此在出现精度问题时可以尝试关闭融合规则。如果关闭融合规则功能后精度达标则还是需要识别出问题算子反馈给技术支持进一步分析、解决算子问题解决算子问题后建议保持开启融合规则功能。您可以获取日志后单击Link联系技术支持。关闭融合规则功能请参见关闭融合规则。关闭某些融合规则可能会导致功能问题因此在配置关闭融合规则后系统在不影响功能的前提下关闭部分融合规则而不是全部融合规则。使用精度比对工具比对关闭融合规则后的Dump数据与1获取的Dump数据。工具的使用请参见《精度调试工具》。根据上一步中的比对结果识别计算有差异的算子。联系技术支持提供有差异的算子进一步分析。您可以获取日志后单击Link联系技术支持。检查数据处理或配置。推理精度不达标可能是由于数据集、AIPP、后处理方式的差异导致需逐步进行排查恢复启用融合规则功能后请检查数据处理或配置参见检查数据处理或配置。如果数据处理逻辑或数据配置有问题则需修改后重新推理如果数据处理逻辑或数据配置没有问题则进行第6步。与标杆计算数据比对。使用精度比对工具将模型的Dump数据与标杆网络的Dump数据进行对比。工具的使用请参见《精度调试工具》。根据前一步中的比对结果识别计算有差异的算子。联系技术支持提供有差异的算子进一步分析。您可以获取日志后单击Link联系技术支持。【免费下载链接】docs该仓库用于维护cann公共文档项目地址: https://gitcode.com/cann/docs创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考