银行
光学字符识别(OCR)平台将包含文字内容的图像转换为可编辑的文本或提取结构化的信息,提供OCR通用卡证、图像处理、模型训练、通用文字与通用表格的高效识别及智能抽取能力等服务。
通过一套架构兼容海光、华为、平头哥等主流硬件,降低信创替代的技术门槛和企业部署及运维成本。
“大小模型协同”,实现硬件资源利用最优化。大小模型推理引擎独立服务,按需调用:高频文档由低资源硬件上的小模型处理,复杂非标及长尾文档由大模型处理,通过异构硬件差异化调度与高效协同,达成成本与性能最优平衡。
支持多格式银行流水文件的上传与结构化识别,具备处理结果明细数据的导出能力。提供银行流水数据加工与基础分析功能,涵盖资金流入流出总额统计、日均余额计算、月末余额核算等核心分析维度,同时支持借贷方向自动标记、消费交易类型智能分类,以及关键信息高亮标注预警机制。支持自定义配置过滤规则,过滤掉部分无效流水数据,如同名互转的流水数据。具备流水文件完整性校验(含缺页检测)与金额平衡校验功能,兼容多种版式银行流水的处理需求。
支持1:1双向比对与1:N多向比对两种合同比对模式,实现差异信息的精准定位与坐标高亮标注。兼容多格式合同文件,支持预设关键字段提取、多语言比对,以及表格、印章等特殊元素的识别与比对。提供左右分屏可视化展示功能,支持比对差异结果的结构化输出与差异统计报告的导出,提升比对结果的可读性与使用效率。
基于通用文档解析能力,解析提取各类文档中的文本、表格、标题层级、公式、图片等信息,将非结构化数据转为结构化数据,包括文档版面分析、标题层级划分、阅读顺序识别等。提供智能抽取能力,支持自定义字段,无需任何训练即可实现文档、卡证、表单等任意文档字段的快速抽取,支持单一字段和组合字段的配置。
支持复杂背景或低质量图像下的卡证识别能力,涵盖存量的标准卡证(身份证、护照、户口本、出生证明、银行卡、驾驶证、营业执照、开户许可证);市面上常见的标准卡证(房产证、车辆登记证、结婚证、军官证、港澳台通行证、不动产权证,不动产登记证明);支持市面上常见的发票识别,混贴发票识别,其中包含(增值税发票、电子发票、出租车票、火车票、铁路电子客票)。
支持境内财报多格式识别,兼容多种主流财报文件格式,具备资产负债表、利润表、现金流量表的自动识别与结构化提取能力,同时支持处理结果数据的定向回传。构建财报科目勾稽关系校验与试算平衡校验机制,支持后台可视化自定义配置财务准则、会计科目及试算平衡公式,适配不同行业、不同地区的财报处理规范。具备财报数据完整性校验(如缺失续页数据)能力,财报科目试算不平衡时高亮标注错误位置,提示错误原因。提供财报影像、识别结果、科目匹配结果的可视化展示功能,支持数据坐标溯源高亮标注,便于用户进行结果核对与数据追溯,自动识别准确度95%以上,支持记录、统计财报上传后自动识别率情况,单张财报识别时间5s以内。