CN-简体中文 CN-简体中文
EN-English EN-English

银行

基于大模型的OCR平台

光学字符识别(OCR)平台将包含文字内容的图像转换为可编辑的文本或提取结构化的信息,提供OCR通用卡证、图像处理、模型训练、通用文字与通用表格的高效识别及智能抽取能力等服务。

技术特色

统一架构兼容多国产芯片

通过一套架构兼容海光、华为、平头哥等主流硬件,降低信创替代的技术门槛和企业部署及运维成本。

大小模型协同推理

“大小模型协同”,实现硬件资源利用最优化。大小模型推理引擎独立服务,按需调用:高频文档由低资源硬件上的小模型处理,复杂非标及长尾文档由大模型处理,通过异构硬件差异化调度与高效协同,达成成本与性能最优平衡。

功能特色

流水分析

支持多格式银行流水文件的上传与结构化识别,具备处理结果明细数据的导出能力。提供银行流水数据加工与基础分析功能,涵盖资金流入流出总额统计、日均余额计算、月末余额核算等核心分析维度,同时支持借贷方向自动标记、消费交易类型智能分类,以及关键信息高亮标注预警机制。支持自定义配置过滤规则,过滤掉部分无效流水数据,如同名互转的流水数据。具备流水文件完整性校验(含缺页检测)与金额平衡校验功能,兼容多种版式银行流水的处理需求。

合同比对

支持1:1双向比对与1:N多向比对两种合同比对模式,实现差异信息的精准定位与坐标高亮标注。兼容多格式合同文件,支持预设关键字段提取、多语言比对,以及表格、印章等特殊元素的识别与比对。提供左右分屏可视化展示功能,支持比对差异结果的结构化输出与差异统计报告的导出,提升比对结果的可读性与使用效率。

智能抽取

基于通用文档解析能力,解析提取各类文档中的文本、表格、标题层级、公式、图片等信息,将非结构化数据转为结构化数据,包括文档版面分析、标题层级划分、阅读顺序识别等。提供智能抽取能力,支持自定义字段,无需任何训练即可实现文档、卡证、表单等任意文档字段的快速抽取,支持单一字段和组合字段的配置。

通用卡证功能

支持复杂背景或低质量图像下的卡证识别能力,涵盖存量的标准卡证(身份证、护照、户口本、出生证明、银行卡、驾驶证、营业执照、开户许可证);市面上常见的标准卡证(房产证、车辆登记证、结婚证、军官证、港澳台通行证、不动产权证,不动产登记证明);支持市面上常见的发票识别,混贴发票识别,其中包含(增值税发票、电子发票、出租车票、火车票、铁路电子客票)。

财报识别

支持境内财报多格式识别,兼容多种主流财报文件格式,具备资产负债表、利润表、现金流量表的自动识别与结构化提取能力,同时支持处理结果数据的定向回传。构建财报科目勾稽关系校验与试算平衡校验机制,支持后台可视化自定义配置财务准则、会计科目及试算平衡公式,适配不同行业、不同地区的财报处理规范。具备财报数据完整性校验(如缺失续页数据)能力,财报科目试算不平衡时高亮标注错误位置,提示错误原因。提供财报影像、识别结果、科目匹配结果的可视化展示功能,支持数据坐标溯源高亮标注,便于用户进行结果核对与数据追溯,自动识别准确度95%以上,支持记录、统计财报上传后自动识别率情况,单张财报识别时间5s以内。

应用场景

财报识别与处理
银行流水识别处理
合同一致性比对

核心功能

光学字符识别(OCR) 通用卡证功能

模型训练平台

通用文字与通用表格的高效识别及智能抽取能力

图像处理能力:支持多种格式的图像读写和格式转换,支持几何变换功能,提供矫正、旋转、缩放、剪裁能力,上传发票或合同出现畸形情况,可处理,支持画质增强功能,提供去模糊、去噪能力,增强图像的可读性;支持图像修复功能,提供去除水印、印章遮盖、内容填充等能力。

相关推荐

联系我们,获取专业支持

致力于成为金融本体AI·硅基员工领军企业

北京市海淀区东升科技园三期东畔科创中心B座5层南侧

投资者关系
010-62309608

企业电话
010-51663199

Copyright 2020-2026北京中科金财科技股份有限公司 All Rights Reserved 京ICP备09077096号-1号 东升科技园三期东畔科创中心B座5层南侧