30
Watch
915
Star
270
Fork
38
Issue

增值税发票OCR识别,使用flask微服务架构,识别type:增值税电子普通发票,增值税普通发票,增值税专用发票;识别字段为:发票代码、发票号码、开票日期、校验码、税后金额等

guanshuicheng
guanshuicheng
pushedAt 3 months ago

guanshuicheng/invoice

增值税发票识别

识别type:增值税电子普通发票,增值税普通发票,增值税专用发票;识别字段为:发票代码、发票号码、开票日期、校验码、税后金额等

环境

  1. python3.5/3.6
  2. 依赖项安装:pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
  3. 有GPU环境的可修改安装requirements.txt对应版本的tensorflow-gpu,config.py文件中控制GPU的开关

模型架构

YOLOv3 + CRNN + CTC

模型

  1. 模型下载地址:链接:https://pan.baidu.com/s/1bjtd3ueiUj3rt16p2_YQ2w
  2. 将下载完毕的模型文件夹models放置于项目根目录下

服务启动

  1. python3 app.py
  2. 端口可自行修改
  3. 服务调用地址:http://...: [端口号]/invoice-ocr,例:http://127.0.0.1:11111/invoice-ocr

测试demo

  1. 测试工具:postman,可自行下载安装
  2. 增值税电子普票测试结果

Image text

  1. 增值税专用普票测试结果

Image text

  1. 增值税普通普票测试结果

Image text

后期开发计划

后期逐步将模型迁移至TF-serving...

参考

chineseocr https://github.com/chineseocr/chineseocr

ucloud ads