PaddleOCR工作环境通过坐标数据进行训练
简要介绍
用户批量上传需要识别的照片,上传成功后,系统会启动Hangfire后台Job开始调用PaddleOCR服务返回结果,这个过程有点类似微服务的架构模型。
PaddleOCR
PaddleOCR是百度AI团队开源的一个项目,应该是目前所有免费开源OCR项目中识别效果最好的,具体可以通过PaddleOCR了解,如果你没有Python的开发经验,可能在环境部署上会遇到一些问题,但几乎都能找到解决方案。
用户批量上传要识别的文件,由于我的虚拟机性能非常差,所以才能先上传系统后台自动识别
系统识别完成后会自动通知用户并修改状态,用户预览识别的结果
经测试PaddleOCR可在glibc 2.23上运行,您也可以测试其他glibc版本或安装glic 2.23
PaddleOCR 工作环境
PaddlePaddle 2.0.0python3.7glibc 2.23cuDNN 7.6+
建议使用我们提供的docker运行PaddleOCR,有关docker,nvidia—docker使用请参考链接。。
如您希望使用 mac 或 windows直接运行预测代码,可以从第2步开始执行。充满房间的立体声:将两个HomePodmini音箱与AppleTV4K配对,为你观看的所有内容提供丰富,平衡的声音。
解析发票信息,目前还是使用比较笨的方法,通过正则表达式来匹配需要的字段,比如发票金额,开票日期,发票号码等等,因为这是免费的并没有提供像收费服务那样更智能的匹配,这里我想只要有足够的数据,应该也可以通过自己训练实现更智能的识别所以我留了Label字段,目的就是先有人工制定好对应的字段栏位,然后通过坐标数据进行训练
if var result = response.Content.ReadAsStringAsync.Result, var ocr_result = JsonSerializer.Deserializelt,ocr_resultgt,, var ocr_status = "", invoice.Status = "Done", invoice.Result = ocr_result.status, if foreach foreach var rawdata = new InvoiceRawData Confidence=item.confidence, InvoiceId=id, Text=item.text, Text_Region= JsonSerializer.Serialize , if ) var regex = new Regex("d*$"), var mc = regex.Match(item.text), if(mc.Success) invoice.InvoiceNo = mc.Value, if (item.text.Contains("开票日期")) var regex = new Regex("d4年d2月d2日"), var mc = regex.Match(item.text), if (mc.Success) invoice.InvoiceDate = Convert.ToDateTime(mc.Value.Replace("年","/").Replace("月", "/").Replace("日", "")), if (item.text.Contains("%")) var regex = new Regex("^d*.d*"), var mc = regex.Match(item.text), if (mc.Success) invoice.TaxRate = decimal.Parse(mc.Value), if (item.text.Contains("¥")) var regex = new Regex("d.d*"), var mc = regex.Match(item.text), if (mc.Success) invoice.Amount = decimal.Parse(mc.Value), _context.InvoiceRawDatas.Add(rawdata), ocr_status = ocr_result.status, _context.SaveChangesAsync(default).Wait, _hubContext.Clients.All.SendAsync(SignalR.OCRTaskCompleted, new invoiceNo = invoice.InvoiceNo ),
Canvas 画框标注识别结果
data.map =gt, $('#rawdata_table gt, tbody').append(`
$index + 1$item.Text
`), var points = JSON.parse(item.Text_Region), ctx.lineWidth = "5", ctx.strokeStyle = "#00ff00", ctx.textAlign = 'left', ctx.textBaseline = 'top', ctx.fillStyle = "#ff0000", ctx.font = "bold 13px verdana, sans—serif ", ctx.fillText(item.Text, points(0)(0), points(0)(1)—15), ctx.beginPath, ctx.moveTo(points(0)(0), points(0)(1)), ctx.lineTo(points(1)(0), points(1)(1)), ctx.lineTo(points(2)(0), points(2)(1)), ctx.lineTo(points(3)(0), points(3)(1)), ctx.closePath, ctx.stroke,),
是不是很简单,很酷
最后
Give a Star! 。
If you like or are using this project please give it a star. Thanks!
。郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。
热门阅读
- 1新能源车市场依旧火爆同比增长6.8%
- 2前四届中国新能源汽车产业大会精彩集锦
- 3阳光城已偿还债务超450亿元其称因市
- 4到2022年1月18日高触摸88.8
- 5被联合国喊话捐款解决全球饥饿问题的马
- 6辉瑞新冠口服药带动了相关概念股的大涨
- 7元宵节高能来袭,魏牌玛奇朵DHT购车
- 8飞凡汽车用“科技兑现想象”,旗下车型
- 9坦克品牌2022年首月交付10363
- 10i9—12900KS的价格达到了79
- 11全国首个蓝骑士党支部在上海成立全国首
- 12根据格力电器新收盘价计算上述分红预案
- 13悦虎是大运新能源首次进军新能源乘用车
- 14东吴证券评宁德时代:不畏浮云遮望眼只
- 15将扩大糖宁通络适用的医疗机构范围
- 16小家电代工企业比依股份的中签结果已经
- 17列车上的师徒安全经:多检查多宣传安全
- 18品牌中心店长金彦程Kim告诉可以为城
- 19数字化转型需要从数据管理开始构建大数
- 20情人节的浪漫约会冠道为爱驱动大胆前行
- 21列车里过年在站台上过节新春佳节要坚守
- 22实用处不大买车时擦亮眼省大钱没啥意义
- 23为什么燃油车跑高速省油电动车却很费电
- 24被许多人推崇的「自动驾驶」先锋特斯拉
- 25懂了特斯拉为什么不敢建厂没有得到印度
- 26命名霹雳虎设计和定位都要打破常规剑指
- 27沧州矿石公司践行绿色生态港口发展理念
- 28壬寅虎年新春初启奇瑞集团接连收获开门
- 29华塑控股股份有限公司(ST华塑)股票
- 30以房企为主的工程客户收入不断增长却成
汽车点评网 分析汽车
关注汽车点评网,收听和分享“汽车秘密”
携手汽车点评网,为您提供更多汽车行业新鲜货。