AI提取图片里包含的文字信息-解决文字无法复制的痛点

1. 前言平时工作中编写开发技术文档,或者学生在编写论文时,经常会上网搜索一些参考文献、文档。
比如: 上网搜索相似的内容参考一下或者引用别人的一段文字,有时候看到一篇较好的内容想要保存等等。
这个过程中会发现,很多网站的提供的页面都是不能复制粘贴的,或者直接是图片形式提供,为了方便能获取这些文字,当前就利用华为云提供的 通用文字识别接口,识别图片里的文本内容,方便复制文字。这个功能qq上也集成了,使用很方便,这里利用华为云的接口实现一个与qq类似的功能,截图之后识别图片里包含的文本内容。
这个文字识别接口里不仅仅有通用文字识别功能,还支持很多其他功能:比如身份证、驾驶证、保险单、手写文本、火车票,行驶证.......等等功能。还支持用户自定义识别模板,指定需要识别的关键字段,实现用户特定格式图片的自动识别和结构化提取。
2. 文本识别接口使用介绍2.1 开通服务地址: https://console.huaweicloud.com/ocr/?region=cn-north-4#/ocr/overview
这个文字识别服务是按调用次数计费的,每个用户每月有1000次的免费调用次数,开通服务后就可以使用。
2.2 接口地址官网帮助文档: https://support.huaweicloud.com/api-ocr/ocr_03_0042.html
post https://{endpoint}/v2/{project_id}/ocr/general-text示例:https://ocr.cn-north-4.myhuaweicloud.com/v2/0e5957be8a00f53c2fa7c0045e4d8fbf/ocr/general-text请求头:{ x-auth-token: ******, content-type: application/json;charset=utf-8}请求体:{ image: ----这是图片的bas64编码}响应结果:{ result: { words_block_count: 13, words_block_list: [ { words: 撤,还是不撤?, location: [ [ 43, 39 ], [ 161, 39 ], [ 161, 60 ], [ 43, 60 ] ] }, { words: 让我更骄傲的是公司在大灾面前的表现。, location: [ [ 72, 95 ], [ 332, 95 ], [ 332, 113 ], [ 72, 113 ] ] }, { words: 2011年3月11日14时46分,日本东北部海域发生里氏9.0级, location: [ [ 71, 122 ], [ 482, 122 ], [ 482, 142 ], [ 71, 142 ] ] }, { words: 地震并引发海啸。那一刻,我们正在距离东京100公里的热海开会,, location: [ [ 41, 149 ], [ 481, 149 ], [ 481, 171 ], [ 41, 171 ] ] }, { words: 感觉“咚”, location: [ [ 42, 180 ], [ 114, 180 ], [ 114, 199 ], [ 42, 199 ] ] }, { words: 地被震了一下。面对地震,, location: [ [ 115, 178 ], [ 296, 178 ], [ 296, 199 ], [ 115, 199 ] ] }, { words: 大家都很镇定,, location: [ [ 300, 179 ], [ 400, 179 ], [ 400, 197 ], [ 300, 197 ] ] }, { words: 直到看到电, location: [ [ 405, 179 ], [ 483, 179 ], [ 483, 196 ], [ 405, 196 ] ] }, { words: 视上触目惊心的画面:15时 25 分,海啸到达陆前高田市海岸;15时, location: [ [ 41, 206 ], [ 485, 206 ], [ 485, 228 ], [ 41, 228 ] ] }, { words: 26分,海啸到达陆前高田市中心;15时43分,陆前高田市依稀只能, location: [ [ 40, 234 ], [ 486, 234 ], [ 486, 258 ], [ 40, 258 ] ] }, { words: 看到四层高的市府大楼的屋顶,一瞬间,城镇就变成了汪洋……对, location: [ [ 40, 262 ], [ 487, 262 ], [ 487, 287 ], [ 40, 287 ] ] }, { words: 我来说,地震跟家常便饭一样,可眼前的灾难比以往任何一次都要, location: [ [ 40, 292 ], [ 487, 292 ], [ 487, 317 ], [ 40, 317 ] ] }, { words: 惨烈,完全超出了我的预期。, location: [ [ 41, 326 ], [ 231, 326 ], [ 231, 345 ], [ 41, 345 ] ] } ], direction: -1 }}在请求参数里的x-auth-token参数比较重要,调用华为云的任何api接口都需要这个参数,获取方式可以看前面的文章。比如这篇文章: https://support.huaweicloud.com/api-ocr/ocr_03_0005.html
2.3 在线调试接口地址: https://apiexplorer.developer.huaweicloud.com/apiexplorer/debug?product=ocr&api=recognizegeneraltext
使用调试接口想体验识别效果,图片的数据支持base64编码、http网络图片地址传入,测试非常方便。
关于获取图片base64编码的方式,在文档里也有介绍,直接通过浏览器获取。
3. 实现代码代码采用qt编写的,请求api接口实现调用。其他语言方法是一样的。
3.1 实现效果


iPhone XS和RTX 2080Ti性能都很好,究竟该怎么选?
【曦哥论币】3.19主流货币比特币早间行情分析
新冠大流行刺激UV-CLED消毒应用需求增长,将持续到2022年
ETAS和PLC2 Design合作推出全新整体解决方案
基于TMS320C6416与FPGA的实时光电图像识别系统
AI提取图片里包含的文字信息-解决文字无法复制的痛点
代客泊车将是自动驾驶率先商业化应用之一?
线路板是用来干嘛的
教你用纸板做一把喷钱枪
基于ADMV101424的宽带微波下变频器设计
日本将为中国三大流行支付服务提供加密货币支付
关于LCD投影仪传感器产品特点
电源滤波器在音响电路中是如何发挥作用的?
区块链正在引入分片技术来解决可伸缩性和延迟问题
高通骁龙480性能如何 骁龙480扮演真正意义上的“价格杀手”
左手平台,右手标识:中天互联助力工业互联网规模应用
2018年智能家居市场火药十足,或将是智能家居市场爆发的前兆
如何提高国产PLC运行效率,缩短完成相同任务时的执行时间
卡西欧发布新款智能手表 搭载最新WearOS
智慧储能电网中逆变器的作用