前言
问卷调查收集是最常见的社会考察的一种办法, 通常应于市场考察,信息收集等方面。然而宏大的问卷调查收集完了之后面对如此大量的数据该怎么录入,并将内容转换为电子文档呢?明天就为大家介绍通过集成华为HMS ML Kit表格辨认服务来轻松实现表格录入性能。
利用场景
华为HMS ML Kit表格辨认服务是利用AI技术从输出的图片中辨认并返回表格构造信息(包含单元格的行列信息和坐标信息)和表格中的文本信息(包含单元格内的文本内容),反对辨认中英文文本信息及标点符号。表格辨认服务在日常工作场景中有广泛应用。例如,收集到大量纸质表格问卷后,能够通过该服务将辨认到的问卷内容转换为电子文档,缩小人工录入老本,大幅提高工作效率。
注意事项
- 反对辨认具备表格特色的表单、问卷等。
- 临时不反对图片中含有多张表格的辨认,不反对获取表头及表尾信息。
- 满足以下条件可达到最佳辨认成果(如下示图):
拍摄角度 | 立体歪斜角度小于5度 |
---|---|
表格残缺度 | 无缺角、无蜿蜒表格线、表格线间断未间断 |
表格内容 | 表格中的文字为横向,表格中的背景色(底色)和表格线色彩要求有显著的对比度,仅反对为纯印刷体文本,暂不反对辨认表格内的图片、公式、手写字、印章、水印等 |
图片规格 | 图片的长边和短边的比例需小于3:1(含),分辨率需大于960*960px,图片中表格的方向必须正向,表格占图片面积60%以上,并在图片的两头地位 |
开发步骤
1. 开发筹备
具体的筹备步骤能够参考华为开发者联盟:
https://developer.huawei.com/consumer/cn/doc/development/HMSCore-Guides-V5/dev-process-0000001050038076-V5?ha_source=hms1
这里列举要害的开发步骤。
1.1 我的项目级gradle里配置Maven仓地址
<code class="java">buildscript { repositories { google() jcenter() maven {url 'https://developer.huawei.com/repo/'} } dependencies { ... classpath 'com.huawei.agconnect:agcp:1.4.1.300' } } allprojects { repositories { google() jcenter() maven {url 'https://developer.huawei.com/repo/'} } }
1.2 文件头减少配置
集成SDK后,在文件头增加配置
<code class="java">apply plugin: 'com.android.application' apply plugin: 'com.huawei.agconnect'
1.3 利用级gradle里配置SDK依赖
<code class="java">dependencies{ // 引入根底SDK implementation 'com.huawei.hms:ml-computer-vision-formrecognition:2.0.4.300' // 引入表格辨认模型包 implementation 'com.huawei.hms:ml-computer-vision-formrecognition-model:2.0.4.300' }
1.4 将以下语句增加到AndroidManifest.xml文件中,用于自动更新机器学习模型
<code class="java"> <meta-data android:name="com.huawei.hms.ml.DEPENDENCY" android:value= "fr"/>
1.5 申请摄像头权限
<code class="java"><uses-permission android:name="android.permission.CAMERA" /> <uses-feature android:name="android.hardware.camera" />
2. 代码开发
2.1创建表格辨认分析器。
<code class="java">MLFormRecognitionAnalyzerSetting setting = new MLFormRecognitionAnalyzerSetting.Factory().create(); MLFormRecognitionAnalyzer analyzer = MLFormRecognitionAnalyzerFactory.getInstance().getFormRecognitionAnalyzer(setting);
2.2通过android.graphics.Bitmap创立MLFrame对象用于分析器辨认表格,反对的图片格式包含:jpg/jpeg/png,倡议图片尺寸不小于960960像素,不大于19201920像素。
<code class="java">MLFrame mlFrame = MLFrame.fromBitmap(bitmap);
2.3调用asyncAnalyseFrame异步办法或analyseFrame同步办法进行表格辨认(JsonObject对象的数据结构定义请参见JsonObject)。
<code class="java">// asyncAnalyseFrame异步调用。 Task<JsonObject> recognizeTask = analyzer.asyncAnalyseFrame(mlFrame); recognizeTask.addOnSuccessListener(new OnSuccessListener<JsonObject>() { @Override public void onSuccess(JsonObject recognizeResult) { // 辨认胜利。 } }).addOnFailureListener(new OnFailureListener() { @Override public void onFailure(Exception e) { // 辨认失败。 } }); // analyseFrame同步调用。 SparseArray<JsonObject> recognizeResult = analyzer.analyseFrame(mlFrame); if (recognizeResult != null && recognizeResult.get(0).get("retCode").getAsInt() == MLFormRecognitionConstant.SUCCESS) { // 辨认胜利。 } else { // 辨认失败。 }
2.4检测实现,进行分析器,开释检测资源。
<code class="java">if (analyzer != null) { analyzer.stop(); }
总结
华为机器学习表格辨认服务为开发者提供辨认图片中表格的服务,可广泛应用于问卷调查数据收集等利用场景中,代替人工录入,缩小老本。
欲了解更多详情,请参阅:
华为开发者联盟官网:https://developer.huawei.com/consumer/cn/hms?ha_source=hms1
获取开发领导文档:https://developer.huawei.com/consumer/cn/doc/development?ha_source=hms1
参加开发者探讨请到Reddit社区:https://www.reddit.com/r/HMSCore/
下载demo和示例代码请到Github:https://github.com/HMS-Core
解决集成问题请到Stack Overflow:https://stackoverflow.com/questions/tagged/huawei-mobile-services?tab=Newest
如您有任何疑难或须要帮忙,请与咱们分割:[email protected]
原文链接:https://developer.huawei.com/consumer/cn/forum/topic/0204429136296960028?fid=18
原作者:timer