一种纸质文档电子化及归档方法与流程

文档序号:18739338发布日期:2019-09-21 01:35阅读:2467来源:国知局
导航: X技术> 最新专利> 计算;推算;计数设备的制造及其应用技术
一种纸质文档电子化及归档方法与流程

本发明涉及纸质文档电子化技术领域,具体而言,尤其涉及一种纸质文档电子化及归档方法。



背景技术:

现有技术中公开的技术方案,例如:基于图像识别与数据库存储的纸质扫描文档电子化方法(公开号:CN201811325409),解决了现有方法不能从整体上提高纸质文档识别的准确率的问题。

但是,对于生活、工作用的纸质文档不方便携带又容易丢失,无法做到像电子文档一样简洁清晰地分类管理,而且电子文档占用的个人存储空间比较小的问题还尚未解决。例如,一些支持手写转化成电子形式的电子笔记本,需要使用专门的纸或笔进行书写,不仅要不断补充耗材,而且耗材、设施等非常昂贵。教师所用的读卡机不便携带,声音嘈杂,不利于小班教学下的教师阅卷。市场现有产品功能单一,如只有阅卷功能,或者只有扫描功能。目前,市场暂时未给出小规模应用的自动扫描识别归档的解决方案。



技术实现要素:

根据上述提出的技术问题,而提供一种纸质文档电子化及归档方法。本发明主要利用含填涂信息的纸质文档,通过旋转来端正模板图像,可以对填涂信息的位置区域进行良好的定位,从而对各种方式的填涂信息进行有针对性的提取,本发明利用第三方的数据库软件进行有序地存储,以方便读取与修改,对保密性和安全性也有了更大保障。

本发明采用的技术手段如下:

一种纸质文档电子化及归档方法,包括:

步骤1:用户注册,在网站进行注册时,后台会自动为用户生成唯一的用户ID,将用户ID写入数据库;

步骤2:编辑文档,用户编辑文档时,可以选择插入式文本框或可选择框;

步骤3:保存文档,用户点击保存文档时,js将html保存为Json格式,包括框体序号、框体类型、框体内容、框体相对于文档左上角的位置,同时在文档右上方生成二维码;

步骤4:导出文档,用户点击导出文档时,运用canvas将html文档导出为图片文档;

步骤5:填涂文档,用户将导出的图片文档进行填涂,返回记录的数据;

步骤6:根据返回的数据,将结果在前端呈现给用户,如果用户选择存档,则将结果与扭曲矫正后的图片一同存入数据库,同时如果分类标签被选中,则将该扫描结果自动分类至相应标签下;如果用户选择导出结果,则调用JQuery的wordExport将html导出为word文档。

进一步地,所述步骤2编辑文档的具体步骤为:

用户在插入时,直接对html的DOM进行操作,插入的框体类型不同对应的div的class就不同,此为之后判断框体类型的依据。

进一步地,所述步骤3中生成的二维码内容为扫描分析的网址加上文档的ID。

进一步地,所述步骤5填涂文档的具体步骤如下:

步骤51:用手机或其他扫描设备扫描文档右上角的二维码,自动跳转到分析网页;

步骤52:读取URL,得到文档的ID,用户在所述网页上传图片到后台进行处理;

步骤53:后台接收到用户上传的图片后,进行滤波处理,用Canny算法,迭代减少threshold的值,使得识别出的直线数慢慢减少到所需数目;

步骤54:对于相对端正的拍摄图片,左上角与右下角的顶点作为识别出的边缘中距离图片左上角最近和最远的点,而右上角与左下角的顶点作为识别出的边缘中距离图片右上角最近和最远的点;将得到的四个顶点带入到openCV透视变换矩阵得到扭曲矫正后的图像;

步骤55:对图像中记录的选项框位置进行识别,如果该位置附近80%已被涂黑,则认为该选项被选中,返回记录的该选项序号。

较现有技术相比,本发明具有以下优点:

1、本发明提供的纸质文档电子化及归档方法,旨在创建快捷、便利的手机及电脑办公环境,更高效、可定制地将纸质文档转化为计算机可以显示、编辑、储存和输出的数字化文件,用于存档、获取信息以及快捷地进行分类等。

2、本发明提供的纸质文档电子化及归档方法,其项目研究产品具有特化功能,便于教师随时随地地批阅试卷,且具有自主批阅选择、判断类题目的功能。自动分类标签能让用户在扫描的时候就自动对结果进行分档。

3、本发明提供的纸质文档电子化及归档方法,可以应用在教师的小规模测验、调查问卷、商店订单、饭店的点单、个人文件的归档。

基于上述理由本发明可在纸质文档电子化等领域广泛推广。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做以简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明方法流程图。

图2为本发明实施例用户注册时,后台生成的ID数据信息图。

图3为本发明实施例用户编辑文档时的程序图。

图4为本发明实施例的功能选项框图。

图5为本发明实施例用户导出文档的界面图。

图6为本发明实施例用户填涂文档后的界面图。

图7为本发明实施例分析网页的网址图。

图8为本发明实施例扫描结果自动分类至相应标签下的界面图。

图9为本发明实施例用JQuery的wordExport将html导出为word文档的界面图。

具体实施方式

需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。同时,应当清楚,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。对于相关领域普通技术人员己知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为授权说明书的一部分。在这里示出和讨论的所有示例中,任向具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具有不同的值。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。

实施例

如图1所示,本发明提供了一种纸质文档电子化及归档方法,包括:

步骤1:用户注册,在网站进行注册时,如图2所示,后台会自动为用户生成唯一的用户ID,此ID为后续创建文档、编辑、归类的基础,后台将用户ID写入数据库;

步骤2:编辑文档,用户编辑文档时,可以选择插入式文本框或可选择框;用户在插入时,直接对html的DOM进行操作,如图3所示,插入的框体类型不同对应的div的class就不同,此为之后判断框体类型的依据。

步骤3:保存文档,如图4所示,用户点击保存文档时,js将html保存为Json格式,包括框体序号、框体类型、框体内容、框体相对于文档左上角的位置,同时在文档右上方生成二维码;二维码内容为扫描分析的网址加上文档的ID,后台将页面写入数据库。

步骤4:导出文档,如图5所示,用户点击导出文档时,运用canvas将html文档导出为图片文档;

步骤5:填涂文档,如图6所示,用户将导出的图片文档进行填涂,返回记录的数据;

步骤51:用手机或其他扫描设备扫描文档右上角的二维码,如图7所示,自动跳转到分析网页;

步骤52:读取URL,得到文档的ID,用户在所述网页上传图片到后台进行处理;

步骤53:后台接收到用户上传的图片后,进行滤波处理,用Canny算法,迭代减少threshold的值,使得识别出的直线数慢慢减少到所需数目;

步骤54:对于相对端正的拍摄图片,左上角与右下角的顶点作为识别出的边缘中距离图片左上角最近和最远的点,而右上角与左下角的顶点作为识别出的边缘中距离图片右上角最近和最远的点;将得到的四个顶点带入到openCV透视变换矩阵得到扭曲矫正后的图像;

步骤55:对图像中记录的选项框位置进行识别,如果该位置附近80%已被涂黑,则认为该选项被选中,返回记录的该选项序号。

步骤6:如图8所示,根据返回的序号,将结果在前端呈现给用户,如果用户选择存档,则将结果与扭曲矫正后的图片一同存入数据库,同时如果分类标签被选中,则将该扫描结果自动分类至相应标签下;如图9所示,如果用户选择导出结果,则调用JQuery的wordExport将html导出为word文档。

本发明能够更高效、可定制地将纸质文档转化为计算机可以显示、编辑、储存和输出的数字化文件,用于存档、获取信息以及快捷地进行分类。用户在网站进行注册时,后台会自动为用户生成唯一的ID,用户点击保存文档时,同时在文档右上方生成二维码,二维码内容为扫描分析的网址加上文档的ID。用户点击导出文档时,运用canvas将html文档导出为图片,用手机或其他设备扫描文档右上角的二维码,会自动跳转到分析网页。后台接收到用户上传的图片后,进行滤波处理,用Canny算法,迭代减少threshold的值,使得识别出的直线数慢慢减少到所需数目。将拍摄图片带入到openCV透视变换矩阵得到扭曲矫正后的图像。如果用户选择存档,则将结果与扭曲矫正后的图片一同存入数据库,同时如果分类标签被选中,则将该扫描结果自动分类至相应标签下。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

完整全部详细技术资料下载
当前第1页 1  2  3 
相关技术
  • 一种自动化数据流转和数据处理...
  • 一种对账数据处理方法及装置与...
  • 用于管理公共文件的方法和系统...
  • 一种基于高性能可重构计算的超...
  • 执行体创建系统和执行体创建方...
  • 一种会议管理装置、方法及会议...
  • 输入信息的读取方法及电路、存...
  • 一种控制装置的制作方法
  • USB集成电路的制作方法
  • LVDS视频源模块及其使用方...
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1

PHP网站源码惠州阿里店铺运营坪地网站推广方案坪山标王木棉湾SEO按天计费永湖企业网站改版广州企业网站设计松岗英文网站建设大鹏百度seo横岗seo网站推广石岩SEO按天扣费深圳建设网站大芬网络营销惠州建站荷坳营销网站布吉SEO按天计费爱联关键词排名大运网站推广大浪百度竞价包年推广布吉模板推广宝安百度标王惠州网站推广系统石岩百度标王龙华关键词按天计费南澳模板网站建设广州seo网站优化光明模板推广木棉湾网站优化推广平湖网站优化按天收费木棉湾seo网站优化布吉模板推广歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

PHP网站源码 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化