专利名称:计算机、文档识别方法以及系统专利类型:发明专利
发明人:渡边恭男,大河内俊夫,新庄广,本林正裕,铃木康文申请号:CN201810160384.1申请日:20180226公开号:CN108984578A公开日:20181211
摘要:本发明的课题在于从记载于纸的文档高精度地提取在电子申请中需要的字符串。一种提取表示记载于纸的文档的特征的字符串即属性的计算机,计算机保持模板信息以及词典信息,对记载于纸的文档的图像数据执行字符识别处理,使用字符识别处理的结果以及多个模板,提取与在多个模板的各模板中定义的属性的类型对应的属性,针对多个模板的每一个计算与提取出的属性相关的得分,基于得分选择属性的提取精度最高的模板,生成包含使用所选择的模板而提取出的属性的输出信息。
申请人:株式会社日立制作所
地址:日本东京都
国籍:JP
代理机构:中科专利商标代理有限责任公司
代理人:刘慧群
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容