Google公司表示,将对一家人工智能研发团体提供赞助,未来将共同研发文字特征识别技术。
据CNET报道,该项目属于开放资源类型,名为Ocropus,主要有几个目标,其中包括“开发高端易用的手写识别系统,从而将手写文档转化为电脑文本,帮助Google更好的打造自己的电子图书馆,并且分析历史文档,还可以帮助那些视力有问题的用户阅读信息。”据悉该项目名称中的头三个字母OCR代表了最优化文字识别的意思。
该项目研发小组位于德国人工智能研发中心图像理解和模式识别研究组。在日前的Google公司博客上,搜索巨头发布了上述计划。除了得到Google的研发赞助之外,该小组还从德国政府多个部门以及政府和私营机构得到投资。
据Ocropus小组预计,该项目将持续于未来三年,并且他们将赞助三名博士研究生和博士后。在此之前,该领域已经有了两项研究成果,分别是上世纪九十年代中期由美国人口统计局提出的手写识别系统,以及最新提出的层分析方法。而此次的研究将基于这两项成果。另一方面,Google赞助的其他文字识别项目,也将向该小组提供资源帮助,例如:Tesseract――一项由惠普最先提出,并且由Google去年改进的开放资源最优化文字识别技术。
目前Ocropus系统的预览版本已经可以在项目网页上下载,而项目负责人表示,考虑到开放资源的性质,希望招募更多的志愿者加盟完善系统。例如:为系统创建桌面应用程序、加入第三方工具、将Ocropus系统用于多种语言,目前其只能支持英语。