|
新华社乌鲁木齐1月1日电(记者王大霖)新疆日前推出维吾尔文、哈萨克文、柯尔克孜文印刷字符识别软件(简称UKKOCR),这一少数民族印刷字符识别软件,实现了单文种与汉文、英文的双向混排文种的自动识别,填补了目前的国内空白。
这个软件由新疆大学信息科学与工程学院和清华大学电子工程系联合研制成功,经新疆赛卡信息科技有限公司推出。它的工作原理是:通过扫描仪或数码相机等光学输入设备获取纸张上的文字图片信息,利用各种模式识别算法分析文字形态特征,判断出文字的标准编码,并按通用格式存储在文本文件中。
据介绍,这个软件能在Windows2000以上操作系统中正常运行,并能够对图像倾斜进行自动校正,对图像进行自动版面分析等多项核心功能,识别率均高达96%。它能够快速将不可编辑的书刊、报纸、公文、宣传页等印刷文档转化为可供阅读和编辑的高质量电子文档,在党政机关、报社、出版社、教育机构等领域将得到广泛应用。(完)(责任编辑:徐晶晶)
|