OCR识别的结果不准确?使用在线智能辅助校对系统修正其中的错误,得到完美结果!
在古籍数字化的过程中,会遇到图像文字无法识别、校对操作不方便等问题,市面上有大量的OCR系统,但是在古籍这个特殊领域,大部分OCR效果都不太好,对于识别结果没有一个简单好用的工具进行修改内容,想做图文对照阅读,但是有图像没有文字,有文字没有准确的坐标信息实现图文对照阅读,而现在,看典古籍正式推出《在线智能辅助校对系统》,将针对以上问题进行重点解决,提供一个简单便捷、识别准确的工具帮助您进行数字化工作。
以下为单图校对功能详细使用文档,如有意见或建议,请通过在线反馈功能向我提交反馈!
一、整体功能概览
在本工具中,顶部区域有三部分:图像上传【左】、简单介绍【中】、历史校对记录【右】,系统识别结束后会将图像显示到下面左侧区域,下面右侧区域共分为三部分:文本行数据表【上】、文本行图像【下左】、单字数据表【下右】
二、简单使用说明
一)【顶部区域】
1、上传图像
点击上传按钮上传图像,点击【开始校对】进入校对模式
2、使用说明
简单使用介绍
4、历史校对记录
每次上传校对的图像和结果会进行记录,点击校对ID打开记录继续进行校对
二)【下部区域】
3、图像
上传/点击历史校对记录会打开图像显示到此处,同时坐标信息也会绘制到此处
5、识别得到的文本行信息显示到此处,表格中显示【文字】、【操作】几个列数据
6、点击文本行/图像中的文本行区域,在此处会显示文本行的图像和图像内文字的坐标绘制信息,右侧展示图像中的字的对应
7、单字结果显示在此处,包含【文字】、【置信度】、【候选字】、【操作】几个列数据
三、详细使用说明
从一张图像上传到校对结束完整功能示例
1、上传图像(略)
2、文本行区域功能
点击【绘制】按钮,将文本行的坐标绘制到图像,点击【取消绘制】删除绘制到图像的坐标框
点击表格中的文字列或点击图像中的文字区域,将绘制改行的坐标框到图像中,并显示文本行图像及单字数据信息
编辑坐标:
点击并按住图像上坐标框的四个顶点,可以进行任意方向调整到包含文本区域
点击【添加】按钮,在图像中按住鼠标并拖动可创建一个矩形区域,按住并拖动可编辑成为四边形坐标框
当点击文本区域并高亮显示时,可以通过按下【Delete】键进行快捷删除文本行
【操作】功能说明
第一个按钮:将当前文本行向上移动一位
第二个按钮:将当前文本行移动到第一行
第三个按钮:将当前文本行向下移动一位
第四个按钮:将当前文本行移动到最后一行
第五个按钮:删除当前文本行
3、单字校对区域
左侧显示文本行图像和文字内容对照查看,点击图像中的文本坐标区域或右侧表格中文字列,可对左右数据进行高亮显示并跟踪
点击【绘制】按钮绘制单字坐标到左侧图像,点击【取消绘制】按钮清楚坐标框
中间黑色背景区域,通过多项颜色显示文字:当置信度在大于1时显示为绿色;当处于0.9-1时,显示为白色;当处于0.6-0.9时为淡橙色,当处于0.6以下时为橙色,如下图
点击表格【文字】列中的文字时,进入文字编辑模式,可以通过输入来改变当前文字
双击【候选字】列中的文字时,会替换所点击的候选字为该图像的文字
【操作】列按钮功能同上面文本行表格中的操作的功能
点击添加按钮,在图像中绘制坐标区域
新增坐标没有文字信息,点击文字坐标框,再点击【识别单字】即可识别新添加的文字并填充到表格中
4、数据处理
可以导出数据和保存已校对数据,点击保存即可保存当前进度,下次打开会接着当前的进度继续校对
点击导出TXT/JSON导出数据,TXT数据只包含文本行的文字数据,JSON数据包含文本行坐标和单字坐标
以上便是单图校对功能的详细使用方法,如有问题、意见、建议都可以通过网站的反馈功能向我提交,后续我将对一些操作不方便的地方进行优化和改进
之后将会开放全书的数字化校对功能,可以将全书通过OCR辅助进行校对,并导出全部结果,敬请期待!