OCR单图校对系统使用文档-2023.9.7

发布者：看典古籍发布时间：2023-09-07 22:07 阅读次数：1008

OCR识别的结果不准确？使用在线智能辅助校对系统修正其中的错误，得到完美结果！

在古籍数字化的过程中，会遇到图像文字无法识别、校对操作不方便等问题，市面上有大量的OCR系统，但是在古籍这个特殊领域，大部分OCR效果都不太好，对于识别结果没有一个简单好用的工具进行修改内容，想做图文对照阅读，但是有图像没有文字，有文字没有准确的坐标信息实现图文对照阅读，而现在，看典古籍正式推出《在线智能辅助校对系统》，将针对以上问题进行重点解决，提供一个简单便捷、识别准确的工具帮助您进行数字化工作。

以下为单图校对功能详细使用文档，如有意见或建议，请通过在线反馈功能向我提交反馈！

一、整体功能概览

在本工具中，顶部区域有三部分：图像上传【左】、简单介绍【中】、历史校对记录【右】，系统识别结束后会将图像显示到下面左侧区域，下面右侧区域共分为三部分：文本行数据表【上】、文本行图像【下左】、单字数据表【下右】

二、简单使用说明

一）【顶部区域】

1、上传图像

点击上传按钮上传图像，点击【开始校对】进入校对模式

2、使用说明

简单使用介绍

4、历史校对记录

每次上传校对的图像和结果会进行记录，点击校对ID打开记录继续进行校对

二）【下部区域】

3、图像

上传/点击历史校对记录会打开图像显示到此处，同时坐标信息也会绘制到此处

5、识别得到的文本行信息显示到此处，表格中显示【文字】、【操作】几个列数据

6、点击文本行/图像中的文本行区域，在此处会显示文本行的图像和图像内文字的坐标绘制信息，右侧展示图像中的字的对应

7、单字结果显示在此处，包含【文字】、【置信度】、【候选字】、【操作】几个列数据

三、详细使用说明

从一张图像上传到校对结束完整功能示例

1、上传图像（略）

2、文本行区域功能

点击【绘制】按钮，将文本行的坐标绘制到图像，点击【取消绘制】删除绘制到图像的坐标框

点击表格中的文字列或点击图像中的文字区域，将绘制改行的坐标框到图像中，并显示文本行图像及单字数据信息

编辑坐标：

点击并按住图像上坐标框的四个顶点，可以进行任意方向调整到包含文本区域

点击【添加】按钮，在图像中按住鼠标并拖动可创建一个矩形区域，按住并拖动可编辑成为四边形坐标框

当点击文本区域并高亮显示时，可以通过按下【Delete】键进行快捷删除文本行

【操作】功能说明

第一个按钮：将当前文本行向上移动一位

第二个按钮：将当前文本行移动到第一行

第三个按钮：将当前文本行向下移动一位

第四个按钮：将当前文本行移动到最后一行

第五个按钮：删除当前文本行

3、单字校对区域

左侧显示文本行图像和文字内容对照查看，点击图像中的文本坐标区域或右侧表格中文字列，可对左右数据进行高亮显示并跟踪

点击【绘制】按钮绘制单字坐标到左侧图像，点击【取消绘制】按钮清楚坐标框

中间黑色背景区域，通过多项颜色显示文字：当置信度在大于1时显示为绿色；当处于0.9-1时，显示为白色；当处于0.6-0.9时为淡橙色，当处于0.6以下时为橙色，如下图

点击表格【文字】列中的文字时，进入文字编辑模式，可以通过输入来改变当前文字

双击【候选字】列中的文字时，会替换所点击的候选字为该图像的文字

【操作】列按钮功能同上面文本行表格中的操作的功能

点击添加按钮，在图像中绘制坐标区域

新增坐标没有文字信息，点击文字坐标框，再点击【识别单字】即可识别新添加的文字并填充到表格中

4、数据处理

可以导出数据和保存已校对数据，点击保存即可保存当前进度，下次打开会接着当前的进度继续校对

点击导出TXT/JSON导出数据，TXT数据只包含文本行的文字数据，JSON数据包含文本行坐标和单字坐标

以上便是单图校对功能的详细使用方法，如有问题、意见、建议都可以通过网站的反馈功能向我提交，后续我将对一些操作不方便的地方进行优化和改进

之后将会开放全书的数字化校对功能，可以将全书通过OCR辅助进行校对，并导出全部结果，敬请期待！