看典古籍OCR客户端v2.0.7使用教程

发布者:看典古籍 发布时间:2026-01-28 12:10 阅读次数:580

看典古籍OCR客户端v2.0.7使用教程

看典古籍OCR客户端v2.0.7版本已正式上线,可前往官网下载使用!

下载地址:看典古籍OCR客户端v2.0.7

软件详情页:看典古籍软件下载

image.png

一、软件核心定位

看典古籍OCR客户端是一款深耕古籍领域的专业文字识别工具,专为古籍研究者、图书馆工作人员、历史文化爱好者及古籍出版机构等群体打造。无论是珍稀善本的文字提取、古籍文献的数字化归档,还是个人对古籍内容的查阅整理,均可通过该客户端高效完成。它让古籍文字打破尘封、“活”态呈现,彻底突破传统古籍研究的时空局限,为古籍数字化工作赋能。

二、v2.0.7版本更新内容

本版本在完整保留v2.0.6版本核心功能的基础上,优化升级两大核心特性,具体如下:

(一)Token与账号隐藏显示功能

为保障用户信息安全,新增Token及账号隐藏选项。用户可自主选择隐藏API Token与看典账号信息,有效避免截图分享软件界面时,敏感信息泄露,进一步筑牢数据安全防线。

(二)新增文件识别功能(重点更新)

全新上线【文件识别】功能,采用任务式管理模式,支持单个PDF、多个PDF、多张图像文件及文件夹批量识别,大幅减少人工重复操作,提升识别效率。每个任务可独立设置识别页面范围与识别参数,精准适配不同古籍文档的识别需求,让识别效果更可控。

该功能同步打通官网古籍数字化服务中的PDF识别与多图识别能力,客户端识别结果与网页端完全一致,且无PDF页数、文件大小限制。同时,系统会实时记录任务识别进度,若识别过程中断,重启后可接续之前进度继续识别,避免重复劳动。

image.png

三、v2.0.7版本使用教程

(一)下载与安装

方式一:访问看典古籍官方网站(工具软件下载 - 看典古籍),在左侧栏目中选择“看典古籍OCR客户端”,点击“立即下载”即可。

方式二:直接点击下载

下载完成后,解压压缩包即可使用。本软件为免安装绿色版,无需复杂配置,双击客户端程序即可启动。

(二)配置API参数

启动软件后,在界面“OCR API配置”栏目中,准确输入个人API Token及官网账号,点击“刷新”按钮,即可实时查看Token使用状态。若尚未获取API Token,可点击对应入口前往古籍数字化服务 - 看典古籍页面创建。

(三)古籍识别操作

除新增【文件识别】功能外,其余功能操作与v2.0.6版本一致,可参考旧版教程:看典古籍OCR客户端v2.0.6上线!。以下重点讲解【文件识别】功能的操作步骤:

  1. 进入文件识别窗口,点击软件对应功能入口,打开文件识别操作界面(如图所示):
    image.png

  2. 设置结果保存路径:建议在电脑中新建专属文件夹用于存放识别结果,软件会为每个识别任务自动创建子文件夹(PDF文件以原文件名命名),所有识别成果将统一归档至对应路径,便于后续查找整理。

  3. 选择待识别文件:提供四种选择方式,适配不同使用场景:

    • 【选择PDF文件】:支持单次选取1个或多个PDF文件;
    • 【选择PDF文件夹】:选取目标文件夹后,软件将自动过滤并加载文件夹内所有PDF文件;
    • 【选择图像文件】:支持单次选取1张或多张图像文件;
    • 【选择图像文件夹】:选取目标文件夹后,软件自动过滤加载文件夹内所有图像文件,支持格式包括jpg、png、jpeg、bmp、webp、tif、tiff。
  4. 设置全局识别参数:点击【识别设置】按钮,在弹出的窗口中配置全局识别参数,新建任务时将默认沿用此参数,无需重复设置(如图所示):
    image.png

  5. 添加单个PDF任务:选择目标PDF文件后,该文件将自动加入识别列表(如图所示):
    image.png

  6. 任务列表管理:在识别列表中可清晰查看各任务详情,各列功能说明如下:

    • 【识别文件】:显示待识别文件的具体存储路径;
    • 【识别范围】:默认覆盖PDF全部页数(格式为“1-总页数”),用户可手动修改为所需识别的页面区间;
    • 【识别设置】:支持为单个任务单独调整识别参数,适配不同文件的识别需求;
    • 【识别进度】:实时显示任务状态,包括待识别、识别中、识别暂停、识别完成、识别出错,若识别出错,将标注具体错误原因,便于排查问题;
    • 【操作】:提供四大功能按钮——【开始识别】启动单个任务、【暂停识别】临时中止任务、【识别结果】快速打开成果文件夹、【删除任务】移除当前任务(不删除已生成的识别结果)。
  7. 启动单个任务识别:点击目标任务右侧的【开始识别】按钮,软件将自动执行识别操作。若目标保存路径下已存在同名文件夹,且识别参数与当前任务一致,软件将自动读取历史识别进度,未完成部分可接续识别;若修改了识别参数,将按新参数重新启动识别流程(如图所示):
    image.png

  8. 查看识别结果:识别完成后,点击【识别结果】按钮即可打开成果文件夹。文件夹内将生成以下文件:单页识别结果、分页_换行.txt、分页_不换行.txt、000_汇总文档_不换行.docx、000_汇总文档_换行.docx、000_汇总文档_不换行_竖排.docx、000_汇总文档_换行_竖排.docx。其中“000_”前缀可使汇总文档在文件夹中置顶显示,方便快速查找。
    image.png

  9. 多任务批量识别:支持同时添加多个PDF文件,为每个任务独立设置识别范围与参数,实现批量高效处理(如图所示):
    img_6.png

  10. 多任务控制:启动多任务识别时,需点击软件下方的【开始识别】按钮,系统将按顺序执行所有任务;若需中途停止,点击【结束任务】按钮即可中止全部识别流程。

  11. 图像文件识别:单张/多张图像、图像文件夹的识别操作,与上述PDF文件识别流程一致,按对应选项选择文件即可启动识别。

四、获取支持与反馈

使用过程中若遇到问题,或有功能优化建议,欢迎通过以下渠道与我们联系,我们将及时响应并处理:

  • 微信公众号:关注“看典古籍”,获取最新动态及服务支持;
  • 反馈邮箱:发送邮件至 siyi@kandianguji.com,我们将在1-3个工作日内回复。

看典古籍OCR客户端v2.0.7的上线,是对“让古籍数字化更简单”核心理念的深化践行。我们期待与每一位古籍爱好者、研究者并肩同行,以科技为桥,传承古籍文脉,让千年典籍在数字时代焕发新生。

看典古籍研发团队

返回查看更多文档

Loading...
Bootstrap Check Bootstrap