收录:
摘要:
本发明提供了一种共享图书系统中离线获取图书在版编目数据(CIP)的方法。首先对图书扉页图片进行预处理,从而将图片中的组成文字的像素点与组成背景的像素点相分离并去除干扰识别的噪点进而提高数据采集准确率。然后对经过处理的图书扉页图片进行光学字符识别,获取图片中的文字信息。最后根据图书在版编目数据的格式特征从文字信息中解析出图书的书名、作者、出版社、出版年份以及ISBN编号。使得在共享图书系统处于未连接互联网的离线状态下通过实体图书扉页照片或电子书扉页图片直接获取图书在版编目数据。
关键词:
通讯作者信息:
电子邮件地址: