收录:
摘要:
本发明公开了一种基于中文文本的水务领域知识图谱构建方法,包括在网上爬取大量水务文本,利用jieba分词进行中文文本分词,利用stopwords去词表去除分词后文本的停用词,利用TF‑IDF方法获取每个概念词的权重,设置一个阈值,保留大于阈值的概念词组成水务概念词库。然后根据与CN‑Dbprdia接口连接,获取水务概念词的上级概念,建立结构化水务知识图谱。接着水务结构化知识图谱挂接水务结构化数据库表以及水务文本,完成最终的水务知识图谱的构建。最后运用评估方法对挂接方法进行评估。本发明通过结合不同知识图谱构建方法,充分考虑了知识图谱之间的多种类型数据进行融合,能够提高水务知识图谱构建的效率,提高水务知识图谱的完整性以及准确性。
关键词:
通讯作者信息:
电子邮件地址: