摘要:
本文首次探索基于Dryad 平台,利用DryadLINQ 语言进行海量语义信息推理和查询的并行处理。针对现有基于Map/Reduce 型数据处理平台的语义信息处理研究存在未面向语义推理和查询操作并存的场景,在权衡存储代价和执行代价的基础上进行并行处理流程设计的不足,本文采用基于<主语,宾语>二元组的谓词文件作为语义信息存储结构;基于该存储结构首次给出了RDFS 领域规则并行推理设计,并对现有基于有向无环图的并行语义查询任务划分方法进行优化。实验结果表明,在频繁查询、周期推理的典型语义系统使用场景下,本文所提出的语义信息存储和并行处理方案较现有采用基于<主语,谓词,宾语>三元组存储结构的语义推理和查询方案,具有较小地存储开销,并获得较好的执行效率,其作业吞吐率最大提高了76.2%。
关键词:
通讯作者信息:
电子邮件地址: