河北大学学报(自然科学版) ›› 2021, Vol. 41 ›› Issue (5): 587-598.DOI: 10.3969/j.issn.1000-1565.2021.05.016

• • 上一篇    下一篇

科技文档间非对称关系的双模态度量方法

徐建民,王鑫   

  • 收稿日期:2021-03-05 出版日期:2021-09-25 发布日期:2021-09-28
  • 通讯作者: 王鑫(1996—)
  • 作者简介:徐建民(1966—),男,河北邯郸人,河北大学教授,博士生导师,主要从事信息检索、在线社交网络方向研究.
    E-mail: hbuxjm@hbu.edu.cn
  • 基金资助:
    国家社会科学基金后期资助项目(17FTQ002);河北省自然科学基金资助项目(F2015201142)

A double mode measurement method of asymmetric relationship between scientific documents

XU Jianmin, WANG Xin   

  1. College of Cyberspace Security and Computer, Hebei University, Baoding 071002, China
  • Received:2021-03-05 Online:2021-09-25 Published:2021-09-28

摘要: 针对科技文档间相似程度和影响力不同的问题,通过分析科技文档间非对称关系,提出一种新的度量方法.该方法将科技文档间非对称关系定义为文档覆盖度,并用公式覆盖度和文本覆盖度对其进行度量.公式覆盖度由改进的非对称因子计算,文本覆盖度通过利用文本的相对突出性调整特征向量的余弦夹角计算,公式覆盖度和文本覆盖度线性融合得到科技文档覆盖度.实验结果表明:与已有的2种科技文档关系度量方法相比,本文提出的非对称关系度量方法在聚类中的平均准确率分别提高了8%和4%.

关键词: 科技文档, 非对称性, 覆盖度, 关系度量

Abstract: Aiming at the problem of different degree of similarity and influence between scientific documents, a new measurement method is proposed by analyzing the asymmetric relationship between scientific documents.This method defines the asymmetric relationship between scientific documents as document coverage, and uses formula coverage and text coverage to measure it.The formula coverage is- DOI:10.3969/j.issn.1000-1565.2021.05.016科技文档间非对称关系的双模态度量方法徐建民,王鑫(河北大学 网络空间安全与计算机学院,河北 保定 071002)徐建民 管理学博士,现任河北大学教授,河北大学计算机科学与技术专业硕士生导师,管理科学与工程专业、图书情报与档案专业博士生导师,入选河北省省管优秀专家,教育部科技委管理学部委员. 曾出版高等学校教材10部,学术专著1部,发表科研论文100余篇,获河北省教学成果一、二、三等奖各1项,国家教学成果奖1项,获河北省科技进步二、三等奖各1项,河北省社会科学优秀成果一等奖1项. 主要研究方向为信息检索、个性化推荐、在线社交网络分析、网络舆情监测与分析.摘 要:针对科技文档间相似程度和影响力不同的问题,通过分析科技文档间非对称关系,提出一种新的度量方法.该方法将科技文档间非对称关系定义为文档覆盖度,并用公式覆盖度和文本覆盖度对其进行度量.公式覆盖度由改进的非对称因子计算,文本覆盖度通过利用文本的相对突出性调整特征向量的余弦夹角计算,公式覆盖度和文本覆盖度线性融合得到科技文档覆盖度.实验结果表明:与已有的2种科技文档关系度量方法相比,本文提出的非对称关系度量方法在聚类中的平均准确率分别提高了8%和4%.关键词:科技文档;非对称性;覆盖度;关系度量中图分类号:TP391 文献标志码:A 文章编号:1000-1565(2021)05-0587-12A double mode measurement method of asymmetric relationship between scientific documentsXU Jianmin, WANG Xin(College of Cyberspace Security and Computer, Hebei University, Baoding 071002, China)Abstract: Aiming at the problem of different degree of similarity and influence between scientific documents, a new measurement method is proposed by analyzing the asymmetric relationship between scientific documents.This method defines the asymmetric relationship between scientific documents as document coverage, and uses formula coverage and text coverage to measure it.The formula coverage is- 收稿日期:2021-03-05 基金项目:国家社会科学基金后期资助项目(17FTQ002);河北省自然科学基金资助项目(F2015201142) 第一作者:徐建民(1966—),男,河北邯郸人,河北大学教授,博士生导师,主要从事信息检索、在线社交网络方向研究.E-mail: hbuxjm@hbu.edu.cn 通信作者:王鑫(1996—),男,河北保定人,河北大学在读硕士研究生,主要从事信息检索方向研究.E-mail:838148632@qq.com第5期徐建民等:科技文档间非对称关系的双模态度量方法calculated by an improved asymmetric factor, and the text coverage is calculated by using the relative prominence of the text to adjust the cosine angle of the feature vector, The formula coverage and text coverage are linearly fused to obtain the coverage of scientific documents.The experimental results show that compared with the existing two measurement methods for relationship between scientific documents, the average accuracy of the asymmetric relationship measurement method proposed in this paper is improved by about 8 percentage points and 4 percentage points.

Key words: scientific documents, asymmetry, coverage, relational metric

中图分类号: