学术论文是科学知识扩散、传承和发展的主要载体,凝聚了科研人员对于工具、方法、数据等知识性微观实体进行思维创造、编码、加工的大量智慧。随着学术资源共享程度的提高,越来越多的学术论文全文被大规模地开放获取,为基于全文本的知识扩散研究提供了便利的数据基础和广阔的应用前景。然而,现有研究在粒度上多以篇章、作者和主题等作为知识扩散的主要载体,较少关注来自文献全文本内容的软件工具类、模型方法类和数据语料类等微观实体。事实上,作为驱动知识扩散的主要内因,微观实体才是通过引用关系传播的实质内容。为此,本课题以学术文献全文本数据为依托,探究知识扩散的内因以及学科在微观层面的依赖关系,并以实例开展微观实体扩散机制研究。具体内容包括:基于全文本的引文重要性分类、基于全文本的微观实体及语义关系抽取、基于全文本的微观实体扩散模式研究、基于全文本的微观实体扩散动力学研究等。研究目的以期厘清科学发展的脉络,明晰知识在学科间流动演化的规律与模式,预测微观实体未来发展的热度以及扩展或者收缩趋势,为学科知识的融合、转化与创新提供可靠的理论与实证依据。