通过机器学习自动化探索作者研究发现

Exchange insights, tools, and strategies for canada dataset.
Post Reply
jrineakter
Posts: 810
Joined: Thu Jan 02, 2025 7:15 am

通过机器学习自动化探索作者研究发现

Post by jrineakter »

Smart Harvesting 将人工智能和先进的自动化技术引入到创建综合研究资料库和更新研究人员资料的过程中,从而节省时间并减少人工工作。这项技术使机构能够在一个地方完整准确地展示所有学科的附属研究人员的工作。



将研究成果与合适的研究人员进行匹配,并确保涵盖所有内容,通常是一项复杂的工作。Smart Harvesting 通过独特的机器学习算法实现了这一目标,该算法可解决两项关键任务:将学者与他们的工作进行匹配;并将这些信息大规模填充到研究信息中心。





机器学习


为了实现有效的智能收集,机器学习识别并评估三个主要数据属性:个人姓名、输出的一般信息和语义内容。

“姓名”属性包括首字母缩写或昵称 福克兰群岛和马尔维纳斯电子邮件列表 的使用、姓名频率和姓名变体。“一般”属性包括研究人员所属机构、国家、学科、工作年限等。“语义”属性包括摘要、标题、期刊名称等中关键文本元素的频率、缺失或组合。

在评估语义特征时,Smart Harvesting 使用自然语言处理来检查大量文本。结果是一个多维、复杂的选定单词相对接近度图。





智能采收随着时间的推移变得更加智能


智能采集技术能够识别大量输出记录和研究人员资料,并开始识别信息模式。它能够了解研究人员姓名、所属机构、研究领域、专业活动年限、先前已知的资产和其他相关数据的所有可能变体。

从输出记录(例如学术索引、国家或学科知识库)中,Smart Harvesting 可识别标题、摘要、主题、合著者、期刊、全文、元数据和作者所属关系中出现的模式。自然语言处理技术称为“词嵌入”,可揭示所选单词在所有检查的记录中彼此之间的距离,以及组合方式。



通过机器学习,Smart Harvesting 可以快速评估与特定研究人员相关的新研究成果记录的名称、一般信息和语义特征。通过交叉检查所有数据点,Smart Harvesting 可以评估给定成果是特定研究人员成果的相对可能性。这个过程非常快速,并为学术机构提供了明确的指导,以正确匹配研究人员及其工作。



随着智能采集过程的反复运行,定期检查新的输出,它也会不断收集和分析其他数据。此类情报收集活动越多,该技术就越能准确、一致地识别每位研究人员的工作。



凭借智能自动化,Smart Harvesting 技术还可以消除人工干预以删除无效或不确定结果的需要。但是,机构始终可以设置自动或手动批准候选记录的条件,并根据匹配排名的强度或任何其他所需变量将其添加到研究信息中心。



智能收获的核心是机器学习,它可以越来越准确地发现研究成果与研究人员之间的关系。它还构建了一个不断增长的相关学术信息互联图,这使得将研究成果、活动和实体联系起来成为可能,从而更全面地了解研究项目及其结果。
Post Reply