关键词:人工智能,概念网络,复杂网络,跨学科研究论文题目:Forecasting the future of artificial intelligence with machine learning-based link prediction in an exponentially growing knowledge network
期刊名称:Nature Machine Intelligence斑图地址:https://pattern.swarma.org/paper/a3f9750e-6c78-11ee-b005-0242ac17000d
论文地址:https://www.nature.com/articles/s42256-023-00735-0一种工具可以通过从科学文献中获取见解,来建议新的个性化研究方向和想法,这可能会深刻加速科学进步。
一个可能从这种方法中受益的领域是人工智能(AI)研究,近年来科学出版物的数量呈指数增长,使得人类研究人员难以跟上进展这项发表于 Nature Machine Intelligence 的最新研究使用 AI 技术来预测 AI 本身的未来研究方向。
图 1. Arxiv 上归类为机器学习或 AI 的论文数量研究者引入一个基于真实数据的基于图的基准测试—— Science4Cast 基准测试,旨在预测不断发展的人工智能概念网络的未来状态为此,研究中使用了超过 143 000 篇论文,建立了一个包含超过 64 000 个概念节点的知识网络(构造过程见图 2)。
然后提出了十种不同的方法来解决这个任务,从纯统计到纯学习方法令人惊讶的是,最强大的方法使用了精心策划的网络特征集,而不是端到端的 AI 方法这些结果表明,可以释放纯机器学习方法的巨大潜力而无需人类知识最终,更好地预测新的未来研究方向将成为更先进的研究建议工具的重要组成部分。
图 2. 从 Arxiv 论文构建概念网络的过程,利用 1992 年到 2020 年在 arXiv 上发表的 143000 篇人工智能和机器学习论文的摘要,基于自然语言处理产生的 64000 个概念作为节点,如两概念在同一网络中同时出现则构建连边,从而产生一个不断发展的、随着更多的概念被联合研究而扩展的网络。
图 3. 生成的网络连边具有长尾效应图 4. 概念网络随时间变得稠密图 5. 随着时间变化,概念网络变得更加中心化基于该网络的任务是预测哪些未连接的节点(尚未一起研究的概念)将在几年内连接起来研究者使用了多种方法的组合来尝试完成该任务,包括是否基于手动微调的特征(NF)与使用机器学习或神经网络,结果显示基于手动设计的特征作为机器学习算法输入的情况下,预测准确性最高。
图 6. 使用不同方法组合进行未来 1、3、5 年预测的 AUC 对比该研究是朝向开发可以帮助科学家发现新的探索方向的个性化推荐工具的重要步骤作者们指出,基于人工智能和语义网络,可开发出实用的跨学科研究方向推荐工具,改变科学家处理研究问题和在各自领域开展合作的方式。
考虑到研究说明利用概念网络的特征,将提取的概念作为节点和边作为机器学习算法的输入预测准确性最高,下一步的研究方向将是能否利用端到端的深度学习,在不使用特征工程的情况下更准确的进行预测采用超图等高阶数据结构来构建概念网络,以同时使用论文引用信息和语义信息,则是另一个值得关注的方向。
此外科学研究中,来自于意想不到的遥远领域的概念组合往往有可能诞生更具影响力的成果,如何鼓励意外的关联(例如概率网络上余弦相似度较低的节点),可增加研究方向推荐算法的价值编译|郭瑞东计算社会科学读书会第二季
详情请见:数据与计算前沿方法整合:计算社会科学读书会第二季启动