生成式大型语言模型(LLMs)通过实现快速、类似人类的文本生成而改变了人工智能,但它们面临着挑战,包括管理不准确信息生成。诸如提示工程、检索增强生成(RAG)以及结合特定领域的知识图谱(KGs)等策略旨在解决其问题。然而,在实现实验的管理、可重复性和验证的期望水平方面仍存在挑战,尤其是对于使用通过 Web API 的封闭访问LLMs的开发者来说,这使外部工具的集成变得复杂。为了应对这一挑战,我们正在探索一种软件架构,通过优先考虑灵活性和可追溯性来增强LLM工作流程,同时促进更准确和可解释的输出。我们描述了我们的方法,并提供了一个营养案例研究,展示了其将LLMs与 RAG 和 KGs 集成以实现更稳健人工智能解决方案的能力。
生成式大型语言模型(LLMs)近年来变得无处不在[1],几乎任何网络用户都可以自由访问。它们在以前所未有的规模和速度生成类似人类的文本方面具有革命性。将LLMs应用于看似所有知识领域和计算领域,让众人了解了当今新兴人工智能的能力和局限性。通过可访问的 Web API、沙盒或开源工具包等方式,轻松且经济高效地访问LLMs,使得一代开发者和研究人员能够将现代LLM-基于的人工智能集成到日常应用中。
几个检索增强生成(RAG)框架旨在减轻LLM的幻觉以及存在过时知识或缺失信息的情况。[8]、[9]。知识图谱(KGs)被提出作为结构化的外部信息源来丰富LLMs。在这方面,Pons 等人[13]使用 KGs 来增强LLMs以实现零样本实体消歧(ED),利用 KG 中实体类别的层次表示来逐步修剪候选空间以及实体的描述,以丰富输入提示并添加额外的知识。Clay 和 Jiménez-Ruiz[14]断言,KGs 通常用作外部知识,可能为这些挑战提供解决方案。这项工作提出了三个建议,利用知识图谱来增强LLM生成。首先,动态知识图谱嵌入和推荐可以允许整合新信息并选择与响应生成相关的知识。其次,将具有情感值的实体作为附加特征存储可能提供与用户输入更情感上对齐的知识。 第三,通过叙事气泡整合角色信息将保持角色一致性,并引入易于融入新信息的结构。
关于使用知识图谱(KG)来验证LLM的响应,GraphEval [15]是一个基于知识图谱(KG)结构表示信息的幻觉评估框架。GraphEval 的方法识别出 KG 中易发生幻觉的具体三元组,从而为LLM的响应中幻觉发生的位置提供更多见解。Kau 等人[11]认为,通过结合知识图谱(KG),可以有效地缓解幻觉、错误信息或信息缺失问题,因为知识图谱以结构化格式组织信息,并以灵活和可解释的方式捕捉实体之间的关系。为了支持这一论点,介绍了几个通过联合使用 KG 和LLMs实现性能提升的研究,特别是在知识驱动领域。结合 KG 和LLMs的模型通常显示出更好的知识语义理解,从而使其能够更好地执行实体类型等任务。
知识图谱在应用领域的观察局限性:在指定应用领域内使用知识图谱(KG)揭示了局限性。一个重大问题是数据的完整性不足。例如,虽然 KG 包含某些食品项目,但许多项目完全缺失或缺乏关键属性,如血糖指数(GI)值。这种数据覆盖范围的差距限制了 KG 在全面分析中的应用。另一个局限性是针对特定领域的查询制定。虽然在这方面当前用例没有直接挑战,但在更通用或结构较松散的场景中,设计查询以从 KG 中提取相关数据可能会遇到重大困难。这些局限性强调了在数据全面性和用户友好的、基于本体的 KG 查询生成机制方面取得进步的必要性。
研究知识图谱中的研究问题和挑战:从观察到的局限性中产生了几个研究问题。首先,“如何丰富 KG 以包括跨多个领域的全面和权威数据?”因为许多 KG 缺乏关键属性或是不完整,这限制了它们在详细和可靠分析中的应用。其次,采用标准化和权威的本体对于增强跨不同系统的互操作性至关重要。遵循标准化框架的本体可以弥合数据兼容性方面的差距,并促进各种数据集和领域之间的无缝集成。另一个关键挑战是解决 KG 中有限的来源,这使数据来源的验证变得复杂。来源对于确保 KG 中信息的可靠性至关重要,尤其是在准确性和可追溯性至关重要的领域。未来的研究必须专注于开发将详细来源元数据嵌入 KG 的方法,并展示来源元数据在提高可靠性和实用性方面的应用。 最后,第四个问题是如何改进知识图谱的查询机制,以简化用户对特定领域数据的检索。
主张与支持证据:案例研究支持一个关键主张:扩展架构对基于知识图谱的LLMs实验的实用性。这一主张通过在医疗保健项目中的实际场景中使用 ChatBS-NexGen 原型来评估LLM饮食建议在应对患者健康状况方面的充分性而得到证实。在医疗专家进行的LLMs即席实验中,观察到饮食建议包括不适合糖尿病患者的食物。原型展示了将 KG 集成到结构化框架中以管理LLM实验工作流程的潜在益处。通过向两个LLMs提交了 10 次重提的 100 个提示,可以识别出不适当的建议和响应中的高变异性。所提出的架构旨在从当前的手动实验状态过渡到更健壮的LLM实验测试平台。通过利用基于 KG 的方法,该架构承诺在处理LLM响应方面实现增强的自动化和一致性。
5. 结论与未来方向
我们相信在不断发展的 AI 领域中,知识图谱有着广泛的应用机会,探索架构和框架对于新兴领域至关重要。我们的 ChatBS-NexGen 架构通过提供模块化和参数化、多模型支持、与结构化知识的集成以及一个用于自动评估LLMs之间和内部的专用模块,在交互、管理和评估LLM响应方面提出了改进。所提出的架构通过广泛的日志记录确保实验可追溯性和可重复性控制。
J. Wei, X. Wang, D. Schuurmans, M. Bosma, B. Ichter, F. Xia, E.H. Chi, Q.V. Le, D. Zhou
Chain-of-thought prompting elicits reasoning in large language models
Proceedings of the 36th International Conference on Neural Information Processing Systems, NIPS ’22, Curran Associates Inc., Red Hook, NY, USA (2024), pp. 24824-24837
S. Dhuliawala, M. Komeili, J. Xu, R. Raileanu, X. Li, A. Celikyilmaz, J. Weston
Chain-of-verification reduces hallucination in large language models
Findings of the Association for Computational Linguistics: ACL 2024, Association for Computational Linguistics, Bangkok, Thailand (2024), pp. 3563-3578
S. Yao, D. Yu, J. Zhao, I. Shafran, T.L. Griffiths, Y. Cao, K. Narasimhan
Tree of thoughts: deliberate problem solving with large language models
Proceedings of the 37th International Conference on Neural Information Processing Systems, NIPS ’23, Curran Associates Inc., Red Hook, NY, USA (2024), pp. 11809-11822
W. Fan, Y. Ding, L. Ning, S. Wang, H. Li, D. Yin, T.-S. Chua, Q. Li
A survey on RAG meeting LLMs: Towards retrieval-augmented large language models
Proceedings of the 30th ACM SIGKDD Conference on Knowledge Discovery and Data Mining, KDD ’24, Association for Computing Machinery, New York, NY, USA (2024), pp. 6491-6501
J.S. Erickson, H. Santos, J.P. McCusker, S. Shirai, D.L. McGuinness, J.A. Hendler
ChatBS: An exploratory sandbox for bridging large language models with the open web
Proceedings of the ISWC 2024 Posters, Demos and Industry Tracks: from Novel Ideas To Industrial Practice, CEUR Workshop Proceedings, vol. 3828, CEUR, Maryland, USA (2024)
Knowledge graphs for enhancing large language models in entity disambiguation
Demartini G., Hose K., Acosta M., Palmonari M., Cheng G., Skaf-Molli H., Ferranti N., Hernández D., Hogan A. (Eds.), The Semantic Web – ISWC 2024, Springer Nature Switzerland, Cham (2025), pp. 162-179
S. Haussmann, O. Seneviratne, Y. Chen, Y. Ne’eman, J. Codella, C.-H. Chen, D.L. McGuinness, M.J. Zaki
FoodKG: A semantics-driven knowledge graph for food recommendation
The Semantic Web – ISWC 2019: 18th International Semantic Web Conference, Auckland, New Zealand, October 26–30, 2019, Proceedings, Part II, Springer-Verlag, Berlin, Heidelberg (2019), pp. 146-162