人工智能席卷全球,企业正在竞相寻找有意义的方法来利用其力量。随着几乎每天都有新的工具和能力出现,跟上创新的步伐既是挑战也是必要的。

今年早些时候,IBM在布拉克内尔举行了Agentic AI圆桌会议,介绍了概念、演示和用例,这些概念和用例反映了Agentic AI准备如何重塑我们构建智能应用程序的方式。

该会议汇集了来自贝尔集成和Naviam的参与者,就Agentic AI——一种构建智能系统的下一代方法,Agentic AI进行了深入的研讨会。

传统 LLM 工作流程与代理人工智能

当今常见的基于 LLM 的应用程序采用线性流程设计:用户输入查询,系统在返回输出之前会经过固定的步骤顺序。这些工作流程是可预测和可管理的,但是如果出现问题或需要更多信息,通常需要人工监督。

相比之下,代理人工智能系统是动态和自适应的。他们不是遵循硬编码的路径,而是评估当前环境,确定需要哪些附加信息(如果有),选择要调用的工具,并在需要时修改计划。他们不只是听从指示;他们推理下一步该怎么做。

从 RAG 到 Agentic RAG

这种演变的一个很好的例子是检索增强生成(RAG)系统。RAG 系统的工作原理是将检索组件与语言模型相结合,允许该模型实时访问外部知识来源,而不是仅依赖其内部训练数据。传统的 RAG 包括查询向量存储、检索前 k 个结果,并将该信息传递给 LLM 以生成答案。

在 Agentic RAG 系统中,该过程的启动方式类似,但随后略有变化。代理评估检索到的文件是否足够。否则,它可能会启动网络搜索或查询其他数据库。它甚至可能打电话给另一个代理人来协助。关键区别:代理自主做出决策,实时优化工作流程。


图 1

Lendyrx:IBM 的 Agentic AI 在行动

Lendyrx 是 IBM 使用代理方法构建的金融应用程序。该系统允许用户与他们的银行数据进行对话交互。在幕后,多个代理共同完成请求:

  • 策划代理 决定整体任务结构
  • 数据代理 检索相关的银行数据。
  • 可视化代理 适当地呈现数据

该系统由 LangGraph 构建,LangGraph 是一个代理框架,其中每个步骤(规划器-> 执行器-> 工具)都会保留和使用历史背景。每个代理都有一个基于提示的小描述符,可帮助计划器代理根据用户输入决定使用哪一个。

为什么要使用多个代理?

为什么不只使用单个 LLM?因为将任务分解到多个代理之间可以实现更好的专业化、错误检测和自主性。例如,在 IBM 演示中,有一个代码生成器代理和一个单独的代码执行器代理来确保代码正常运行。如果没有这种设置,人类将必须验证所有结果。

也就是说,它有局限性。如果使用过多的代理,性能可能会降低,不仅会降低系统速度,还会降低可靠性和输出质量。每个代理通常在各自的规划、执行和反思循环中运行,当多个代理协调在一起时,如果管理不当,它们可能会造成协调开销、资源争用,甚至决策发生冲突。这可能会减慢工作流程,引入多余的步骤,或导致代理在访问共享工具或数据时 “相互踩踏”。仔细设计工作流程非常重要,以确保每个代理都有明确的角色和范围。平衡复杂性和功能性是构建既强大又高性能的代理系统的关键。

面向企业的代理人工智能:自动化潜力

Agentic AI 最引人注目的承诺之一是自动化。IBM 估计,人工智能可以自动执行多达 70% 的业务任务。研讨会重点介绍了两个强大的用例:

  1. 长篇政策回应 -公共部门客户需要回复要求澄清政策的复杂信件。这些回应可能需要长达两个小时,需要政策专家的意见。在 watsonx.ai 上使用代理工作流程,IBM 实现了流程自动化。现在,该系统以官方政策文件为基础,在几分钟内就能生成响应。人类可以根据需要进行监控和调整。
  1. 保险索赔分类 -一家保险公司部署了模仿 “思维行动循环” 的代理系统:
    • 考虑需要采取的步骤
    • 检索相关的索赔数据
    • 采取行动
    • 重新评估结果

结果是更快、更一致地处理索赔,同时减少了人力开销。

挑战:准确性、验证和扩展

代理系统提供了灵活性,但随之而来的是复杂性。确保输出的准确性仍然至关重要。研讨会发言人建议为LLM可以做什么和不能做什么设定界限。使用经过验证的模型和微调提示对于保持一致性至关重要。

验证仍然是最艰巨的挑战之一。Bell Integration的一个案例生动地说明了这一点:线性RAG设置在演示中表现良好,但由于缺乏可靠的真实准确性检查,在生产中失败了。xA提出的IBM修复方案:引入验证节点——这是工作流程中的又一步骤,在接受之前将代理生成的答案与可信的真实情况进行比较。这是减少对LLM输出的错误信心的一种简单但有效的方法。

关于使用强化学习(RL)来帮助代理提高弹性和自我纠正能力的研究也很有前景。在这种情况下,RL允许代理获得有关其行为的反馈——奖励良好的结果和惩罚不良结果——这样他们就可以随着时间的推移完善策略。它为代理人打开了大门,他们可以从经验中学习,而不是仅仅依赖静态指令,从而使他们在动态业务环境中更具适应性。

接下来会发生什么

Agentic AI 代表了我们对人工智能应用看法的转变:从基于规则的静态管道到能够规划、行动和学习的智能、自适应系统。该研讨会让人大开眼界——不仅是为了展示技术能力,也是为了强调采用这些系统所带来的战略、设计和道德方面的考虑。

传达的信息很明确:代理人工智能的成功不仅仅是构建更复杂的工具,还在于设计出强大、值得信赖且符合现实需求的系统。随着组织从实验转向实施,挑战将在于深思熟虑地扩大规模,平衡自主权与监督,在创新与稳定之间取得平衡。

代理系统仍在不断发展,我们构建、验证和管理它们所需的框架也在不断发展。前进的道路将不仅涉及技术开发,还包括持续的研究、合作和迭代。

Unlock the Ultimate Guide to IBM Maximo Application Suite (MAS)

Discover everything you need to know to modernize your asset management strategy.

Inside, you’ll learn:

  • What’s new in IBM Maximo Application Suite 9.0
  • Key differences between Maximo 7.6 and MAS
  • How AppPoints and OpenShift change the game
  • Industry use cases across energy, manufacturing, and transportation
  • Step-by-step guidance for upgrading and migration readiness
Cover of 'The Ultimate Guide to MAS Maximo Application Suite' by Naviam featuring a man in a yellow construction helmet and safety vest holding a tablet.
×

ActiveG, BPD Zenith, EAM Swiss, InterPro Solutions, Lexco, Peacock Engineering, Projetech, Sharptree, and ZNAPZ have united under one brand: Naviam.

You’ll be redirected to the most relevant page at Naviam.io in a few seconds — or you can go now.

Read Press Release