基于Strands Agents SDK构建AI Agent运行时平台实战指南

核心摘要

  • AI Agent由ModelToolsOrchestration Layer三大核心组件构成,通过循环执行Reasoning-Action-Execution流程完成复杂任务
  • Strands Agents SDK作为开源AI Agent开发框架,支持多种Model Provider、MCP协议工具集成以及Swarm/Graph/Workflow等Multi-Agent模式
  • 基于Strands Agents SDK构建的AgentX平台实现配置化Agent构建、即时运行、定时调度,降低非技术人员使用门槛
  • 实际应用场景涵盖智能数据分析、云端资源巡检、Browser Use自动化、Code Interpreter沙箱执行等企业级需求

基于Strands Agents SDK构建AI Agent运行时平台实战指南

AI Agent技术趋势与企业落地挑战

AI Agent正在成为当前技术领域发展最迅猛的方向之一。与专注特定领域任务的传统AI应用不同,AI Agent能够在更少人工干预的情况下管理和执行端到端的业务流程,从单纯的工具进化为真正的团队成员,推动企业在生产力、效率和增长方面进入全新时代。

相关研究报告显示,AI Agent的竞争势头已经明显增强,93%的企业管理者认为在接下来一年内规模化扩展AI Agent的使用将帮助企业在同类竞争者中保持领先地位。然而现实情况是,大部分企业仍不清楚以何种方式快速构建、运行和管理AI Agents,难以将AI Agents快速在企业内部落地应用。

针对这一痛点,本篇内容从AI Agent的结构和组成入手,结合AWS Strands Agents SDK,构建一个集Agent构建和运行于一体的参考实现平台。该平台还集成了AgentCore Browser Use ToolAgentCore Code Interpreter Tool,方便用户使用相应工具来构建功能完备的Agents。

AI Agent组成架构深度解析

根据Google的Agents白皮书,针对AI Agent的核心功能,可以将其组成构件和架构拆解为三个必不可少的组件:

The Model(模型层)

在AI Agent范畴,Model特指大语言模型(LLM),作为Agent的中心化决策者,负责进行任务分解、执行和检测任务是否完成。Agent中使用的模型通常基于推理和逻辑框架(如ReActChain-of-ThoughtTree-of-Thoughts),需要具备很强的指令遵循能力。模型的推理质量直接决定了Agent的决策准确性和任务完成效率。

Tools(工具集)

尽管模型在文本、图片等方面具有很强的生成能力,但由于模型本身不能与外部世界交互,其能力受到极大约束。Tools可以抹平这种裂痕,使得Agents可以与外部数据和服务进行交互,更大范围拓展Agent除模型本身之外的能力。工具集的丰富程度和调用效率是衡量Agent实用性的关键指标。

The Orchestration Layer(编排层)

Orchestration Layer描述Agent如何接收外部信息、执行内部推理(Reasoning)、使用推理结果来确定下一步动作和决策的循环过程。这个过程会持续循环,直到Agent完成任务目标或者达到停止点。编排层的设计质量决定了Agent处理复杂任务的能力上限。

Agent工作流程详解

AI Agent的完整工作流程包含以下关键环节:

  • AI Agents与外部环境交互,从用户接收输入、触发或者目标
  • 通过模型的推理,将目标分解成特定的动作和步骤,并确定任务的执行顺序
  • 任务执行过程中,AI Agents可以访问内部的数据和工具(如知识库、企业系统)以及通过MCP协议访问外部工具(如第三方数据库、Web搜索等)
  • AI Agent Orchestration组件循环执行Reasoning → Action Plan → Execution这个Loop,循环过程中可能会有安全护栏(Guardrails)来确保道德、运营和安全标准
  • 由于Agent执行过程可能会执行多轮循环,受限于模型的上下文窗口长度以及对模型精度的要求,AI Agent使用Memory来维护执行过程的上下文,从前面的迭代或者过去的执行中学习,提升Agent的性能表现
  • 在Multi-Agent场景,Agent-to-Agent(A2A)协议被用来实现Agent之间的协作

Strands Agents SDK核心特性全览

Strands Agents SDK是一个开源的AI Agent开发框架,使用该SDK可以利用几行代码快速开发生产可用的multi-agents AI系统。其特性覆盖了Agent开发的各个层面:

Agent Loop机制

Strands Agents实现了处理用户输入、决策、执行工具、响应生成的循环过程。这个过程支持复杂的、多步骤的推理和动作执行,并且可以无缝集成Model和Tools。

多元化Model Provider支持

在Model方面,SDK提供多种Model Provider实现,包括:

  • Amazon Bedrock
  • Anthropic
  • OpenAI
  • Ollama
  • LiteLLM

开发者可以灵活选择各种商业或开源模型来驱动AI Agent,这种灵活性对于需要多云账单代付解决方案的企业尤为重要,可以根据成本和性能需求选择最优的模型组合。

丰富的Tools生态

在Tools方面,Strands Agents支持多种工具定义和集成方式:

  • Python Tools:支持以@tool函数装饰器方式和基于Python模块方式来定义Agent可用的Tools
  • Model Context Protocol(MCP)Tools:集成MCP Server的Tools作为Agent可用的Tools,支持STDIOStreamable HTTP两种Transport类型的MCP Server
  • Agent Tools:在multi-agent场景,支持将其他Agent作为当前Agent的一个Tool来完成特定领域的任务

Strands Agents自带了丰富的、开箱即用的基础工具:

  • 文件读写工具
  • Memory工具(mem0_memoryagent_core_memory
  • Browser Use工具(local_chromium_browseragent_core_browser远程版本)
  • Code Interpretation工具(python_replagent_core_interpreter
  • 多模态工具(image_readergenerate_imagenova_reelsdiagram等)

Multi-Agent协作模式

Strands Agents在Multi-Agent方面支持以下模式:

  • Agent-to-Agent(A2A)Protocol:支持不同平台和实现的AI Agents间无缝沟通
  • Agents as Tools:通过编排(orchestration)Agent来接收用户输入并决定使用哪个特定的Agent来完成相应任务
  • Swarm:多个Agent以团队方式共同完成复杂任务,允许Agent间自主协作、共享上下文以及记忆
  • Graph:以有向无环图(DAG)方式编排各个Agent,Agent作为节点,以DAG结构图作为执行顺序,一个节点的输出将传播到与其连接的节点并作为其输入
  • Workflow:适合复杂的多步骤流程,任务间有依赖关系,必须等上一步执行完成后才能执行下一步,每一步都由一个专家Agent来完成对应任务

除上述核心特性外,Strands Agents SDK在Agent的安全性、应用的可观测性以及Agent部署方面提供了原生支持。

AgentX:一站式Agent构建和运行时平台

Strands Agents SDK显著提升了AI Agent的开发效率,但仍存在两个关键挑战:开发完成后的Agent部署与运行管理问题;以及尽管SDK已经极大简化了开发流程,但依然需要编写代码,对非技术背景的业务人员形成了使用障碍。

进一步思考以下问题:

  • 是否可以不用写代码就可以构建自己的Agent,让业务人员都可以快速构建想要的Agent?
  • Agent构建好后,是否可以不用考虑Agent的部署,立即可运行,对外提供可访问的端点?
  • 很多业务场景需要Agent周期性运行,是否能让配置或构建好的Agent按时调度运行?

Agent工程化解构

从工程实现的视角对AI Agent进行解构,可以识别出其由以下四个核心组件构成:

  • Model(LLM):Agent的大脑
  • Tools:Agent的触手
  • System Prompt:Agent的行为规范
  • Environments:Agent需要感知的环境信息,如系统环境变量、当前对话的文档等

AgentX平台架构设计

基于上述思考,AgentX作为基于Strands Agents SDK开发的AI Agent构建和运行平台(参考实现),可以实现:

  • 配置化构建:通过配置的方式来构建AI Agent,支持Strands Agents自带的Tools、MCP Server Tools以及Agent as Tool,并且支持各种模型接入
  • 即时运行:配置好的Agent可以通过API Endpoint来进行调用,无需构建专门的Agent运行时,真正做到Agent配置即可运行
  • 定时调度:支持Agent定时调度执行配置
  • 历史管理:支持Agent运行历史记录管理

技术架构组件

AgentX的技术架构包含以下关键组件:

  • 使用Amazon ECS部署整个应用,使用ECS Fargate作为Capacity Provider
  • 整体应用分为前端、后端以及各种MCP Server
  • 使用Amazon DynamoDB存储Agent的配置以及Agent的运行历史记录
  • 使用Amazon LambdaEventBridge实现Agent的定时调度执行
  • 整个项目可以通过CDK一键部署,部署前需要将前、后端应用以及需要部署的MCP Server构建成Docker镜像并推送到AWS ECR中

AgentX平台操作指南

配置Agent

部署完成后,在Agent管理页面可以配置Agent。配置Agent的过程实际就是对Agent使用的模型、System Prompt、需要使用的Tools以及环境变量参数进行设置。这种配置化的方式大大降低了Agent构建的技术门槛。

运行和调用Agent

Agent配置完成后,可以通过在UI界面上选择配置好的Agent来完成相应的任务。也可以在应用层面,通过API Endpoint来调用Agent。配置好Agent之后,Agent立即可运行,不需要额外的部署步骤。

MCP Server管理

可以对企业内部或一些公开的MCP Server进行维护和管理,通过配置的方式将这些MCP Server的Tools作为Agent的Tools。目前该项目只支持Streamable HTTP Transport类型的MCP Server。

Agent调度配置

通过配置Cron表达式的方式,来定时调度Agent执行任务。对于需要周期性让Agent来完成某项任务的场景提供了开箱即用的支持。

实际应用场景深度剖析

智能数据分析

结合数仓Redshift MCP Server(或其他数据库MCP Server),可以配置Agent来实现基于Agent的数据分析,如对数据进行预测性分析或诊断性分析。

对于简单的查数以及指标计算场景,Agent结合数据库MCP Server就能很好地支持。如果数据表比较多、表间关系比较复杂,在结合MCP Server的同时,可以将Schema信息放到RAG中,将RAG也作为Agent的工具,来实现Chat BIText2SQL的场景。

通过配置Redshift MCP Server作为Agent的工具,可以实现游戏埋点事件数据的预测性分析。Agent会充分利用MCP工具以及模型本身的知识,构建数据预测模型,对基础数据进行预测性分析,并将分析结果以HTML页面的方式进行可视化展示。

基于Agent的云端资源巡检

在一些关键业务场景中,企业IT运维人员需要定时对资源的各项运行指标进行检查,来确保基础架构以及上层应用的稳定运行。由于需要检查的方面比较多(如数据库运行指标检查、EC2运行指标检查、EKS集群运行检查),可以每个方面的检查配置一个专门的Agent来执行,最后通过一个编排(Orchestrator)Agent来统筹执行整个巡检任务,将不同方面的巡检指派给不同的Agent,这也是典型的Multi-Agent场景。

编排Agent结合MySQL巡检Agent和EC2巡检Agent的Multi-Agent配置保存后,此编排Agent就可以对AWS EC2和RDS资源进行运行指标巡检。编排Agent对巡检任务进行分解,将EC2的巡检任务指派给EC2巡检Agent,将RDS资源巡检的任务交给RDS巡检Agent。

实际巡检结果示例:

  • EC2巡检结果:EC2巡检Agent识别到有EC2 CPU峰值利用率超过93.89%,超过设定的阈值(75%)18.89%
  • RDS巡检结果:RDS巡检Agent查找到有RDS实例可用内存(55.28MB)小于阈值(500MB)

最后编排Agent对上述检查结果进行统一整理和分析,并给出行动建议。对于查找的问题,可以添加其他Tools(如Slack Tool),将巡检报告以及查找的问题发送到对应的Channel,实现告警通知。

远程Browser Use和Code Interpreter沙箱

在内容营销场景,可能需要通过浏览器自动化网络内容操作,需要Agent具备Browser Use的能力;在一些数据分析场景,需要执行代码对数据进行分析,需要有安全的代码执行环境。

对于上述两种场景,Strands Agents已经集成了Amazon AgentCore中的Browser Use和Code Interpreter工具,在AgentX平台上也可以通过配置的方式将这两个工具集成到对应的Agent中。

AWS知识专家

AWS Knowledge MCP作为Agent的工具,可以使用户立刻化身AWS知识专家。对于AWS服务的使用、最佳实践都可以通过Agent来回答。

由于AgentX平台很好地提供了Agent的构建和运行时环境,用户可以根据实际的业务场景需求来快速构建出Agent,并将Agent应用到实际的业务场景中去。如果业务场景需要用到更多的工具,可以开发相应的MCP Server或开发对应的Strands Agents Tool来满足Agent的需求。

实施要点与落地建议

技术选型考量

  • 模型选择:根据任务复杂度和成本预算选择合适的Model Provider,复杂推理任务建议使用Claude或GPT-4级别模型
  • 工具集规划:优先使用SDK内置工具,复杂场景再考虑开发自定义MCP Server
  • Multi-Agent模式:简单场景使用Agents as Tools,复杂流程考虑Workflow或Graph模式

部署运维注意事项

  • 确保ECS Fargate有足够的资源配额
  • DynamoDB的读写容量需要根据Agent调用频率进行规划
  • MCP Server的网络连通性需要提前验证
  • 建议配置CloudWatch监控Agent执行状态和性能指标

安全合规建议

  • 为Agent配置适当的Guardrails,防止敏感操作
  • API Endpoint建议配置认证机制
  • Agent执行日志需要妥善保存以满足审计要求

AWS/GCP/多云账单代付 – 免实名 & 支持 USDT 支付 | Payment 解决方案为企业提供灵活的云资源付费方式。如果您正在评估AI Agent平台的部署方案,或需要在多云环境中运行Agent工作负载,欢迎了解我们的服务,助力您的智能化转型之旅。

AWS账单代付

AWS/阿里云/谷歌云官方认证架构师,专注云计算解决方案。