核心摘要
- AI Agent由Model、Tools、Orchestration Layer三大核心组件构成,通过循环执行Reasoning-Action-Execution流程完成复杂任务
- Strands Agents SDK作为开源AI Agent开发框架,支持多种Model Provider、MCP协议工具集成以及Swarm/Graph/Workflow等Multi-Agent模式
- 基于Strands Agents SDK构建的AgentX平台实现配置化Agent构建、即时运行、定时调度,降低非技术人员使用门槛
- 实际应用场景涵盖智能数据分析、云端资源巡检、Browser Use自动化、Code Interpreter沙箱执行等企业级需求
基于Strands Agents SDK构建AI Agent运行时平台实战指南
AI Agent技术趋势与企业落地挑战
AI Agent正在成为当前技术领域发展最迅猛的方向之一。与专注特定领域任务的传统AI应用不同,AI Agent能够在更少人工干预的情况下管理和执行端到端的业务流程,从单纯的工具进化为真正的团队成员,推动企业在生产力、效率和增长方面进入全新时代。
相关研究报告显示,AI Agent的竞争势头已经明显增强,93%的企业管理者认为在接下来一年内规模化扩展AI Agent的使用将帮助企业在同类竞争者中保持领先地位。然而现实情况是,大部分企业仍不清楚以何种方式快速构建、运行和管理AI Agents,难以将AI Agents快速在企业内部落地应用。
针对这一痛点,本篇内容从AI Agent的结构和组成入手,结合AWS Strands Agents SDK,构建一个集Agent构建和运行于一体的参考实现平台。该平台还集成了AgentCore Browser Use Tool和AgentCore Code Interpreter Tool,方便用户使用相应工具来构建功能完备的Agents。
AI Agent组成架构深度解析
根据Google的Agents白皮书,针对AI Agent的核心功能,可以将其组成构件和架构拆解为三个必不可少的组件:
The Model(模型层)
在AI Agent范畴,Model特指大语言模型(LLM),作为Agent的中心化决策者,负责进行任务分解、执行和检测任务是否完成。Agent中使用的模型通常基于推理和逻辑框架(如ReAct、Chain-of-Thought或Tree-of-Thoughts),需要具备很强的指令遵循能力。模型的推理质量直接决定了Agent的决策准确性和任务完成效率。
Tools(工具集)
尽管模型在文本、图片等方面具有很强的生成能力,但由于模型本身不能与外部世界交互,其能力受到极大约束。Tools可以抹平这种裂痕,使得Agents可以与外部数据和服务进行交互,更大范围拓展Agent除模型本身之外的能力。工具集的丰富程度和调用效率是衡量Agent实用性的关键指标。
The Orchestration Layer(编排层)
Orchestration Layer描述Agent如何接收外部信息、执行内部推理(Reasoning)、使用推理结果来确定下一步动作和决策的循环过程。这个过程会持续循环,直到Agent完成任务目标或者达到停止点。编排层的设计质量决定了Agent处理复杂任务的能力上限。
Agent工作流程详解
AI Agent的完整工作流程包含以下关键环节:
- AI Agents与外部环境交互,从用户接收输入、触发或者目标
- 通过模型的推理,将目标分解成特定的动作和步骤,并确定任务的执行顺序
- 任务执行过程中,AI Agents可以访问内部的数据和工具(如知识库、企业系统)以及通过MCP协议访问外部工具(如第三方数据库、Web搜索等)
- AI Agent Orchestration组件循环执行Reasoning → Action Plan → Execution这个Loop,循环过程中可能会有安全护栏(Guardrails)来确保道德、运营和安全标准
- 由于Agent执行过程可能会执行多轮循环,受限于模型的上下文窗口长度以及对模型精度的要求,AI Agent使用Memory来维护执行过程的上下文,从前面的迭代或者过去的执行中学习,提升Agent的性能表现
- 在Multi-Agent场景,Agent-to-Agent(A2A)协议被用来实现Agent之间的协作
Strands Agents SDK核心特性全览
Strands Agents SDK是一个开源的AI Agent开发框架,使用该SDK可以利用几行代码快速开发生产可用的multi-agents AI系统。其特性覆盖了Agent开发的各个层面:
Agent Loop机制
Strands Agents实现了处理用户输入、决策、执行工具、响应生成的循环过程。这个过程支持复杂的、多步骤的推理和动作执行,并且可以无缝集成Model和Tools。
多元化Model Provider支持
在Model方面,SDK提供多种Model Provider实现,包括:
- Amazon Bedrock
- Anthropic
- OpenAI
- Ollama
- LiteLLM
开发者可以灵活选择各种商业或开源模型来驱动AI Agent,这种灵活性对于需要多云账单代付解决方案的企业尤为重要,可以根据成本和性能需求选择最优的模型组合。
丰富的Tools生态
在Tools方面,Strands Agents支持多种工具定义和集成方式:
- Python Tools:支持以
@tool函数装饰器方式和基于Python模块方式来定义Agent可用的Tools - Model Context Protocol(MCP)Tools:集成MCP Server的Tools作为Agent可用的Tools,支持STDIO和Streamable HTTP两种Transport类型的MCP Server
- Agent Tools:在multi-agent场景,支持将其他Agent作为当前Agent的一个Tool来完成特定领域的任务
Strands Agents自带了丰富的、开箱即用的基础工具:
- 文件读写工具
- Memory工具(mem0_memory和agent_core_memory)
- Browser Use工具(local_chromium_browser和agent_core_browser远程版本)
- Code Interpretation工具(python_repl和agent_core_interpreter)
- 多模态工具(image_reader、generate_image、nova_reels、diagram等)
Multi-Agent协作模式
Strands Agents在Multi-Agent方面支持以下模式:
- Agent-to-Agent(A2A)Protocol:支持不同平台和实现的AI Agents间无缝沟通
- Agents as Tools:通过编排(orchestration)Agent来接收用户输入并决定使用哪个特定的Agent来完成相应任务
- Swarm:多个Agent以团队方式共同完成复杂任务,允许Agent间自主协作、共享上下文以及记忆
- Graph:以有向无环图(DAG)方式编排各个Agent,Agent作为节点,以DAG结构图作为执行顺序,一个节点的输出将传播到与其连接的节点并作为其输入
- Workflow:适合复杂的多步骤流程,任务间有依赖关系,必须等上一步执行完成后才能执行下一步,每一步都由一个专家Agent来完成对应任务
除上述核心特性外,Strands Agents SDK在Agent的安全性、应用的可观测性以及Agent部署方面提供了原生支持。
AgentX:一站式Agent构建和运行时平台
Strands Agents SDK显著提升了AI Agent的开发效率,但仍存在两个关键挑战:开发完成后的Agent部署与运行管理问题;以及尽管SDK已经极大简化了开发流程,但依然需要编写代码,对非技术背景的业务人员形成了使用障碍。
进一步思考以下问题:
- 是否可以不用写代码就可以构建自己的Agent,让业务人员都可以快速构建想要的Agent?
- Agent构建好后,是否可以不用考虑Agent的部署,立即可运行,对外提供可访问的端点?
- 很多业务场景需要Agent周期性运行,是否能让配置或构建好的Agent按时调度运行?
Agent工程化解构
从工程实现的视角对AI Agent进行解构,可以识别出其由以下四个核心组件构成:
- Model(LLM):Agent的大脑
- Tools:Agent的触手
- System Prompt:Agent的行为规范
- Environments:Agent需要感知的环境信息,如系统环境变量、当前对话的文档等
AgentX平台架构设计
基于上述思考,AgentX作为基于Strands Agents SDK开发的AI Agent构建和运行平台(参考实现),可以实现:
- 配置化构建:通过配置的方式来构建AI Agent,支持Strands Agents自带的Tools、MCP Server Tools以及Agent as Tool,并且支持各种模型接入
- 即时运行:配置好的Agent可以通过API Endpoint来进行调用,无需构建专门的Agent运行时,真正做到Agent配置即可运行
- 定时调度:支持Agent定时调度执行配置
- 历史管理:支持Agent运行历史记录管理
技术架构组件
AgentX的技术架构包含以下关键组件:
- 使用Amazon ECS部署整个应用,使用ECS Fargate作为Capacity Provider
- 整体应用分为前端、后端以及各种MCP Server
- 使用Amazon DynamoDB存储Agent的配置以及Agent的运行历史记录
- 使用Amazon Lambda和EventBridge实现Agent的定时调度执行
- 整个项目可以通过CDK一键部署,部署前需要将前、后端应用以及需要部署的MCP Server构建成Docker镜像并推送到AWS ECR中
AgentX平台操作指南
配置Agent
部署完成后,在Agent管理页面可以配置Agent。配置Agent的过程实际就是对Agent使用的模型、System Prompt、需要使用的Tools以及环境变量参数进行设置。这种配置化的方式大大降低了Agent构建的技术门槛。
运行和调用Agent
Agent配置完成后,可以通过在UI界面上选择配置好的Agent来完成相应的任务。也可以在应用层面,通过API Endpoint来调用Agent。配置好Agent之后,Agent立即可运行,不需要额外的部署步骤。
MCP Server管理
可以对企业内部或一些公开的MCP Server进行维护和管理,通过配置的方式将这些MCP Server的Tools作为Agent的Tools。目前该项目只支持Streamable HTTP Transport类型的MCP Server。
Agent调度配置
通过配置Cron表达式的方式,来定时调度Agent执行任务。对于需要周期性让Agent来完成某项任务的场景提供了开箱即用的支持。
实际应用场景深度剖析
智能数据分析
结合数仓Redshift MCP Server(或其他数据库MCP Server),可以配置Agent来实现基于Agent的数据分析,如对数据进行预测性分析或诊断性分析。
对于简单的查数以及指标计算场景,Agent结合数据库MCP Server就能很好地支持。如果数据表比较多、表间关系比较复杂,在结合MCP Server的同时,可以将Schema信息放到RAG中,将RAG也作为Agent的工具,来实现Chat BI或Text2SQL的场景。
通过配置Redshift MCP Server作为Agent的工具,可以实现游戏埋点事件数据的预测性分析。Agent会充分利用MCP工具以及模型本身的知识,构建数据预测模型,对基础数据进行预测性分析,并将分析结果以HTML页面的方式进行可视化展示。
基于Agent的云端资源巡检
在一些关键业务场景中,企业IT运维人员需要定时对资源的各项运行指标进行检查,来确保基础架构以及上层应用的稳定运行。由于需要检查的方面比较多(如数据库运行指标检查、EC2运行指标检查、EKS集群运行检查),可以每个方面的检查配置一个专门的Agent来执行,最后通过一个编排(Orchestrator)Agent来统筹执行整个巡检任务,将不同方面的巡检指派给不同的Agent,这也是典型的Multi-Agent场景。
编排Agent结合MySQL巡检Agent和EC2巡检Agent的Multi-Agent配置保存后,此编排Agent就可以对AWS EC2和RDS资源进行运行指标巡检。编排Agent对巡检任务进行分解,将EC2的巡检任务指派给EC2巡检Agent,将RDS资源巡检的任务交给RDS巡检Agent。
实际巡检结果示例:
- EC2巡检结果:EC2巡检Agent识别到有EC2 CPU峰值利用率超过93.89%,超过设定的阈值(75%)18.89%
- RDS巡检结果:RDS巡检Agent查找到有RDS实例可用内存(55.28MB)小于阈值(500MB)
最后编排Agent对上述检查结果进行统一整理和分析,并给出行动建议。对于查找的问题,可以添加其他Tools(如Slack Tool),将巡检报告以及查找的问题发送到对应的Channel,实现告警通知。
远程Browser Use和Code Interpreter沙箱
在内容营销场景,可能需要通过浏览器自动化网络内容操作,需要Agent具备Browser Use的能力;在一些数据分析场景,需要执行代码对数据进行分析,需要有安全的代码执行环境。
对于上述两种场景,Strands Agents已经集成了Amazon AgentCore中的Browser Use和Code Interpreter工具,在AgentX平台上也可以通过配置的方式将这两个工具集成到对应的Agent中。
AWS知识专家
将AWS Knowledge MCP作为Agent的工具,可以使用户立刻化身AWS知识专家。对于AWS服务的使用、最佳实践都可以通过Agent来回答。
由于AgentX平台很好地提供了Agent的构建和运行时环境,用户可以根据实际的业务场景需求来快速构建出Agent,并将Agent应用到实际的业务场景中去。如果业务场景需要用到更多的工具,可以开发相应的MCP Server或开发对应的Strands Agents Tool来满足Agent的需求。
实施要点与落地建议
技术选型考量
- 模型选择:根据任务复杂度和成本预算选择合适的Model Provider,复杂推理任务建议使用Claude或GPT-4级别模型
- 工具集规划:优先使用SDK内置工具,复杂场景再考虑开发自定义MCP Server
- Multi-Agent模式:简单场景使用Agents as Tools,复杂流程考虑Workflow或Graph模式
部署运维注意事项
- 确保ECS Fargate有足够的资源配额
- DynamoDB的读写容量需要根据Agent调用频率进行规划
- MCP Server的网络连通性需要提前验证
- 建议配置CloudWatch监控Agent执行状态和性能指标
安全合规建议
- 为Agent配置适当的Guardrails,防止敏感操作
- API Endpoint建议配置认证机制
- Agent执行日志需要妥善保存以满足审计要求
AWS/GCP/多云账单代付 – 免实名 & 支持 USDT 支付 | Payment 解决方案为企业提供灵活的云资源付费方式。如果您正在评估AI Agent平台的部署方案,或需要在多云环境中运行Agent工作负载,欢迎了解我们的服务,助力您的智能化转型之旅。