亚马逊AWS官方博客
Anthropic最新推出的基础模型Claude Opus 4.5现已上线Amazon Bedrock
Claude Opus 4.5独特优势 Claude Opus 4.5是Anthropic在Opus旗舰系列中推出的最先进模型,专为开发者打造,旨在帮助他们构建功能复杂的AI Agent。这类Agent能够自主推理、规划并执行复杂任务,仅需极少人工干预。该模型在Sonnet 4.5的基础上进行了升级,不仅在现有应用场景中实现了性能提升,还新增了适配复杂工作流的全新能力。该模型在专业软件工程领域表现卓越, 在SWE-bench Verified基准测试中取得80.9%的得分,能够将原本需要数天完成的开发项目,缩短至仅需数小时即可完成。它可独立开展工作,具备更强的多语言编码能力,以及更高效的代码输出、更完善的测试覆盖、更简洁的架构选型等增强特性。在办公效率方面,该模型能够端到端处理复杂项目:可为Agent提供核心支持,助力其生成具备专业水准的PowerPoint演示文稿、Excel电子表格和Word文档,还能对合同和保密协议(NDA)等文件进行修订标注。此外, 该模型生成的React和HTML相关成果质量也显著提升。其输出能够始终保持一致与精准,这对于对精准度有严苛要求的行业至关重要,并能在大型项目中跨文件持续保留上下文内容。这是Anthropic迄今为止性能最出色的视觉模型,在MMMU基准测试中斩获80.7%的得分,专为依赖复杂视觉解读与多步骤操作的工作流打造,例如分析设计原型图、处理复杂版式文档,或实现浏览器端任务自动化——其计算机操作性能还实现了进一步提升。该模型为Agent开发者带来了两项关键改进:
- 工具搜索:让Agent能够动态发现并仅加载所需工具,无需预先定义全部工具,从而轻松管理数百种工具的协作。
支持工具调用示例功能:支持用户在工具定义中直接嵌入工具调用示例,针对包含嵌套对象或数组的复杂数据结构,这一功能可以显著提升工具调用的准确性。
Opus 4.5性能基准测试结果
业务应用场景与用例 软件开发:助力开发者构建可跨整个项目编写与重构代码、管理全栈架构的Agent,或设计能将高级目标拆解为可执行步骤的Agent驱动系统。这一代Claude模型覆盖完整开发生命周期:Opus 4.5适用于生产级代码编写与复杂Agent开发,例如部分Agent在端到端软件工程、网络安全或财务分析等工作流中需调用10种以上工具;Sonnet 4.5适用于快速迭代与规模化用户体验的优化;Haiku 4.5适用于子Agent开发与免费产品打造。Opus 4.5能够分析技术文档、规划软件实现方案、编写所需代码,并持续进行迭代优化,全程跟踪需求与架构上下文信息。 企业运营与办公任务:端到端管理复杂项目。Opus 4.5凭借其记忆能力,能够保持跨文件的上下文一致性,同时在创建电子表格、演示文稿与文档方面也实现了性能提升。该模型可处理持续推进的企业级项目,将手动工作流程自动化。 财务分析:能够跨复杂信息系统(诸如监管申报文件、行业报告、内部数据等)开展工作,支持预测建模与主动合规。凭借其一致性与准确性,该模型在金融及其他对精准度有严苛要求的行业中极具实用价值。 网络安全领域:为安全工作流提供专业级分析能力,关联日志数据、安全问题数据库与安全情报,实现安全事件检测与自动化事件响应。
与Amazon Bedrock AgentCore集成** **持久内存:**可在不同会话间保持上下文信息。 **Tool Gateway:**可将各类API和Lambda函数转换为与Agent兼容的工具。 **内置身份与访问管理:**用于安全访问资源。 **通过Amazon CloudWatch实现的内置可观测性功能,您可跟踪Agent工作流中的token使用量、延迟时间和错误率。
可用性与访问方式 该模型现已通过跨区域推理功能上线Amazon Bedrock,该功能可自动将请求路由至亚马逊云科技不同区域的可用算力资源,从而在需求高峰期实现更高吞吐量。若您需要构建能够处理长时间运行任务、协调多个工具协作或在长时间会话中持续留存上下文的Agent,这款模型一定是理想之选。有关模型的可用区域、定价及规格详情,请参阅 Amazon Bedrock官方文档。
总结
Amazon Bedrock上的Claude Opus 4.5模型在软件开发、企业运营等复杂且长时间运行的工作流中表现出色,其在工具调用、上下文管理与决策能力上的核心优势,使其成为构建能在生产环境中稳定运行的Agent的理想选择,尤其适用于开发软件工程、研究合成与企业工作流自动化等领域的Agent。Opus 4.5与Amazon Bedrock企业级特性的结合,为构建生产级AI Agent搭建了坚实底座。建议您基于自身业务场景开展模型实操,探索其在优化企业人工流程、支持新型自动化模式的潜力。您可通过Amazon Bedrock控制台直接试用,或参阅技术文档、Anthropic官方Claude模型详情页获取更多信息。若需大规模部署Agent,推荐您借助Amazon Bedrock AgentCore集成Opus 4.5,依托其托管式基础设施、工具编排与监控能力实现高效落地。
AWS USDT代付 | Payment 解决方案