OpenAI 开放式权重模型现已在 AWS 上可用
亚马逊AWS官方博客
OpenAI 开放式权重模型现已在 AWS 上可用
AWS 致力于为您提供业内最先进的基础模型(FM),不断扩充我们的模型选择范围,将领先的人工智能创新者推出的开创性模型纳入其中,以便您始终能够接触到最新的技术进展,从而推动业务向前发展。
今天,我很高兴地宣布,Amazon Bedrock 和 Amazon SageMaker JumpStart 中将推出两款全新的 OpenAI 开放权重模型。OpenAI 的 gpt-oss-120b 和 gpt-oss-20b 模型专为文本生成和推理任务而设计,这些模型为开发者和企业提供了新的选择,让他们在构建人工智能应用时能够全面控制自身的基础设施和数据。
这些开放权重模型在编码、科学分析和数学推理方面表现出色,性能可与市面上领先的同类模型相媲美。两款模型均支持 128K 的上下文窗口,并提供可调节的推理级别(低/中/高),以满足您的特定使用案例的需求。这些模型支持通过外部工具来增强其功能,并且可用于座席式工作流程,例如,使用 Strands Agents 等框架。
借助 Amazon Bedrock 和 Amazon SageMaker JumpStart,AWS 让您能够自由创新:您可以访问来自领先人工智能公司的数百个基础模型,其中就包括 OpenAI 开放权重模型。通过我们丰富多样的模型选择,您每次都能为人工智能工作负载匹配到最合适的模型。
通过 Amazon Bedrock,您可以无缝试用不同模型,混合搭配各种功能,并且无需重写代码就能在不同提供商的模型之间切换 — 将模型选择转变为一种战略优势,帮助您在新的创新成果出现时不断完善人工智能战略。这些新模型可通过与 OpenAI 兼容的端点在 Bedrock 中使用。您可以将 OpenAI SDK 指向这个端点,或者使用 Bedrock 的 InvokeModel 和 Converse API。
使用 SageMaker JumpStart,您可以快速评估、比较模型,并根据您的使用案例对模型进行定制。然后,您可以通过 SageMaker AI 控制台或使用 SageMaker Python SDK 将原始模型或定制后的模型部署到生产环境中。
让我们来看看这些模型的实际应用。
开始在 Amazon Bedrock 中使用 OpenAI 开放权重模型
在 Amazon Bedrock 控制台中,我从导航窗格的配置和学习部分选择模型访问。然后,我导航到该页面上列出的两款 OpenAI 模型并请求访问权限。
获得访问权限后,我使用聊天/测试操场来测试和评估这些模型。我选择 OpenAI 作为类别,然后选择 gpt-oss-120b 模型。
我使用这个模型运行以下示例提示:
某个家庭有 5000 美元的存款用于明年度假。他们可以将这笔钱存入年利率为 2% 的储蓄账户,也可以存入年利率为 4% 的定期存单,但在度假前不能动用这笔资金。如果他们在这一年中需要 1000 美元用于应急开支,他们应该如何在两种方案之间分配资金,以最大限度地利用他们的假期奖金?
此提示提示生成的输出包括得出结果的思考过程。
我可以通过配置 API 端点(基础 URL)并使用 Amazon Bedrock API 密钥进行身份验证,将这些模型与 OpenAI SDK 配合使用。例如,我可以设置以下环境变量,以使用美国西部(俄勒冈州)AWS 区域的端点(
us-west-2)和我的 Amazon Bedrock API 密钥:
export OPENAI_API_KEY=”
export OPENAI_BASE_URL=”https://bedrock-runtime.us-west-2.amazonaws.com/openai/v1″
现在,我使用 OpenAI Python SDK 调用该模型。
client = OpenAI()
response = client.cha[已去除短链接]mpletion.create(
messages=[{
“role”: “user”,
“content”: “Hello, how are you?”
}],
model=”openai.gpt-oss-120b-1:0″,
stream=True
)
for item in response:
print(item)
要构建人工智能代理,我可以选择任何支持 Amazon Bedrock API 或 OpenAI API 的框架。例如,以下是使用 Amazon Bedrock API 的 Strands Agents 的起始代码:
from strands import Agent
from strands.models import BedrockModel
from strands_tools import calculator
model = BedrockModel(
model_id=”openai.gpt-oss-120b-1:0″
)
agent = Agent(
model=model,
tools=[calculator]
)
agent(“Tell me the square root of 42 ^ 3”)
我保存代码(
app.py 文件),安装依赖项,然后在本地运行座席:
pip install strands-agents strands-agents-tools
python app.py
对座席感到满意后,可以使用 Amazon Bedrock AgentCore 提供的功能(包括完全托管的无服务器运行时以及内存和身份管理功能)将其部署到生产环境中。
开始在 Amazon SageMaker JumpStart 中使用 OpenAI 开放权重模型
在 Amazon SageMaker AI 控制台中,您可以在 SageMaker Studio 中使用 OpenAI 开放权重模型。第一次这样做时,需要设置一个 SageMaker 域。有一些选项可以将其设置为单用户模式(更简单)或组织模式。为了进行这些测试,我使用单用户设置。
在 SageMaker JumpStart 模型视图中,我可以查看 gpt-oss-120b 或 gpt-oss-20b 模型的详细说明。
我选择 gpt-oss-20b 模型,然后部署该模型。在接下来的步骤中,我选择实例类型和初始实例数量。几分钟后,部署完成并创建一个端点,我可以在 SageMaker Studio 中调用该端点,也可以使用任何 AWS SDK 来调用它。
要了解更多信息,请访问 AWS 人工智能博客中的 SageMaker JumpStart 中现已提供 OpenAI 的 GPT OSS 模型。
注意事项
新的 OpenAI 开放权重模型现已在美国西部(俄勒冈州)AWS 区域的 Amazon Bedrock 中提供,Amazon SageMaker JumpStart 则在美国东部(俄亥俄州、弗吉尼亚州北部)和亚太地区(孟买、东京)支持这些模型。
每个模型都具备完整的思维链输出能力,让您能够详细了解模型的推理过程。对于需要高可解释性和验证性的应用程序来说,这种透明度尤为重要。 这些模型让您可以根据自己的特定需求自由修改、调整和定制。这种灵活性使您能够针对自己的独特使用案例对模型进行微调,将它们集成到现有的工作流程中,甚至可以在它们的基础上构建新的、专门针对您所在行业或应用程序的定制模型。
这些模型的核心内置了安全保障机制,具备全面的评估流程和安全措施。这些模型始终与标准的 GPT-4 分词器兼容。
这两款模型都可以在您偏好的环境中使用,无论是想通过 Amazon Bedrock 的无服务器体验,还是借助 SageMaker JumpStart 强大的机器学习(ML)开发功能。有关使用这些模型和服务的相关费用信息,请访问 Amazon Bedrock 定价页和 Amazon SageMaker AI 定价页。
要了解更多信息,请参阅 Amazon Bedrock 文档中的模型参数和聊天补全 API。
立即通过 Amazon Bedrock 控制台或 Amazon SageMaker AI 控制台,在 AWS 上使用 OpenAI 开放权重模型。
– Danilo