目录

  • Amazon Nova 理解模型展现出卓越的智慧、能力与速度
  • 多语言和多模态支援,具备长上下文处理能力
  • 快速且具有成本效益
  • 与 Amazon Bedrock 的无缝整合
  • 支援微调以提升准确性
  • 蒸馏用于训练更小、更高效的模型
  • 基于资料回应的检索增强生成(RAG)
  • 针对代理应用进行优化
  • 借助 Nova 创意内容生成模型,取得生产级视觉内容
  • 下一步:语音到语音和多模态到多模态模型
  • AWS 的合作伙伴和客户已开始使用 Amazon Nova 模型,从其强大功能和超高性价比中获益
  • 亚马逊致力于开发负责任的 AI

亚马逊的新一代基础模型提供前沿智慧和业界领先的性价比

Amazon Nova 模型扩展了 Amazon Bedrock 中针对企业客户提供的丰富且强大的基础模型选择


亚马逊在 2024 年 AWS re:Invent 全球大会上,宣布推出新一代基础模型 Amazon Nova ,这些模型在多种任务上展现出顶尖智慧,且具备业界领先的性价比。 Amazon Nova 模型将在 Amazon Bedrock 中提供,包括超快速文本生成模型 Amazon Nova Micro ,以及能够处理文本、图像和影片并生成文本的多模态模型 Amazon Nova Lite、Amazon Nova Pro 和 Amazon Nova Premier 。此外,亚马逊还推出了两个全新模型——用于生成高品质图像的 Amazon Nova Canvas 和用于生成高品质影片的 Amazon Nova Reel 。

亚马逊通用 AI 资深副总裁 Rohit Prasad 表示:「在亚马逊内部,我们约有 1,000 个生成式人工智慧(AI)应用正在进行中,因此可以全面了解开发者所面临的挑战。我们的新一代 Amazon Nova 模型旨在帮助内外部开发者应对这些挑战,提供强大的智慧和内容生成功能,并在延迟、成本效益、客制化、检索增强生成(RAG)和智慧代理(agentic)等方面取得显着进展。」

Amazon Nova 理解模型展现出卓越的智慧、能力与速度

Amazon Nova 包含四款先进的模型。 Amazon Nova Micro 是一款仅处理文本的模型,能够以极低的延迟和成本提供回应;Amazon Nova Lite 是一款极具成本效益的多模态模型,能够快速处理图像、影片和文本输入;Amazon Nova Pro 是一款功能强大的多模态模型,可在准确性、速度和成本之间实现绝佳平衡,适合多种任务;Amazon Nova Premier 是亚马逊的顶级多模态模型,专为複杂推论任务而生,并将其作为蒸馏客制化模型(distilling custom models)的最佳典范模型(teacher model)使用。目前, Amazon Nova Micro、Amazon Nova Lite 和 Amazon Nova Pro 已全部正式可用, Amazon Nova Premier 预计将在 2025 年第一季度可用。

亚马逊对 Amazon Nova 模型进行了广泛的业界基准测试。结果表明, Amazon Nova Micro、Amazon Nova Lite 和 Amazon Nova Pro 在各自类别中与最佳模型相比均表现得相当有竞争力。

Amazon Nova Micro 在 11 项适用基准测试中,其表现与 Meta 的 LLaMa 3.1 8B 相当或更优,而在 12 项适用基准测试中,其表现也与 Google Gemini 1.5 Flash-8B 持平或更优。凭借每秒 210 个输出 token 的业界领先速度, Amazon Nova Micro 非常适合需要快速回应的应用场景。

Amazon Nova Lite 在同类模型中同样具备强劲竞争力。与 OpenAI 的 GPT-4o mini 相比,它在 19 项基准测试中有 17 项表现持平或更优;与 Google 的 Gemini 1.5 Flash-8B 相比,在 21 项基准测试中也有 17 项表现相当或更优;与 Anthropic 的 Claude Haiku 3.5 相比,则在 12 项基准测试中有 10 项表现相当或更优。除了在文本基准测试中展现出色的准确性外, Amazon Nova Lite 在影片、图表和文档理解方面也表现突出,这一点透过 VATEX、ChartQA 和 DocVQA 等基准测试得到了证明。此外, Amazon Nova Lite 在代理工作流程上也表现优异,如在 Berkeley Function Calling Leaderboard 上的函式呼叫能力,以及在理解视觉元素以在浏览器和电脑萤幕上执行操作的核心能力方面表现出色,这一点在 VisualWebBench(网页浏览器操作基准测试)和 Mind2Web(通用多模态代理基准测试)得到证明。

Amazon Nova Pro 在与 OpenAI 的 GPT-4o 的 20 项基准测试中,有 17 项表现相当或更优;在与 Google 的 Gemini 1.5 Pro 的 21 项基准测试中,有 16 项表现持平或更优;在与 Anthropic 的 Claude Sonnet 3.5v2 的 20 项基准测试中,有 9 项表现相当或更优。除了在文本和视觉智慧基准测试中的准确性外, Amazon Nova Pro 在遵循指令和多模态代理工作流程方面也表现出色,相关测试包括综合 RAG(Comprehensive RAG Benchmark)、Berkeley Function Calling Leaderboard 和 Mind2Web 。

多语言和多模态支援,具备长上下文处理能力

Amazon Nova Micro、Lite 和 Pro 支援 200 多种语言。 Amazon Nova Micro 支援 128K 输入 token 的上下文长度,而 Amazon Nova Lite 和 Pro 的上下文长度可达 300K token ,处理影片时长可达 30 分钟。到 2025 年初,亚马逊将支援超过 200 万输入 token 的上下文长度。

快速且具有成本效益

Amazon Nova 模型快速、具有成本效益,且设计上易于与客户的系统和资料无缝整合。 Amazon Nova Micro、Lite 和 Pro 在各自的智慧类别中,成本比 Amazon Bedrock 中表现最佳的模型至少便宜 75% ,同时也是 Amazon Bedrock 中对应类别速度最快的模型。

与 Amazon Bedrock 的无缝整合

所有 Amazon Nova 模型均已与 Amazon Bedrock 整合。 Amazon Bedrock 是一项全受管服务,透过单一 API 提供来自领先 AI 公司的高效能模型。客户可以轻松试用和评估 Amazon Nova 模型及其他模型,找到最适合其应用的模型。

支援微调以提升准确性

这些模型还支援自订微调,允许客户根据自身专有资料中的已标记范例来提升准确性。 Amazon Nova 模型能够从客户的资料(包括文本、图像和影片)中学习最重要的资讯,随后 Amazon Bedrock 会训练一个专属的微调模型,以提供客制化回应。

蒸馏用于训练更小、更高效的模型

除了支援微调外,这些模型还支援蒸馏,可以将规模更大、实力更强的「典范模型」中的特定知识转移到更小的模型上,从而实现更高的精确度、更快的回应速度以及更低的营运成本。

基于资料回应的检索增强生成(RAG)

Amazon Nova 模型与 Amazon Bedrock 知识库紧密整合,专注于检索增强生成(RAG)方法,使客户能够透过利用自身的资料确保生成内容的高度准确性和相关性。

针对代理应用进行优化

Amazon Nova 模型经过优化,便于代理应用在执行多步骤任务时透过多个 API 与企业的专有系统和资料进行互动。

借助 Nova 创意内容生成模型,取得生产级视觉内容

Amazon Nova Canvas 是一款先进的图像生成模型,能够根据输入的文本或图像生成专业级的视觉内容。它提供了便捷的编辑功能,使用者可以透过文本轻松调整图像,控制颜色组合和布局。该模型内建的安全控制措施确保安全和负责任地使用 AI ,包括浮水印功能,能够追溯每张图像的来源;以及内容审核功能,限制可能产生的有害内容。根据合作厂商的对比评估, Amazon Nova Canvas 在效能上优于 OpenAI 的 DALL-E3 和 Stable Diffusion ,并在关键的自动化指标上表现出色。

Amazon Nova Reel 是一款先进的影片生成模型,能够帮助客户轻松以文本和图像打造高品质影片,适用于广告、行销和培训等内容创作。客户可以使用自然语言提示控制视觉风格和节奏,包括镜头移动、旋转和缩放。根据合作厂商的评估, Amazon Nova Reel 在品质和一致性上优于同类模型,客户更倾向于选择由其生成的影片,而 Runway 的 Gen-3 Alpha 生成的影片。与 Amazon Nova Canvas 一样, Amazon Nova Reel 也具备内建的安全控制措施,包括浮水印和内容审核。目前, Amazon Nova Reel 支援生成六秒的影片,未来几个月将支援最长为两分钟的影片生成。

下一步:语音到语音和多模态到多模态模型

亚马逊计画在 2025 年第一季度推出 Amazon Nova 语音到语音模型。该模型旨在透过理解自然语言的即时语音输入,解释语言和非语言讯号(如语调和节奏),提供流畅、接近真人的互动,彻底改变对话式 AI 应用,并确保低延迟的双向交流。

此外,亚马逊还在开发一种新模型,能够接受文本、图像、音讯和影片作为输入,并以任意模态生成输出。这款具备本地多模态到多模态,即「任意到任意」模态能力的 Amazon Nova 模型预计将在 2025 年中旬推出。该模型将简化应用程式开发,使同一模型能够执行多种任务,如内容模态转换、内容编辑,以及驅动能够理解和生成所有模态的 AI 代理。

AWS 的合作伙伴和客户已开始使用 Amazon Nova 模型,从其强大功能和超高性价比中获益

AWS 的策略合作伙伴 SAP 正在将 Amazon Nova 模型整合到 SAP AI Core 生成式 AI 中心支援的大型语言模型(LLMs)家族中。借此,开发者能够为 SAP 的 AI 助理 Joule 打造新功能,并利用 SAP 资料中完整的业务上下文,安全地建构 AI 驅动的解决方案,从而实现自动化、个人化以及供应鏈规划等进阶功能。
勤业众信作为 AWS 的策略合作伙伴,致力于为全球各产业提供一流的生成式 AI 服务。勤业众信深知,没有一种 AI 解决方案和基础模型能解决所有问题,认为 Amazon Nova 模型的进阶客制化能力和提升的安全性将推动创新,为全球客户带来卓越的价值。

亚马逊致力于开发负责任的 AI

Amazon Nova 模型内建安全和保护措施。亚马逊还推出了 AWS AI Service Cards ,提供有关使用案例、局限性和负责任 AI 实践的透明资讯。

点赞(0) 打赏

评论列表 共有 0 条评论

暂无评论
立即
投稿
发表
评论
返回
顶部