亚马逊在 re:Invent 2024 大会上发布 Nova 系列 AI 模型,包含文字、影像和影片生成功能,并计划于 2025 年推出语音生成模型,以提升内容创作效率。

在re:Invent 2024大会演讲中,亚马逊执行长Andy Jassy宣布名为Nova的自有多模态自动生成式人工智慧模型,并且区分Micro、Lite、Pro及Premier四种规模版本,另外更针对影像生成需求推出名为Nova Canas的模型,同时也宣布推出可自动生成影片内容的Nova Reel。

此次揭晓四种规格版本,包含Micro、Lite、Pro都已经可提供AWS用户使用,而Premier则要等到2025年第一季才会对外开放。

亚马逊标榜Nova系列模型能带来高达75%的成本效益,并且能以更快速度产生内容,更可透过微调方式提高生成准确性。

其中,规模最小、仅对应文字内容生成的Nova Micro,在整体精度表现比起Google Gemini 1.5Flash 8B、Meta Llama 3.1 8B更高,而Nova Lite虽然在视觉理解表现略输Claude 3.5 Sonnet V2、GPT-4o、Gemini 1.5 Pro及Llama 3.2 90B,但整体表现依然较好。

而同步推出的影像生成模型Nova Canas,则是针对艺术创作使用需求打造,并且强调比Dall-E 3、Stable Diffusion 3.5 Large能有更高生成准确率,更可在短时间内生成输出。

至于对应影片生成的Nova Reel,则可对应横移、360度环绕,或是缩放等拍摄视角,目前仅可生成6秒时间长度影片,但亚马逊表示挺快将能推出可生成2分钟时间长度影片版本。

亚马逊更说明此次推出的自动生成式人工智慧模型产生内容有高度可控,并且透过数位浮水印等识别方式避免造成以假乱真情况,强调以负责任形式提供此类工具

不过,亚马逊并未透露其自有人工智慧模型训练数据来源,仅说明是透过特定专用数据,以及授权使用数据交叉训练而成。

另外,亚马逊更透露接下来将扩展至语音生成语音 (speech to speech)的应用模式,预计会在2025年第一季推出,并且将在之后接续扩展至任何形式均可输入、生成的使用模式,意味使用者可透过文字生成影片,或是将影片内容转换为文字描述等,届时预期将让自动生成式人工智慧模型能有更多应用形式。

但亚马逊此次并未公布市场传闻的下一版Alexa数位助理服务,或许会等到其自动生成式人工智慧模型应用发展至一定程度,才会有更进一步说明。

点赞(0) 打赏

评论列表 共有 0 条评论

暂无评论

微信小程序

微信扫一扫体验

立即
投稿

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部