核心亮點:
北京2025年12月3日 /美通社/ -- 在亞馬遜云科技2025 re:Invent全球大會上,亞馬遜宣布全面擴展其Nova產(chǎn)品組合:推出四款全新模型、一項開創(chuàng)性的"開放式訓練"服務,支持企業(yè)基于Nova構(gòu)建自有前沿模型變體,以及一項用于創(chuàng)建高可靠性AI Agent的新服務。
目前,數(shù)以萬計的企業(yè)已經(jīng)在使用Nova來支持多種應用場景,例如生產(chǎn)高質(zhì)量內(nèi)容、將多步驟任務自動化以及加速AI Agent的研發(fā)。亞馬遜全新的Nova 2模型家族在多個AI領(lǐng)域?qū)崿F(xiàn)了速度、成本與智能水平的均衡:
Nova 2 Lite
Nova 2 Lite是一款面向日常工作負載的快速、經(jīng)濟型推理模型,能夠處理文本、圖像和視頻輸入并生成文本輸出。客戶可以根據(jù)需求調(diào)節(jié)模型在回答前進行"思考"的深度,在智能程度與響應速度、成本之間靈活平衡,是客戶服務聊天機器人、文檔處理和業(yè)務流程自動化等場景的理想選擇。在同級模型中,Nova 2 Lite憑借性價比表現(xiàn)領(lǐng)先業(yè)界:與Claude Haiku 4.5相比,它在15項基準測試中有13項持平或更優(yōu);與GPT-5 Mini相比,在17項基準測試中,有11項持平或更優(yōu);與Gemini Flash 2.5相比,在18項基準測試中有14項持平或更優(yōu)。Nova 2 Lite在以下能力上尤為突出:處理各類文檔、從視頻中提取關(guān)鍵信息、生成代碼、提供準確的基于事實的回答,以及自動化執(zhí)行多步驟的Agent工作流。
Nova 2 Pro
Nova 2 Pro是亞馬遜最智能的推理模型,能夠處理文本、圖像、視頻和語音輸入,并生成文本輸出。它非常適合用于需要最高準確率的高度復雜任務,如Agent編程(agentic coding)、長期規(guī)劃以及復雜問題求解。該模型還可以作為"教師模型",通過知識蒸餾將自身能力遷移到更小、更高效的"學生模型"上,用于特定垂直領(lǐng)域和應用場景。在公開基準測試中,Nova 2 Pro表現(xiàn)出色:與Claude Sonnet 4.5對比,在16項評測中有10項持平或更優(yōu);與GPT-5.1的16項評測中有8項持平或更優(yōu);與Gemini 2.5 Pro的19項評測中有15項持平或更優(yōu);與Gemini 3 Pro Preview的18項評測中有8項持平或更優(yōu)。Nova 2 Pro在多文檔分析、視頻推理、復雜指令執(zhí)行、高階數(shù)學問題求解,以及執(zhí)行Agent與軟件工程任務等方面表現(xiàn)出眾。
Nova 2 Lite和Nova 2 Pro均內(nèi)置網(wǎng)頁查找和代碼執(zhí)行能力,可以根據(jù)需要搜索最新的互聯(lián)網(wǎng)信息并直接運行代碼,從而確保模型的回答始終基于最新事實,而不僅僅依賴訓練數(shù)據(jù)。
Nova 2 Sonic
Nova 2 Sonic 是亞馬遜的端到端語音模型,將文本與語音的理解與生成深度融合,實現(xiàn)了實時、類人對話式AI體驗。該模型支持更多語言和富有表現(xiàn)力的音色,具備更高識別準確率,并提供高達100萬 tokens的上下文窗口,能夠支撐長時交互,并在語音與文本之間無縫切換。模型可以異步處理任務:用戶在繼續(xù)自然對話、甚至切換話題的同時,系統(tǒng)仍可在后臺完成諸如訂票等操作。Nova 2 Sonic還能與Amazon Connect、第三方語音服務提供商(如Vonage、Twilio、AudioCodes)以及對話式AI框架(如LiveKit、Pipecat)無縫集成,使其成為客戶服務、AI助手和互動語音體驗的理想選擇。與通過實時API提供服務的OpenAI gpt-realtime以及Gemini 2.5 Flash模型相比,Nova 2 Sonic在性價比和語音質(zhì)量方面均處于行業(yè)領(lǐng)先水平。
Nova 2 Omni
Nova 2 Omni 是一款統(tǒng)一的多模態(tài)推理與生成模型,既可處理文本、圖像、視頻和語音輸入,又能同時生成文本和圖像——在業(yè)內(nèi)尚屬首例。Nova 2 Omni可處理多達75萬單詞的文本、數(shù)小時音頻、長視頻以及數(shù)百頁文檔,可一次性同時分析完整產(chǎn)品目錄、用戶評價、品牌規(guī)范和視頻素材庫,降低了連接多種專業(yè)模型所帶來的成本與復雜度。例如,團隊可以利用Nova 2 Omni綜合分析所有格式的產(chǎn)品信息,在一個工作流中即時生成整套營銷活動內(nèi)容,包括標題、正文、社交媒體帖子以及視覺方案。雖然目前業(yè)內(nèi)沒有與 Nova 2 Omni 類似的模型,但它在文檔、圖像、視頻和音頻的多模態(tài)推理公開基準測試中展現(xiàn)了優(yōu)勢,并且可以生成與其他領(lǐng)先圖像生成模型相媲美的高質(zhì)量圖像。
包括思科(Cisco)、西門子(Siemens)、Sumo Logic和Trellix在內(nèi)的眾多企業(yè),已經(jīng)在利用Nova 2模型構(gòu)建從Agent威脅檢測到視頻理解和語音AI助手等多種創(chuàng)新應用。
Nova Forge:首個面向自建前沿 AI 模型的創(chuàng)新服務
將專有知識融入AI應用的過程中,企業(yè)往往面臨三種不盡如人意的選擇:對閉源模型進行有限度微調(diào),只能淺層次地注入企業(yè)專業(yè)知識;在缺乏原始訓練數(shù)據(jù)的情況下,持續(xù)訓練開源權(quán)重模型,可能導致模型在指令跟隨等基礎能力上"退化";從零開始構(gòu)建模型,投入巨大成本與時間。企業(yè)真正需要的,是既能獲得前沿模型能力,又能深度融合自有專業(yè)知識的解決方案。
Nova Forge正是為此而生:它通過將企業(yè)的專有數(shù)據(jù)與Nova的前沿能力相結(jié)合,幫助企業(yè)打造專屬的Nova優(yōu)化變體——我們將這些定制模型稱為"Novellas"。Nova Forge開創(chuàng)性地提供"開放式訓練"路徑:向客戶開放Nova預訓練、中期訓練和后期訓練階段的模型檢查點,以便客戶可以在訓練各階段將自有數(shù)據(jù)與Amazon Nova精選數(shù)據(jù)集進行混合,從而打造既結(jié)合了Nova完整知識與推理能力,又深刻理解企業(yè)業(yè)務語境的定制模型。目前,客戶已經(jīng)可以基于Nova 2 Lite開始構(gòu)建自有Novellas。Nova Forge客戶還將優(yōu)先獲得Nova 2 Pro和Nova 2 Omni的早期訪問權(quán)限,從而搶先基于更強大的Nova模型構(gòu)建應用和Novellas。
除了模型檢查點和數(shù)據(jù)混合能力,Nova Forge還提供三大關(guān)鍵能力:首先,自定義強化學習"gym"(訓練環(huán)境)??蛻艨梢允褂米陨順I(yè)務場景構(gòu)建強化學習環(huán)境(即"gym"),讓模型在高度貼近真實應用的模擬場景中持續(xù)學習和優(yōu)化。其次,構(gòu)建更小、更快的高性價比模型。客戶可通過合成數(shù)據(jù)蒸餾方式,利用更大模型生成的示例訓練更小、更高效的模型,從而在顯著降低成本與延遲的同時,盡可能保留智能水平。第三,負責任AI工具套件。Nova Forge 提供一套負責任AI工具,幫助客戶在模型訓練和應用部署中實施安全控制,滿足合規(guī)和治理要求。
Booking.com、Cosine AI、Nimbus Therapeutics、野村綜合研究所、OpenBabylon、Reddit和索尼等多家企業(yè)或機構(gòu),已經(jīng)開始利用Nova Forge構(gòu)建更契合自身需求的專屬模型。
Reddit首席技術(shù)官Chris Slowe表示:"借助Nova Forge,我們正在構(gòu)建更統(tǒng)一的Reddit內(nèi)容審核系統(tǒng),該系統(tǒng)已經(jīng)取得令人印象深刻的成果。我們正在用一套更加準確的解決方案替換過去的多個不同模型,讓審核流程更高效。將多個專業(yè)化機器學習工作流整合為統(tǒng)一方法,是我們在Reddit實施和擴展AI方式的一次重要轉(zhuǎn)變。在安全領(lǐng)域看到這些初步成效之后,我們非常期待探索Nova Forge在Reddit其他業(yè)務領(lǐng)域的更多可能。"
一旦客戶通過Nova Forge構(gòu)建了自有前沿模型,即可將其部署在Amazon Bedrock上,享受與其他Amazon Bedrock模型一致的企業(yè)級安全性、可擴展性和數(shù)據(jù)隱私保護。通過這一端到端方案——從自建前沿模型,到生產(chǎn)環(huán)境部署——企業(yè)可以獲得針對自身業(yè)務量身定制的最佳AI性能,并在亞馬遜云科技上安全托管、獨享其模型資產(chǎn)。
Nova Act:亞馬遜云科技面向UI工作流的高可靠AI Agent服務
Nova Act現(xiàn)已作為亞馬遜云科技的一項服務正式推出,用于在瀏覽器中構(gòu)建和部署高可靠性的AI Agent,實現(xiàn)自動執(zhí)行各類操作。該服務由定制版Nova 2 Lite模型提供算力支撐,是構(gòu)建和管理大規(guī)模瀏覽器自動化Agent集群的最快捷路徑。Nova Act在早期客戶工作流中達到了90% 的執(zhí)行可靠性,并在相關(guān)基準測試中優(yōu)于競爭模型。
Nova Act通過對定制版Nova 2 Lite模型進行強化學習訓練來實現(xiàn)突破性的可靠性:系統(tǒng)在數(shù)以百計的模擬網(wǎng)頁環(huán)境上持續(xù)運行數(shù)千個任務,使模型在基于UI的工作流中表現(xiàn)尤為出色,例如更新客戶關(guān)系管理系統(tǒng)中的數(shù)據(jù)、測試網(wǎng)站功能,或提交醫(yī)療保險理賠申請等。
使用Nova Act,開發(fā)者只需幾分鐘就能在零代碼可視化環(huán)境中,基于自然語言提示快速構(gòu)建Agent原型;隨后可以在熟悉的集成開發(fā)環(huán)境(如VS Code)中對該Agent進行迭代優(yōu)化,并部署到亞馬遜云科技生產(chǎn)環(huán)境中。開發(fā)者在本地構(gòu)建和測試的內(nèi)容,可以無縫擴展到生產(chǎn)級規(guī)模,并通過Nova Act在亞馬遜云科技控制臺進行統(tǒng)一管理與監(jiān)控。
各行業(yè)客戶已經(jīng)通過Nova Act收獲顯著成效:
了解有關(guān)Amazon Nova更多信息,請訪問Amazon Nova產(chǎn)品頁,免費上手開發(fā)請點擊開發(fā)頁。