亞馬遜的新一代基礎模型提供前沿智能和行業領先的性價比
Amazon Nova模型擴展了Amazon Bedrock中針對企業客戶提供的豐富且強大的基礎模型選擇
北京2024年12月4日 /美通社/ -- 亞馬遜在2024 re:Invent全球大會上,宣布推出新一代基礎模型Amazon Nova,這些模型在多種任務上展現出優秀智能,且具備行業領先的性價比。Amazon Nova模型將在Amazon Bedrock中提供,包括超快速文本生成模型Amazon Nova Micro,以及能夠處理文本、圖像和視頻并生成文本的多模態模型Amazon Nova Lite、Amazon Nova Pro和Amazon Nova Premier。此外,亞馬遜還推出了兩個全新模型——用于生成高質量圖像的Amazon Nova Canvas和用于生成高質量視頻的Amazon Nova Reel。
亞馬遜通用人工智能高級副總裁Rohit Prasad表示:"在亞馬遜內部,我們約1000個生成式AI應用正在進行中,因此可以全面了解開發者所面臨的挑戰。我們的新一代Amazon Nova模型旨在幫助內外部開發者應對這些挑戰,提供強大的智能和內容生成功能,并在延遲、成本效益、定制化、檢索增強生成(RAG)和智能體能力等方面取得顯著進展。"
Amazon Nova理解模型展現出卓越的智能、能力與速度
Amazon Nova包含四款先進的模型。Amazon Nova Micro是一款僅處理文本的模型,能夠以極低的延遲和成本提供響應。Amazon Nova Lite是一款極具成本效益的多模態模型,能夠快速處理圖像、視頻和文本輸入;Amazon Nova Pro是一款功能強大的多模態模型,可在準確性、速度和成本之間實現絕佳平衡,適合多種任務;Amazon Nova Premier是亞馬遜的頂級多模態模型,專為復雜推理任務而生,并可用于作為"教師模型"來蒸餾定制模型。目前,Amazon Nova Micro、Amazon Nova Lite和Amazon Nova Pro已全部正式可用,Amazon Nova Premier預計將在2025年第一季度可用。
亞馬遜對Amazon Nova模型進行了廣泛的行業基準測試。結果表明,Amazon Nova Micro、Amazon Nova Lite和Amazon Nova Pro在各自類別中與最佳模型相比均表現得相當有競爭力。
Amazon Nova Micro在所有11項適用基準測試中,其表現與Meta的LLaMa 3.1 8B相當或更優,而在所有12項適用基準測試中,其表現也與Google Gemini 1.5 Flash-8B持平或更優。憑借每秒210個輸出token的行業領先速度,Amazon Nova Micro非常適合需要快速響應的應用場景。
Amazon Nova Lite在同類模型中同樣具備強勁競爭力。與OpenAI的GPT-4o mini相比,它在19項基準測試中有17項表現持平或更優,與Google的Gemini 1.5 Flash-8B相比,在21項基準測試中也有17項表現相當或更優,與Anthropic的Claude Haiku 3.5相比,則在12項基準測試中有10項表現相當或更優。除了在文本基準測試中展現出色的準確性外,Amazon Nova Lite在視頻、圖表和文檔理解方面也表現突出,這一點通過VATEX、ChartQA和DocVQA等基準測試得到了證明。此外,Amazon Nova Lite在智能體工作流上也表現優異,如在Berkeley Function Calling Leaderboard(伯克利函數調用排行榜)上的函數調用能力,以及在理解視覺元素以在瀏覽器和計算機屏幕上執行操作的核心能力方面表現出色,這一點在VisualWebBench(網頁瀏覽器操作基準測試)和Mind2Web(通用多模態代理基準測試)得到證明。
Amazon Nova Pro在與OpenAI的GPT-4o的20項基準測試中,有17項表現相當或更優;在與Google的Gemini 1.5 Pro的21項基準測試中,有16項表現持平或更優;在與Anthropic的Claude Sonnet 3.5v2的20項基準測試中,有9項表現相當或更優。除了在文本和視覺智能基準測試中的準確性外,Amazon Nova Pro在遵循指令和多模態智能體工作流方面也表現出色,相關測評包括綜合RAG(CRAG)、Berkeley Function Calling Leaderboard(伯克利函數調用排行榜)和Mind2Web。
多語言和多模態支持,具備長上下文處理能力
Amazon Nova Micro、Lite和Pro支持200多種語言。Amazon Nova Micro支持128K輸入token的上下文長度,而Amazon Nova Lite和Pro的上下文長度可達300K token,處理視頻時長可達30分鐘。到2025年初,Amazon將支持超過200萬輸入token的上下文長度。
快速且具有成本效益
Amazon Nova模型快速,具有成本效益,且設計上易于與客戶的系統和數據無縫集成。Amazon Nova Micro、Lite和Pro在各自智能類別中,成本比Amazon Bedrock中表現最佳的模型至少便宜75%,同時也是Amazon Bedrock中對應類別速度最快的模型。
與Amazon Bedrock的無縫集成
所有Amazon Nova模型均已與Amazon Bedrock集成。Amazon Bedrock是一個完全托管的服務,通過單一API提供來自領先AI公司的高性能模型。客戶可以輕松試用和評估Amazon Nova模型及其他模型,找到最適合其應用的模型。
支持微調以提升準確性
這些模型還支持自定義微調,允許客戶根據自身專有數據中的已標記示例來提升準確性。Amazon Nova模型能夠從客戶的數據(包括文本、圖像和視頻)中學習最重要的信息,隨后Amazon Bedrock會訓練一個私有的微調模型,以提供定制化響應。
蒸餾用于訓練更小、更高效的模型
除了支持微調外,這些模型還支持蒸餾,可以將規模更大、實力更強的"教師模型"中的特定知識轉移到更小的模型上,從而實現更高的精確度、更快的響應速度以及更低的運營成本。
基于數據響應的檢索增強生成(RAG)
Amazon Nova模型與Amazon Bedrock知識庫緊密集成,專注于檢索增強生成(RAG)方法,使客戶能夠通過利用自身的數據確保生成內容的高度準確性和相關性。
針對智能體應用進行優化
Amazon Nova模型經過優化,便于智能體應用在執行多步驟任務時通過多個API與企業的專有系統和數據進行交互。
借助Nova創意內容生成模型,訪問生產級視覺內容
Amazon Nova Canvas是一款先進的圖像生成模型,能夠根據輸入的文本或圖像生成專業級的視覺內容。它提供了便捷的編輯功能,用戶可以通過文本輕松調整圖像,控制顏色方案和布局。該模型內置的安全控制措施確保AI的安全和負責任使用,包括水印功能,能夠追溯每張圖像的來源;以及內容審核功能,限制可能產生的有害內容。根據第三方的對比評估,Amazon Nova Canvas在性能上優于OpenAI的DALL-E 3和Stable Diffusion,并在關鍵的自動化指標上表現出色。
Amazon Nova Reel是一款先進的視頻生成模型,能夠幫助客戶輕松從文本和圖像創建高質量視頻,適用于廣告、營銷和培訓等內容創作。客戶可以使用自然語言提示控制視覺風格和節奏,包括相機運動、旋轉和縮放。根據第三方的評估,Amazon Nova Reel在質量和一致性上優于同類模型,客戶更傾向于選擇由其生成的視頻,而非Runway的Gen-3 Alpha生成的視頻。與Amazon Nova Canvas一樣,Amazon Nova Reel也具備內置的安全控制措施,包括水印和內容審核。目前,Amazon Nova Reel支持生成六秒的視頻,未來幾個月將支持最長為兩分鐘的視頻生成。
下一步計劃:語音到語音和多模態到多模態模型
亞馬遜計劃在2025年第一季度推出Amazon Nova語音到語音模型。該模型旨在通過理解自然語言的流式語音輸入,解釋語言和非語言信號(如語調和節奏),提供流暢的類人交互,徹底改變對話式AI應用,確保低延遲的雙向交流。
此外,Amazon還在開發一種新模型,能夠接受文本、圖像、音頻和視頻作為輸入,并以任意模態生成輸出。這款具備本地多模態到多模態——即"任意到任意"模態能力的Amazon Nova模型預計將在2025年中旬推出。該模型將簡化應用開發,使同一模型能夠執行多種任務,如內容模態轉換、內容編輯,以及驅動能夠理解和生成所有模態的AI代理。
亞馬遜云科技的合作伙伴和客戶已開始使用Amazon Nova模型,從其強大功能和超高性價比中獲益
亞馬遜云科技的戰略合作伙伴SAP正在將Amazon Nova模型集成到SAP AI Core生成式AI中心支持的大語言模型(LLMs)家族中。這一舉措使開發者能夠為SAP的AI助手Joule創建新技能,并利用SAP數據中完整的業務上下文,安全地構建AI驅動的解決方案,從而實現自動化、個性化以及供應鏈規劃等高級功能。
德勤作為亞馬遜云科技的戰略合作伙伴,致力于為全球各行業提供一流的生成式AI服務。德勤深知,沒有一種AI解決方案和基礎模型能解決所有問題,認為Amazon Nova模型的高級定制能力和增強安全性將推動創新,為全球客戶帶來卓越的價值。
Amazon致力于開發負責任的人工智能
Amazon Nova模型內置安全和保護措施。亞馬遜還推出了Amazon AI服務卡,提供有關使用場景、局限性和負責任AI實踐的透明信息。