北京2026年6月18日 /美通社/ -- 亞馬遜云科技宣布,專注于Agent構建、連接與優化的一站式平臺Amazon Bedrock AgentCore推出多項新功能,助力企業加速構建擁有更廣闊知識和持續學習能力的Agent。這些新功能將能夠打通Agent與企業內部知識、公開網絡知識及付費知識資源的連接通道,助力技術團隊快速定位并修復生產環境中的故障問題,并搭建隨Agent能力提升同步擴展的管控體系。
驅動當今Agent的模型非常強大。它們能夠跨越復雜問題進行推理,規劃多步驟工作流,并生成精準細膩的響應。但大多數Agent的實際表現遠未達到這一潛力上限。差距不在于智能,而在于獲取正確的上下文和反饋。
負責解答企業退款政策問題的客服類Agent,若無法訪問SharePoint中存儲的政策文檔,便無法提供有效支持;撰寫市場簡報的研究類Agent,若無法獲取訓練數據之外的實時信息,輸出的內容便會存在缺失;財務顧問類Agent,若無法突破付費墻獲取所需的實時市場數據,只能給出次優建議。而在所有場景下,多數團隊都缺乏系統化的方法,無法追蹤Agent部署后的效果優劣變化。
能力強大的模型僅僅是起點。讓Agent在生產環境中發揮效能的關鍵,在于使其能夠獲取完成全部工作所需的一切:正確的知識、執行操作的資源以及持續改進的反饋閉環。
知識更豐富、觸達更廣泛的Agent
Amazon Bedrock AgentCore上的Agent現已獲得對三層知識的原生訪問權限,每層知識都拓寬了Agent可以觸達和完成的范圍, 包括由AgentCore托管的企業知識層、公共知識層以及付費知識層。
企業知識層:Amazon Bedrock Managed Knowledge Base
企業最有價值的信息散布在類似SharePoint、Google Drive、Confluence、Amazon S3和內部維基中。傳統方式下,要讓Agent能夠使用這些信息,需要搭建定制化的數據接入管道、調優檢索效果,并長期維護數據的時效性。往往需要耗費數月的工程開發工作,Agent才能回答與企業自身業務相關的基礎問題。
目前已在AgentCore上線的Amazon Bedrock Managed Knowledge Base(托管知識庫),可以替代上述工作。企業只需接入自身的非結構化數據源,其余工作都由AgentCore處理。平臺管理向量存儲、檢索期間使用的嵌入和重排模型,以及速率限制等擴展性問題,因此團隊可以專注于構建Agent,而不是運營數據管道。該功能的核心是一個遠超傳統檢索增強生成(RAG)的Agentic檢索器。它不是將查詢與最接近的文本片段做匹配,而是跨企業的知識庫規劃查詢,連接各個文檔中的相關概念,評估中間結果,并在回答之前進行重新排序。對于同時涉及多個主題的復雜多意圖查詢,Agentic檢索的信息覆蓋廣度與完整度,明顯優于基礎檢索方式。
無需構建管道,也無需調優檢索,Agent就能從"無法訪問"轉變為基于實際業務知識來提供綜合性回答。
公共知識層:Amazon Bedrock AgentCore上的Web Search(網頁搜索功能)
內部知識存在局限性。法規不斷更新,市場持續變化,競爭對手也在不斷推出新產品。要讓Agent發揮最佳作用,就需要掌握企業外部的實時動態,以支撐研究、事實核查、客戶服務、市場情報分析等工作。現在,亞馬遜云科技為構建AI Agent的開發人員推出了Web Search這一新工具。它提供來自網絡的信息,同時將數據保留在客戶安全的亞馬遜云科技環境中。
Web Search基于亞馬遜云科技統一的搜索基礎設施構建,該架構同時支撐AIexa+、Amazon Quick Suite與Kiro等產品;它針對Agentic檢索進行了優化,返回的高價值摘錄具有極高的單位Token智能密度。它還采用了多源事實錨定方案,將公共網絡信息與亞馬遜云科技專有的知識圖譜相結合。該圖譜融合了結構化的實體數據、經過驗證的事實以及例如像股票價格和體育比分等實時信息。
Web Search將用戶的查詢保留在亞馬遜云科技安全和合規邊界內,無需引入額外的供應商,也沒有隨之而來的編排、身份驗證或計費工作流。無論企業是在構建交叉引用公共來源的研究Agent,監控法規和政策更新的合規Agent,還是利用最新信息錨定模型響應,Agent現在都可以像查詢內部知識一樣對實時網絡信息進行推理。
索尼集團公司高級總經理Masahiro Oba表示:"在索尼,我們正在Amazon Bedrock AgentCore上構建企業級AI Agent平臺,讓各業務部門的團隊都能夠開發、共享和復用針對其自身需求量身定制的AI Agent,涵蓋從知識助手到工作流自動化的各類代理。我們的企業知識分布在SharePoint、Confluence和Amazon S3等各類存儲庫中,其中包含PDF、演示文稿以及帶有圖表和表格的電子表格等復雜文檔。隨著Knowledge Base與Web Search在Amazon Bedrock AgentCore中正式推出,我們現在無需從頭構建這些功能,就能在統一的治理模型下,為智能代理配備先進的檢索與實時網絡事實錨定能力。這有力地加速了我們的愿景——以AI為催化劑,在大規模應用中徹底改變人們的工作方式。"
付費知識層:AgentCore支付與Amazon WAF AI流量變現
最好的信息并不總是免費的,例如:金融市場動態、許可研究、專有數據集、付費API。如果Agent無法訪問付費資源,它將返回次優的答案,而用戶永遠不知道錯過了什么。
訪問付費內容需要兩個部分:Agent端需要支付能力,而提供商端則需要收款機制。上個月推出的Amazon Bedrock AgentCore支付功能(預覽版)處理了Agent端的需求,讓Agent能夠在執行閉環中發現付費服務和內容、訪問它們并進行支付。現在,正式可用的Amazon WAF AI流量變現功能則處理了提供商端的需求,使內容所有者能夠控制Agent訪問:可以選擇屏蔽、放行或收費。由于這兩種功能都在同一個平臺上運行,使用Amazon WAF的提供商會自動識別在Amazon Bedrock AgentCore上驗證的Agent。最終形成一個可信通道:經驗證的Agent享有更低的接入摩擦,內容提供方則獲得相應報酬。這兩項能力共同構建了Agent經濟雙邊基礎設施,讓Agent能夠觸達所有信息——而不僅僅是那些恰好免費的內容。
從每次交互中學習的Agent
提升Agent的知識獲取能力只是問題的一方面。企業還需要了解Agent是否真正達成了目標,并在表現不佳時及時發現問題。
這聽起來容易做起來難。最危險的Agent故障不是那些拋出錯誤的故障,而是那些在儀表盤上看起來正常的故障:一個確認了從未執行過的訂單修改的Agent,一個在API超時時虛構產品可用性的Agent,或者另一個跳過了審批步驟但在儀表盤上顯示99%成功率的Agent。這些故障不會產生錯誤信號。它們在幾周后通過客戶投訴暴露出來,此時通常已經影響了數千個會話。即便團隊察覺到存在問題,修復工作也大多依賴猜測:調整提示詞、修改工具描述、微調編排邏輯,最后只能寄希望于改動有效,沒有系統化的方法可以驗證改動是否真的優化了效果,或是悄悄引發了其他問題。
現在,亞馬遜云科技宣布了Amazon Bedrock AgentCore中推出全新的優化功能,將生產追蹤轉化為持續改進。它們共同形成了一個閉環:理解Agent的實際行為,生成基于數據的修復方案,在發布前對其進行驗證,并證明其有效性。
理解Agent的行為:Insight洞察功能現已提供預覽版,AgentCore可在數百個會話中提供豐富的故障、意圖和軌跡洞察,暴露出任何儀表盤或逐個追蹤審查都無法發現的模式。故障洞察可以發現循環往復的故障模式,包括不產生錯誤信號的隱蔽行為故障,詳細解釋每個故障的根本原因,并根據受影響的廣泛程度進行排序,從而使人能一眼看出哪些問題對用戶的傷害最大并優先予以修復。意圖洞察可以根據用戶的實際意圖對請求進行聚類,從而能看到Agent被使用的真實形態。軌跡洞察對Agent完成任務所采取的路徑進行分組,以便能夠發現常見模式和異常值。可以通過每日或每周報告啟用持續監控,或者在部署后或投訴激增時進行針對性調查,在幾分鐘內即可獲得結果。
充滿信心地修復:一旦知道要更改什么,正式可用的建議功能和A/B測試功能將幫助團隊采取行動。建議功能通過分析追蹤和評估輸出來提出針對系統提示詞和工具描述的具體改進建議,這些建議基于Agent的實際行為。批量評估針對定義的測試數據集測試這些建議并報告總體得分,從而在更改進入生產環境之前捕獲回歸。A/B測試通過分流實時生產流量,在Agent版本之間進行受控的對比,在最終確定采用前,提供更改在生產環境條件下有效的真實證據。無論Agent在哪里運行,所有這些都可以發揮作用:在Amazon Bedrock AgentCore的運行時、Amazon Lambda、Amazon EKS或非亞馬遜云科技環境中。
FUJISOFT的AI推廣部高級經理Kazumi Matsuda表示:"在FUJISOFT,我們正在構建AI Agent以加速軟件開發和運營。我們的框架Character Capsule將Agent角色、技能和程序打包為可重用的膠囊,既可在Copilot和Kiro等本地編碼工具上運行,也可擴展到Amazon Bedrock AgentCore上進行多Agent編排。隨著我們部署更多Agent,我們面臨的最大挑戰是那些看起來不錯但隨后浮出水面的隱性故障,修復它們只能靠猜測。Amazon Bedrock AgentCore中的優化功能改變了這一點。它們分析我們的生產追蹤以揭示故障模式,解釋它們發生的原因,并按影響對它們進行排序。然后我們會得到改進提示詞和工具描述的建議,并在提交之前在實時流量上對它們進行A/B測試。Agent改進現在是一個建立在數據基礎上的持續循環,而不是反復試驗。"
隨著Agent能力增強,管控也需同步升級:全新策略增強功能
能力越強的Agent意味著越大的攻擊面。而且Agent帶來了傳統軟件從未有過的安全挑戰:它們是概率性的。Agent會做出判斷,而判斷可以被上下文所影響。新的風險暴露點不再是網絡,而是Agent的上下文,提示詞注入和記憶投毒不需要入侵系統,只需要說服agent做出一個錯誤判斷。
安全保障概率性事物的方法是使用確定性的事物:不是作為大腦,而是作為它周圍的護欄。Amazon Bedrock AgentCore中的Policy策略功能已經在網關處提供了實時的確定性控制,定義了Agent可以使用企業的工具和數據做什么或不能做什么。現在,亞馬遜云科技通過Amazon Bedrock Guardrails集成擴展了這些功能,并已正式可用,它會評估每個Agent操作以防止提示詞注入嘗試、有害內容和敏感數據暴露。這些檢查在網關層運行,在Agent代碼之外,Agent無法在其上下文中看到它們,無法繞過它們進行推理,也無法說服自己它們不適用。
Guardrails是策略引擎可采取行動的眾多檢測信號中的第一個,并且它將不僅僅是平臺自有的信號。近期,AgentCore將允許將來自領先安全提供商(包括CheckPoint、Zscaler、Rubrik、Netskope和SentinelOne)的檢測信號輸入到相同的策略中。無論信號來自何處,原則都保持一致:檢測可以是概率性的,但策略執行始終是確定性的,即基于既定閾值做出最終的允許或拒絕決定。
由于Amazon Bedrock AgentCore上的每個工具和上下文源都通過網關路由,因此Agent獲得的新功能會自動受到同一安全層的約束。更強大的Agent,更嚴格的控制,兩者同步擴展。
幾分鐘內從想法到運行中的Agent:Amazon Bedrock AgentCore harness運行環境正式可用
Agent不僅僅是一個模型。如果模型是大腦,那么Harness運行環境就是身體:大腦完成工作所需的一切。它運行編排閉環、執行工具、管理上下文窗口、跨輪次持久化狀態、從故障中恢復并隔離每個會話。Harness對Agent性能表現的影響與模型同樣重要。構建一個耐用的Harness是目前大多數團隊花費時間最多的地方。
現已正式可用的Amazon Bedrock AgentCore harness為企業提供了運行環境層的托管功能。無需為整個運行流程編寫代碼,而是通過配置來定義Agent:其使用的模型、調用的工具、可以訪問的技能以及遵循的指令。AgentCore會動態組裝并驅動這一執行流程。通過該單一配置,企業可以在幾分鐘內獲得一個在自身隔離環境中運行的、可工作的Agent。它配備了文件系統和Shell、跨會話的記憶、Skills(包含亞馬遜云科技官方精選的Skills目錄),以及網頁瀏覽功能。這并不是一個會隨著業務規模擴大而淘汰的初學者工具:開始時使用的配置就是大規模運營時使用的配置,當需要自定義編排時,可以將Harness導出為代碼并保持在相同的平臺上,而無需重新構建任何內容。
除了速度,它真正釋放的是市場上尚不存在的選擇自由。當前可用的Harness方案都會讓企業被綁定在某個環節:開源方案需要自行托管和運維Harness;托管服務會將企業鎖定在它們的環境中;模型廠商提供的Harness則只針對自家模型做了優化。而亞馬遜云科技將Harness與模型解耦,讓企業可以選擇任意模型,甚至在會話中途切換,而無需改動Agent邏輯。當前沿技術不斷推進、最適合某項任務的模型發生變化時,企業的Agent基礎架構巋然不動。
選擇只是一部分。由于Harness是單一平臺的一個組成部分,而不是包裹在框架周圍的托管層,因此它在調用工具時,都會通過同一個網關進行路由——該網關不僅強力執行安全策略,同時也將Agent連接至企業知識、網絡通識和付費知識。身份、記憶和可觀測性都來自這同一個平臺,因此Agent采取的每項操作都從第一次調用開始受到治理和追蹤,無需額外的線路連接。企業在第一天聲明的Agent就是第一千天運行的Agent,自始至終建立在相同的基礎之上。
Twilio產品副總裁Omar Paul表示:"Twilio的客戶正在構建跨越語音、消息傳遞和數字渠道的AI Agent,具有實時智能和持久記憶,使每次交互感覺都像是在對話。通過將Amazon Bedrock AgentCore harness與Twilio Conversations相結合,開發人員可以從構思直接過渡到實時Agent,而無需重新搭建基礎設施。當出色的AI和出色的通信基礎設施一起構建時,就能帶來最佳的客戶體驗。"
開始使用
Harness運行環境托管功能、Managed Knowledge Base功能、Web Search功能、Guardrails集成功能、建議和A/B測試功能,均已在Amazon Bedrock AgentCore上正式可用,同時Insights洞察功能和支付功能也已推出預覽版。用戶可以通過控制臺或AgentCore CLI開始使用上述新功能,更多詳情請訪問官方文檔。