AI 正在進入一個時代,只有推理效能與安全性同時出色,才能真正滿足客戶期待。在不斷演變的代幣經濟時代,AI 基礎設施早已不只是追求原始算力。您需要將推理能力從雲端延伸到邊緣資料中心進行有序管理、強化安全,並順利實現擴展。如果您正在打造生成式 AI 與推理平台,就必須儘快提升 GPU 使用率、擴展 Token 處理能力、降低延遲,並為 AI 基礎設施的每一層加固防護。
我們藉由 NVIDIA Cloud Partner(NCP)參考架構來擴展推理能力,協助您解決這些挑戰。這份關鍵藍圖展示了業界領先的 AI 雲端供應商如何設計、建構並營運 GPU 加速的基礎設施。參考架構融合了運算、網路、儲存與安全等領域的頂尖技術,協助 NVIDIA Cloud Partner 高效且可靠地為你大規模交付高效能 AI 服務。
我們將 F5 的能力與 NVIDIA 雲合作夥伴的參考架構有機結合,為您推動建立全新的帳本體系,讓代幣吞吐量、單價、延遲、能效與安全真正成為核心要素。
透過雙方合作,F5 BIG-IP 在 NVIDIA 生態系統中為您提供安全且高吞吐量的推理能力,並扮演關鍵角色。
F5 正在與 NVIDIA 深度整合網路、安全與應用交付能力,全面賦能智慧化、基於 Token 的 AI 平台。我們正重新定義大規模運行 AI 的標準,助你獲得新代幣經濟所需的速度、防護與智能。
NCP 參考架構:助力打造 AI 雲端基礎
NCP 參考架構為您部署 AI 雲提供了完整框架。我們將 NVIDIA 的加速運算、網路與軟體能力與領先的生態系合作夥伴技術整合,讓您能在雲端中高效擴展並安全運行 AI 解決方案。
在這個架構中,F5 BIG-IP 為 GPU 支援的 AI 工作負載提供先進的流量管理、零信任安全、豐富服務與可觀測性,協助您高效、自信地部署、擴展並保護推理服務。
Token 經濟的快速發展與 NCP 參考架構
對於 AI 雲端供應商與企業而言,Token 已成為新的價值單位——您需要關注吞吐量、總延遲、首個 Token 抵達時間、能效,以及每個 Token 的成本。您必須依靠強大的基礎設施,將使用者與 GPU 集群高效連結,才能取得成功。要順利交付高效能 AI 服務,您需要讓流量導向、防護、可觀測性、多租戶支援與策略執行都能以線速運作,避免任何瓶頸。
NCP 參考架構為這份藍圖提供了標準。它明確了主權雲與 AI 雲在運算、網路、儲存、遙測與安全方面如何實現互聯。NVIDIA BlueField-3 DPU 是這些架構中支援南北向流量的核心元件。
F5 以一流的網路基礎設施推動者身分加入多雲生態系統,將網路、安全與 AI 感知控制直接整合進參考架構中。
F5:為你賦能 NCP AI 雲,加速實現高效能、安全與高效率營運
F5 已憑藉與 NVIDIA 技術的深度整合取得卓越成果。2025 年 4 月,F5 宣布採用 NVIDIA BlueField-3 DPU 加速的 F5 BIG-IP Next for Kubernetes 全面上市。您可以將網路處理、安全控制與流量智慧完全卸載至 DPU,使 CPU 能更專注於執行業務應用。SoftBank 作為近期完成雲端概念驗證(PoC)測試的 NCP,取得了優異的效能結果。
F5 BIG-IP 不僅具備強大效能,也能全面滿足 NCP 的營運需求。您可以透過一次操作實現統一出入口策略控制、服務網格、分散式阻斷服務攻擊(DDoS)防護、零信任安全、API 保護、工作負載隔離,以及多租戶可觀測性。
在合作過程中,我們優化了大型語言模型(LLM)的路由邏輯、基於 Token 的流量計量與管理,並支援 模型上下文協議(MCP),讓你在資料路徑上擁有更強的掌控力與智慧化能力。
透過支援 NCP 參考架構,BIG-IP 已成為 AI 雲建設、部署與治理體系中的核心組成部分。
讓你提升 AI 處理效率:Token 處理量提升 30%,TTFT 加速 60%
早期驗證結果非常具有說服力。當我們將 F5 BIG-IP 服務與 NVIDIA 加速運算平台聯合部署時,您的 Token 生成速度提升超過 30%,首次 Token 生成時間(TTFT)縮短了 60%。
這些提升讓您能獲得更長、更智慧的回應、更快的推理速度,同時將每個 Token 的成本降低 30%。搭配更高的每瓦 Token 數,生態系統整合進一步優化效能與能效,這對 AI 時代的新成本結構至關重要。
作為雲端客戶,您使用 NCP 能獲得顯著優勢:加速實現商業價值、降低營運成本,並在各種部署模型中全面優化使用者體驗。
您獲得的成果早已超越小幅改善——AI 雲正讓您在服務交付、防護與價值變現方面實現結構性的躍升。
F5 在 NCP 參考架構中的三大核心支柱
F5 納入 NCP 參考架構後,我們將協助您在部署 AI 服務時提升效能、加強安全並拓展功能,涵蓋以下關鍵領域:
1. 性能提升:專為代幣經濟打造
F5 BIG-IP 能與您的 NVIDIA GPU、DPU、網路架構,以及軟體平台組件(如 NVIDIA Dynamo、NVIDIA NIM)無縫整合,最大化 AI 推理吞吐量。我們透過 F5 的解決方案優化請求路由、負載平衡與推理效率,協助你消除瓶頸,讓每個集群每秒輸出更多 Token。
在每個Token 都會影響收入與模型準確性的環境中,您能藉由這些提升獲得更高的生產力、更快速的回應與更強的獲利能力。F5 與 NVIDIA 攜手,充分釋放加速型基礎設施在新興代幣經濟中的潛力,讓效率與性能成為推動業務成果的核心動力。
2. 重新定義 AI 推理安全
大規模 AI 推理帶來新的攻擊面,包括資料暴露、模型端點濫用等。F5 憑藉深厚的應用安全與策略管控能力,將多層次防護無縫整合進 NVIDIA 參考架構,全面守護 GPU 雲端,從核心延伸至邊緣。
包括以下內容:
- 提供推理 API 的高階 DDoS 防護與彈性流量防護
- 在各種環境中為你落實零信任與基於策略的身分控管
- 提供完整的第七層防火牆與 MCP 安全性,確保端到端流量完整性
- 提供全面的資料保護,協助你符合全球合規與隱私標準
我們為您打造值得信賴的 AI 架構,兼顧性能與安全,讓您在確保安全與合規的前提下,自信擴展 NCP 服務。
3. 功能增強與 AI 原生管控
F5 與 NVIDIA 的合作不僅帶來更高吞吐量與安全能力,也為 GPU 集群引入更全面的控制力、可視性與智慧化增值服務。您能透過 LLM 路由、精細化 Token 管控、彈性可觀測性與具上下文感知的流量調度等功能,實時最佳化工作負載部署與資源利用。
這些功能為 AI 領域導入企業級的應用交付能力,確保您能精準且高效地處理每一個 Token、每一個模型與每一次使用者互動。F5 協助您將複雜轉化為可控,讓傳統應用無縫融入逐步壯大的生成式 AI 世界。
AI 基礎設施的全新帳本
我們將 F5 的能力與 NCP 參考架構深度融合,協助您打造面向未來的新型帳本體系,讓吞吐量、Token 成本、延遲、能效與安全成為 AI 基礎設施設計的核心要素。
在此基礎上,AI 雲端平台能以更可預測的方式擴展、更透明地實現變現,並能隨著模型與工作負載的變化更快速地調整與回應。NCP、企業與主權雲都能依託經過驗證的參考架構,在信任與效能之間取得完美平衡。
F5 不僅是加入 NVIDIA 生態系統——我們正攜手推動Token 經濟的進步,讓每一微秒、每一瓦特、每一個 Token 都真正產生價值。作為實現安全、高效能且具經濟性擴展能力的 AI 基礎設施的重要推動者,F5 正與 NVIDIA 合作,協助你更高效、更快速、更安全、更智慧地生成 Token。
我們期待與您——包括客戶、合作夥伴及各界創新者——攜手共創新一代 AI 服務,實現卓越性能與安全保障。
欲了解更多資訊,歡迎參訪 F5 與 NVIDIA 專屬頁面。
文章來源:F5
本文作者:
Ahmed Guetari
More blogs by Ahmed Guetari
Ash Bhalgat
Senior Director of AI Networking and Security Solutions, Ecosystem, and Marketing
More blogs by Ash Bhalgat
