近日,華為聯合上海交通大學、西安交通大學、廈門大學,在“2025AI容器應用落地與發展論壇”上正式發佈並開源AI容器技術Flex:ai。這一技術旨在通過虛擬化與資源池化,實現算力資源的精細化管理與智能調度,推動AI從“高大上”走向“平民化”。
        “光靠華為公司的軟體工程師的力量是遠遠難以完成AI行業化落地的。”華為公司副總裁、數據存儲產品線總裁周躍峰在發佈儀式上坦言。為此,華為將Flex:ai全棧技術開源,並聯合三所高校持續迭代。劉淼進一步闡述了開源路徑:“開源模組包括智能調度器與算力虛擬化組件,支持與Kubernetes等主流框架集成。未來我們將推動南向異構算力相容,構建標準化介面。”戚正偉指出,開源能加速技術普及與生態共建:“RunAI等方案受限於商業合作與硬體綁定,而Flex:ai面向異構硬體開放,更具通用性。”張一鳴透露,廈門大學已在佈局拓撲感知調度、推理負載優化等後續研究方向,推動Flex:ai在複雜場景中落地。
        華為2012實驗室理論研究部首席研究員張弓從底層技術挑戰切入,指出企業部署AI推理面臨“高服務品質與低資源利用率”的根本矛盾。“以醫院為例,白天推理伺服器負載峰值,夜間閒置,資源利用率極低。”張弓表示,“要實現動態擴縮、任務遷移與細粒度資源分配,需突破三大技術:保序流圖、細粒度資源隔離與安全點協議。”他分享了初步實驗結果:通過算子劫持、狀態同步與分層調度,在單卡場景下實現故障遷移與性能隔離,開銷控制在5%以內。“但跨節點遷移與大規模集群調度仍是待攻克難點。”張弓坦言。(來源: 鳳凰網)