2026-04-01 19:34:04
當前,隨著AI應(yīng)用從訓練邁向推理,存儲的核心定位正在發(fā)生根本性轉(zhuǎn)變:在訓練時代,存儲是算力的“倉庫”;而在推理時代,存儲正成為算力的“加速器”。
每經(jīng)記者|王晶 每經(jīng)編輯|楊軍
近日,“內(nèi)存條價格下跌”的話題備受關(guān)注,一度被解讀為持續(xù)數(shù)月的存儲漲價勢頭出現(xiàn)逆轉(zhuǎn)。那么,存儲價格真的“崩了”嗎?4月1日,《每日經(jīng)濟新聞》記者走訪深圳華強北一探究竟。
“現(xiàn)在價格太亂了,一天一個價,但這幾天是最便宜的時候?!币晃蝗A強北商家說道。據(jù)多位商家報價,16GB DDR4(第四代雙倍數(shù)據(jù)率同步動態(tài)隨機存取存儲器)內(nèi)存條已回落至600元~800元區(qū)間,DDR5價格也較前期高點1600元下降至1300元~1500元,部分DIY裝機套裝價格較高點下降千元以上,不少消費者趁機升級配置。另一位商家補充道:“有些渠道商之前囤了貨,現(xiàn)在降價做資金回籠,他們在300多元低點的時候囤的,現(xiàn)在哪怕賣600多元也賺?!?/p>
不過,這輪降價并未蔓延至整個存儲行業(yè)。記者從多家存儲廠商、行業(yè)機構(gòu)了解到,本輪價格回落主要集中在消費級DDR4、DDR5現(xiàn)貨及渠道零售市場,而原廠顆粒合約價、HBM(高帶寬內(nèi)存)、服務(wù)器用DDR5及企業(yè)級SSD(固態(tài)硬盤)等產(chǎn)品價格仍維持高位?!白蛱?,我見了二三十組客戶,都在問我還有沒有貨?!薄坝泻芏嗳孙w到公司來找我們要貨,什么類型的客戶都有?!笨梢钥吹剑葾I(人工智能)、數(shù)據(jù)中心需求主導的存儲產(chǎn)品是另外一番“景象”。
消費級市場“降價”與企業(yè)級市場“缺貨”同時上演,這種分化背后是產(chǎn)業(yè)邏輯正在發(fā)生變化。過去幾十年里,存儲一直被視為典型的周期性行業(yè),它隨著手機、PC(個人電腦)、數(shù)據(jù)中心起起落落,但AI出現(xiàn)后,這套邏輯正在被打破,存儲正從物料清單中的普通成本項轉(zhuǎn)變成AI競賽的戰(zhàn)略資源,當前,算力的增長已超過存儲帶寬所帶來的支撐限度,這意味著海量模型參數(shù)和上下文只能通過一個相對狹窄的“漏斗口”——即存儲帶寬進行傳輸,GPU(圖形處理器)頻繁等待,規(guī)模算力集群可用度大致在50%左右。
這種“算力等存儲”的瓶頸直接推高了AI(人工智能)場景下的存儲需求?!?026年全球沒有任何一款主流的AI存儲產(chǎn)品能實現(xiàn)供需完全平衡。存儲行業(yè)的焦點已經(jīng)從‘看誰更便宜’轉(zhuǎn)向‘看誰能拿到貨’?!盋FM閃存市場總經(jīng)理邰煒在日前舉辦的MemoryS2026峰會上表示。他用一句話總結(jié)當下:AI算力有多熱,存儲就有多緊缺。

圖片來源:每經(jīng)記者 王晶 攝
持續(xù)數(shù)月走高的內(nèi)存價格,近期在消費級市場迎來了回落。CFM閃存市場提供的數(shù)據(jù)顯示,近期貿(mào)易端低端DDR4內(nèi)存條拋售較多,沖擊和打壓了渠道市場?!氨局芮繢DR4內(nèi)存條領(lǐng)跌,尤其是8GB/16GB DDR4內(nèi)存條價格跌幅高達25%,32GB DDR4及DDR5跌幅在10%上下區(qū)間;渠道SSD也出現(xiàn)小幅下跌?!?/p>
不過,華強北賣家認為:“后面DDR4的價格很快又要漲回去,畢竟存儲廠都沒有降價,現(xiàn)在DDR4的出廠價在900元左右,市場價七八百元反而更便宜。”
價格倒掛現(xiàn)象的背后,是存儲芯片兩種采購方式的差異。頭部大型電子制造企業(yè)依托規(guī)?;少弮?yōu)勢,主要向存儲芯片原廠(主要是SK海力士、三星電子、美光科技)直接訂貨,或通過原廠授權(quán)代理商拿貨,結(jié)算采用合約價;而數(shù)量眾多的中小微電子設(shè)備企業(yè),因采購規(guī)模小、需求靈活且分散,大多從現(xiàn)貨交易市場采購,拿貨價格也以隨行就市的現(xiàn)貨價為準。這一輪下跌的,正是現(xiàn)貨市場的價格。這兩大類市場存在顯著不同,前者有相對較高的議價能力,后者則受現(xiàn)貨存儲賣家和消費類用戶的承受能力和情緒影響而波動。
然而,消費級市場的降溫,并未傳導至企業(yè)級和AI服務(wù)器相關(guān)存儲領(lǐng)域,相關(guān)需求依然保持強勁?!敖?,有剛從原廠下線的產(chǎn)品就立刻插到客戶服務(wù)器中,這在以往是不可想象的?!臂樥f道。
從合約市場來看,TrendForce集邦咨詢最新發(fā)布的存儲器價格調(diào)查顯示,盡管終端市場面臨出貨下修風險,但2026年第二季因DRAM原廠積極將產(chǎn)能轉(zhuǎn)向HBM、Server應(yīng)用,預(yù)估DRAM合約價格仍將季增58%~63%。NAND Flash市場持續(xù)由AI、數(shù)據(jù)中心需求主導,全產(chǎn)品線連鎖漲價的效應(yīng)不減,預(yù)計第二季整體合約價格將季增70%~75%。
當前,隨著AI應(yīng)用從訓練邁向推理,存儲的核心定位正在發(fā)生根本性轉(zhuǎn)變:在訓練時代,存儲是算力的“倉庫”;而在推理時代,存儲正成為算力的“加速器”。
存儲的重要性也隨之發(fā)生變化。在傳統(tǒng)架構(gòu)中,CPU(中央處理器)或GPU決定性能上限,存儲負責“跟上”;而在AI架構(gòu)中,存儲帶寬與延遲開始反過來制約算力釋放效率。這也是為什么行業(yè)內(nèi)部已經(jīng)形成一個共識:AI不是單一應(yīng)用,而是所有行業(yè)的底層操作系統(tǒng),存儲是這個操作系統(tǒng)的基礎(chǔ)設(shè)施。
“今年全球半導體存儲器的市場規(guī)模將突破6000億美元,數(shù)倍于以往的任何時候?!臂樥f道。
需求的變化首先來自數(shù)據(jù)生成方式的轉(zhuǎn)變。過去,數(shù)據(jù)是由人來創(chuàng)造的,比如拍照片、視頻、做文檔等,但AI時代,數(shù)據(jù)是各類大模型生產(chǎn)的,并且模型參數(shù)越來越大、多模態(tài)數(shù)據(jù)越來越多、訓練和推理持續(xù)運行。
這一變化直接拉動了基礎(chǔ)設(shè)施需求。行業(yè)數(shù)據(jù)顯示,一臺AI服務(wù)器對內(nèi)存與存儲的需求遠高于傳統(tǒng)服務(wù)器。其中,服務(wù)器內(nèi)存需求增速預(yù)計超過40%,在整體存儲應(yīng)用中的占比將超過50%。
更深層的變化則體現(xiàn)在需求結(jié)構(gòu)上。事實上,AI在推理過程中需要存儲大量中間狀態(tài)(KV Cache,鍵—值緩存機制)以避免重復計算。當上下文長度從4K token(詞元)提升至128K token時,KV緩存的存儲空間直接增長32倍;如果是高并發(fā)場景下,KV緩存需求甚至會達到TB(太字節(jié),1TB = 1024GB ?)級規(guī)模。
在此背景下,傳統(tǒng)以DRAM(動態(tài)隨機存取存儲器?)和HBM為核心的存儲體系面臨容量與成本瓶頸,大量數(shù)據(jù)開始向NVMe SSD( 可以理解為“新一代高速固態(tài)硬盤”)遷移,企業(yè)級SSD(eSSD)由此成為AI基礎(chǔ)設(shè)施中的關(guān)鍵環(huán)節(jié)。邰煒指出:“針對AI推理工作負載優(yōu)化的SSD需求快速上漲;同時,因傳統(tǒng)硬盤產(chǎn)能缺口,QLC SSD(四層單元固態(tài)硬盤)的替代需求也不斷上升。這些因素疊加,讓eSSD成為2026年NAND閃存最大的應(yīng)用市場。”
與此同時,應(yīng)用側(cè)也在進一步放大這一趨勢。長江存儲固態(tài)硬盤事業(yè)部負責人譚弘以當下最火的“養(yǎng)龍蝦”舉例稱:“‘龍蝦’是AI Agent(人工智能體)的首個殺手級應(yīng)用,未來可能改變手機、電腦等智能終端設(shè)備的交互方式,相當于給每個人都配備一個懂你的24小時無休的秘書。同時,‘龍蝦’也引發(fā)用戶從單一指令提問大模型,轉(zhuǎn)變到深度理解客戶深層需求后的連續(xù)指令。不過,‘養(yǎng)蝦’token消耗量與AI大模型進行多輪對話相比,高達15倍,這對端側(cè)的cSSD(客戶端固態(tài)硬盤,也是人們常說的消費級SSD)及云端eSSD(SSD中的一個專門類別,面向數(shù)據(jù)中心和服務(wù)器等企業(yè)場景)都提出了更高的要求?!?/p>
從訓練階段來看,核心痛點是成本高昂。簡單來說,訓練大模型就像反復“打磨一件精密儀器”,需要不斷讀取和保存中間結(jié)果(Checkpoint,檢查點)。如果存儲速度跟不上,GPU就只能“干等著”,但使用大容量QLC eSSD(四層式存儲單元企業(yè)級固態(tài)硬盤)存放Checkpoint,其在特定場景下的寫入性能和耐久性已接近更貴的TLC eSSD(三層式存儲單元企業(yè)級固態(tài)硬盤),相比傳統(tǒng)HDD(機械硬盤),能為用戶節(jié)省成本。
到了推理階段,挑戰(zhàn)則是“跑得快、跑得多”。就像讓AI幫你寫一篇長篇小說,它需要記住前面寫了什么(即KV Cache),當小說越來越長,需要記的東西可能達到幾百GB,但GPU配置的HBM容量有限又昂貴,根本裝不下。怎么辦?行業(yè)想出的辦法是“分層存儲”——把大部分“記憶”先放到便宜的SSD里作為緩沖,需要時再快速調(diào)出來,這樣既解決了內(nèi)存不夠的問題,又保證了速度。至此,企業(yè)級eSSD已承擔起上下文狀態(tài)管理和知識查閱的功能,不再是單純的數(shù)據(jù)倉庫,而是成為存算協(xié)同的數(shù)據(jù)引擎。

圖片來源:每經(jīng)記者 王晶 攝
在AI需求快速擴張的同時,供給端卻沒有同步響應(yīng),這也導致當前面向AI的存儲產(chǎn)品缺貨。
邰煒認為,目前存儲原廠的發(fā)展有兩個趨勢。首先是供給的“選擇性傾斜”,在AI需求爆發(fā)后,優(yōu)先保障高端AI產(chǎn)品的產(chǎn)能,這意味著HBM、DDR5、企業(yè)級SSD優(yōu)先,保障更大的利潤;消費級NAND與DRAM被壓縮,同時成熟制程產(chǎn)品供給下降;另一方面,此前經(jīng)歷多輪周期波動后,原廠普遍吸取歷史教訓,采取更為謹慎的資本開支策略。整體來看,行業(yè)控制產(chǎn)能擴張節(jié)奏,提高高附加值產(chǎn)品占比,供給彈性下降。
存儲行業(yè)具有明顯的產(chǎn)能建設(shè)周期,一般需要18個月至24個月才能形成有效供給。這意味著2025年需求爆發(fā),最早2027年才能看到供給改善,在此期間,供給缺口難以彌補。邰煒判斷:2026年,全球沒有任何一款主流的AI存儲產(chǎn)品能實現(xiàn)供需完全平衡。
供需錯配之下,價格快速上漲,并且成本壓力正加速向終端傳導。僅3月份,包括三星、vivo、OPPO、一加等在內(nèi)的多家廠商對旗艦機型價格上調(diào)數(shù)百元至千元不等。其中,一加對日前發(fā)布的一加15T上漲900元~1200元的漲價行為引發(fā)關(guān)注,有網(wǎng)友在一加中國區(qū)總裁李杰的微博下留言表達不滿。
李杰隨后就價格上漲進行回應(yīng):“這一輪內(nèi)存成本的上漲幅度超過400%,可以說漲瘋了,不同品牌之間,更多只是庫存節(jié)奏的差異,本質(zhì)上是時間早晚的問題。從目前的趨勢看,接下來一段時間,整體價格只會越來越高?!?/p>
漲價正重創(chuàng)終端需求。邰煒預(yù)計,2026年全球智能手機出貨量將出現(xiàn)10%至15%的下滑,部分廠商降幅可能更高。
企業(yè)端的漲價同樣猛烈。“Flash(閃速存儲器)從1月到現(xiàn)在漲的都快翻倍了,某一天我接個電話,價格直接漲50%,不是1塊錢的50%,是24塊錢的50%,市場怎么吃得消?并且漲了50%之后,又說下個月再漲25%。這種情況底下模組公司有庫存很棒,但是庫存用完之后,買貴、賣貴的時候怎么辦?”SSD第三方主控大廠群聯(lián)CEO(首席執(zhí)行官)潘健成的一番話,道出了存儲廠商對漲價過快的擔憂。
CFM閃存市場數(shù)據(jù)顯示,今年一季度原廠服務(wù)器及PC NAND、DRAM合約價均呈翻倍式增長,而mobile(移動電話所使用的存儲芯片)價格漲幅卻不及以上兩大應(yīng)用市場,使其與服務(wù)器、PC存儲產(chǎn)品合約價差逐步擴大。該機構(gòu)預(yù)計,今年第二季度mobile合約價將大幅補漲,以追趕其他應(yīng)用端存儲價格并縮小價差至合理范圍。Mobile NAND、DRAM合約價或?qū)⒋蠓鶟q超85%;服務(wù)器、PC價格漲幅則收斂,預(yù)計服務(wù)器、PC DRAM合約價均漲超30%,eSSD、cSSD ASP(平均售價)價格漲幅分別超30%、50%。

圖片來源:每經(jīng)記者 王晶 攝
面對如此猛烈的漲價,產(chǎn)業(yè)鏈上下游都在尋找出路,如何在成本與性能之間找到新的平衡點,已成為行業(yè)最迫切的課題。
谷歌似乎為行業(yè)難題提供了新的解法,公司日前發(fā)布的新型壓縮算法 “TurboQuant”,號稱可在不損失模型精度的情況下,將大語言模型運行時的鍵值緩存內(nèi)存占用進行大幅壓縮。
不過,在潘健成看來,谷歌的技術(shù)非但不會減少存儲需求,反而會產(chǎn)生更多的token?!叭绻麤]有這個技術(shù),主機需要用到大量的DRAM和SSD,成本高、買不到,出貨規(guī)模自然受限。但技術(shù)讓成本降下來之后,設(shè)備出貨量會顯著增加,反而帶來更大的數(shù)據(jù)生成與存儲需求?!?/p>
他用一個比喻解釋:如果一輛汽車的引擎要100萬美元,全世界的車不會太多;但當引擎降到2000美元時,滿大街都是汽車。同理,谷歌技術(shù)應(yīng)用之后,成本下降、設(shè)備普及,產(chǎn)生的token只會更多,存儲需求反而更旺盛。
除了算法層面的壓縮技術(shù),群聯(lián)也在探索另一條路——推出全球獨家專利“用Flash彌補DRAM不足”的技術(shù)aiDAPTIV方案。由于DRAM成本高、容量有限,而AI推理對內(nèi)存需求巨大,群聯(lián)通過軟硬件協(xié)同,將Flash引入內(nèi)存體系,從而降低成本并提升系統(tǒng)可擴展性。
據(jù)群聯(lián)測算,在本地運行120B的模型,需要96GB DRAM,成本高達1500美元,堪比一臺高端筆記本的售價,而自己的方案可以讓成本大幅降低?!霸谖磥砗芏痰臅r間里,筆記本PC的標配一定會附加群聯(lián)電子的方案,讓AI可以在本地做部署,并且還會變成標準方案。”潘健成說道。
其他廠商也在推動端側(cè)落地。江波龍的HLC(High Level Cache,高級緩存技術(shù))技術(shù),可以讓4GB DDR實現(xiàn)接近6GB/8GB DDR的水平,降低終端DRAM容量需求并優(yōu)化BOM(物料清單)成本。
當存儲的價值被重新定義,產(chǎn)業(yè)鏈上下游的分工也在悄然重塑。潘健成直言,面對存儲短缺和價格上漲,單純的買賣關(guān)系已經(jīng)失效,主控與模組之間的傳統(tǒng)分工也正在被打破?!爸骺匦酒粧赍X,模組公司靠低價庫存發(fā)財,但好日子總有盡頭。主控要投進先進工藝,我們的一顆主控前前后后投資了2.8億美元,其中單做驗證,成本就花9000萬美金,所以主控公司要把產(chǎn)品做好,要有模組的驗證能力,接下來,模組公司和主控公司應(yīng)該‘并一并’,各取所需,產(chǎn)業(yè)才能走向健康。”
如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟新聞APP