首頁>專題>科技中國 使命擔(dān)當(dāng)>要聞
DeepSeek進(jìn)入“國家隊(duì)”:加速國產(chǎn)AI技術(shù)生態(tài)發(fā)展與普及
近日,深度求索(DeepSeek)旗下DeepSeek-R1、V3、Coder等全系列大模型正式接入國家超算互聯(lián)網(wǎng)平臺。據(jù)介紹,DeepSeek-R1專注于自然語言處理,具備強(qiáng)大的文本生成能力;DeepSeek-V3聚焦于圖像生成,能夠生成高分辨率和細(xì)節(jié)豐富的圖像,適用于廣告、藝術(shù)創(chuàng)作等多個場景;DeepSeek-Coder是一款代碼生成模型,能夠協(xié)助開發(fā)者快速構(gòu)建程序,提高開發(fā)效率。
超算互聯(lián)網(wǎng)是以互聯(lián)網(wǎng)思維運(yùn)營超算中心,并連接產(chǎn)業(yè)生態(tài)中的算力供給、應(yīng)用開發(fā)、運(yùn)營服務(wù)、用戶等各方能力和資源,構(gòu)建一體化超算算力網(wǎng)絡(luò)和服務(wù)平臺。其目標(biāo)是緊密連接供需雙方,通過市場化的運(yùn)營和服務(wù)體系,實(shí)現(xiàn)算力資源統(tǒng)籌調(diào)度,降低超算應(yīng)用門檻,并帶動計算技術(shù)向更高水平發(fā)展,推動自主核心軟硬件技術(shù)深度應(yīng)用,輻射帶動自主可控產(chǎn)業(yè)生態(tài)的發(fā)展與成熟。
為促進(jìn)超算算力一體化運(yùn)營、打造國家算力底座,國家超算互聯(lián)網(wǎng)平臺去年4月正式上線,覆蓋科學(xué)計算、工業(yè)仿真、人工智能(AI)模型訓(xùn)練等各個領(lǐng)域。
記者從國家超算互聯(lián)網(wǎng)平臺了解到,截至今年1月,平臺上已有各類算力商品超6500款,其中模型服務(wù)近240款,既有DeepSeek、Qwen等國內(nèi)開源大模型,也有Llama、Stable Diffusion、Gemma、Mistral、StarCoder、ChatGLM等國外開源模型。
對于DeepSeek的上線,國家超算互聯(lián)網(wǎng)平臺相關(guān)負(fù)責(zé)人表示,先進(jìn)的國產(chǎn)AI技術(shù)與國家級綜合算力服務(wù)平臺融合,是加速國產(chǎn)AI技術(shù)生態(tài)發(fā)展與普及的前沿實(shí)踐,其將在市場、技術(shù)、創(chuàng)新、產(chǎn)品及用戶方面推動AI技術(shù)生態(tài)創(chuàng)新及成果落地,促進(jìn)AI+的多樣化,推動中國乃至全球AI市場的應(yīng)用落地和產(chǎn)業(yè)化進(jìn)程。通過國家超算互聯(lián)網(wǎng)平臺,用戶無需本地下載,可在線部署、推理、定制化訓(xùn)練與開發(fā)DeepSeek等國內(nèi)外知名開源大模型,降低了AI技術(shù)使用門檻。與此同時,算力服務(wù)的普惠性也得到提升,國家超算互聯(lián)網(wǎng)平臺依托國產(chǎn)深算智能加速卡與全國一體化算力服務(wù)體系,為DeepSeek等模型提供豐富的異構(gòu)算力資源,為國產(chǎn)AI應(yīng)用與創(chuàng)新提供持續(xù)算力保障。
DeepSeek系列模型在性能上與世界頂尖的大模型不相上下,但在成本上卻具有顯著優(yōu)勢。DeepSeek系列通過算法優(yōu)化顯著降低計算資源消耗,結(jié)合國家超算互聯(lián)網(wǎng)平臺“普惠易用、豐富好用”的能力,使得更多企業(yè)和用戶能夠負(fù)擔(dān)得起AI技術(shù)的應(yīng)用,加速AI技術(shù)普及。
業(yè)界普遍認(rèn)為,DeepSeek模型在超算互聯(lián)網(wǎng)平臺的規(guī)?;涞?,或?qū)⒏淖儑鴥?nèi)AI行業(yè)依賴海外閉源模型的現(xiàn)狀。
編輯:馬嘉悅