DeepSeek R1模型本地部署與產(chǎn)品接入實操

02/17 10:17
1626
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

DeepSeek R1模型本地部署與產(chǎn)品接入實操

近期,深度求索(DeepSeek)推出的DeepSeek V3/R1系列模型在人工智能領域掀起了一股熱潮,引發(fā)了廣泛的關注與深入探討。該大模型憑借其卓越的推理能力和對硬件要求的顯著降低,贏得了市場的熱烈反響。DeepSeek的發(fā)布,標志著大模型產(chǎn)品正式邁入“普惠”時代,使得普通個人電腦乃至手機等便攜式設備均能流暢運行大型模型。這一里程碑式的進展,不僅激發(fā)了部署的浪潮,更激發(fā)了人們對大模型潛在應用場景的無限遐想。

DeepSeek之所以備受矚目,不僅在于其技術的先進性,更在于其為用戶提供了前所未有的數(shù)據(jù)隱私與安全保障。在數(shù)據(jù)泄露風險日益嚴峻的今天,DeepSeek的本地化部署方案為用戶提供了一個更為安心的選擇。通過本地部署,所有數(shù)據(jù)運算和存儲均在本地完成,有效規(guī)避了數(shù)據(jù)在傳輸和云端存儲過程中可能面臨的隱私泄露風險。這一特性,使得DeepSeek R1在企業(yè)和個人用戶中均贏得了廣泛的認可與信賴。

自DeepSeek大模型發(fā)布以來,深蕾半導體團隊迅速展開了對DeepSeek大模型的相關研究,并積極探索DeepSeek大模型與SOC全系列產(chǎn)品結合的模式及市場機遇。

本地部署的私有化DeepSeek R1 32B大模型Web頁面訪問
通過本地部署私有化大模型,不僅為用戶提供了更為便捷的訪問途徑,還進一步強化了數(shù)據(jù)的安全性和隱私保護。這一舉措為后續(xù)SOC產(chǎn)品接入DeepSeek大模型降低了整體成本,同時也為企業(yè)內(nèi)部應用DeepSeek大模型實現(xiàn)降本增效提供了堅實基礎。

本地部署的私有化Web頁面訪問DeepSeek R1 32B大模型的截圖

在Web應用頁面中,用戶可以清晰地查看DeepSeek R1 32B模型的運行狀態(tài)、處理結果以及歷史記錄等信息。通過簡單的點擊和輸入操作,用戶即可輕松實現(xiàn)與模型的交互和數(shù)據(jù)處理。此外,該頁面還支持語音交互輸入方式,進一步提升了用戶體驗。

DeepSeek R1 32B模型不僅支持通用知識問答,還具備代碼編寫、邏輯推理等技能:

本地部署的服務器配置信息:

CPU:24核

顯卡:nvidia 3090ti 24g

內(nèi)存:60G

配置信息圖

VS680接入DeepSeek R1 32B模型API展示
我們還在VS680設備上的APP應用中成功接入了DeepSeek R1 32B模型的API。VS680作為一款高性能計算機設備,其強大的計算能力和穩(wěn)定的系統(tǒng)環(huán)境為DeepSeek R1的運行提供了堅實的保障。特別是VS680自帶的7.9T AI算力,為端云結合的應用模式創(chuàng)造了有利條件。

在演示中,我們可以看到VS680設備通過API接口與DeepSeek R1 32B模型實現(xiàn)了無縫連接。用戶只需在設備上輸入相應的指令或數(shù)據(jù),DeepSeek R1模型即可迅速進行運算并返回結果。這一過程中,模型的響應速度、準確性和穩(wěn)定性均得到了充分展現(xiàn)。

VS680接入字節(jié)豆包智能體DeepSeek R1 671B滿血模型展示

在字節(jié)官方火山引擎大模型開發(fā)平臺把“深蕾科技智能體”開發(fā)好,包括DeepSeek R1模型,角色定位,工作流等,然后發(fā)布到豆包應用平臺,就可以在VS680上面直接實現(xiàn)滿血版的DeepSeek R1大模型接入使用。

深蕾科技智能體截圖

DeepSeek大模型與端側SOC的產(chǎn)品結合方案
針對VS680/SL1680系列大算力芯片,我們的研發(fā)團隊正在研究將蒸餾后的輕量級DeepSeek模型(DeepSeek-R1-Distill-Qwen-1.5B)部署到SOC本地,以便應用于相關業(yè)務場景,如產(chǎn)品AI助手(問答服務、產(chǎn)品介紹、產(chǎn)品售后、產(chǎn)品故障排查等)。我們采用端側大模型與云端大模型相結合的方式,本地能處理的用戶任務使用端側大模型快速解決和輸出,而較復雜的邏輯以及聯(lián)網(wǎng)功能則通過請求云端大模型API的方式實現(xiàn)。

針對SL1640/SL1620/SR110系列小算力芯片,我們則通過API接入的方式進行產(chǎn)品賦能,如不帶屏語音交互產(chǎn)品、小屏桌面音視頻多媒體產(chǎn)品等。端側的語音識別、機器視覺與云端的DeepSeek大模型相結合,是智能硬件的最優(yōu)技術組合,能夠顯著提升產(chǎn)品的智能化程度,增加產(chǎn)品的附加值。

我們即將推出基于深蕾半導體SOC帶機器視覺和語音交互的DeepSeek大模型應用解決方案,敬請期待!

相關推薦

登錄即可解鎖
  • 海量技術文章
  • 設計資源下載
  • 產(chǎn)業(yè)鏈客戶資源
  • 寫文章/發(fā)需求
立即登錄

深蕾半導體有限公司成立于2017年,是一家芯片設計公司,主要產(chǎn)品是音頻編解碼芯片Codec、智能音視頻編解碼芯片SoC。