在春節(jié)假期期間,Deep Seek引發(fā)了社會各界的廣泛關注。幾位朋友紛紛向我詢問對Deep Seek的看法,這促使我深入思考并分享我對利用GPT(Generative Pre-trained Transformer)技術的認識。
利用預訓練模型創(chuàng)作效率高,但總感覺差了點什么?
事實上,在OpenAI備受矚目時,我曾嘗試使用OpenAI撰寫了幾篇文章。首先,我發(fā)現(xiàn)用OpenAI創(chuàng)作的文章閱讀量竟然比我自己的文章還要高,這讓我感到十分驚訝。然而,這些文章雖然內容詳實、涵蓋面廣,通用性較強,但我總覺得它們缺少了獨特的觀點和深度。此外,雖然利用預訓練模型準備資料確實高效便捷,但如果沒有輸入明確的觀點,用預訓練模型生成的文章往往會顯得空洞,缺乏靈魂。
因此,在Deep Seek剛興起時,我對它并不以為然。直到我了解到Deep Seek可以搭建本地知識庫,并通過學習知識庫中的知識來提升其創(chuàng)作能力。通過根據自己的知識框架對模型進行訓練,再用訓練好的模型進行創(chuàng)作,這樣生成的文章才能更具差異性和深度。
知識架構對認知理解非常重要
不久前,我參與了一場關于“S&OP是計劃還是流程”的辯論。其實,觀點的差異很大程度上源于我和辯論對手在知識架構上的不同。我的辯論對手認為計劃具有強邏輯性,我推測她可能將計劃理解為ERP普及后,受ERP系統(tǒng)影響的軟件系統(tǒng)的計劃功能,這只是Planning概念的一個分支。
而我的知識架構則是基于APICS和SCOR框架的。APICS對Planning的定義是:為組織設定目標并選擇各種方式來使用組織的資源以實現(xiàn)這些目標的流程。這個定義本身就包含了Process(流程)的含義,即制定計劃的流程。而在SCOR早期版本中,供應鏈包含的26個流程分別屬于計劃、執(zhí)行和使能三類。如果S&OP流程不屬于計劃,那么它就應該屬于執(zhí)行或使能類別。從這個邏輯出發(fā),如果認為S&OP不是計劃就不言而喻了。
如果GPT在訓練模型時沒有區(qū)分知識架構的重要性,當提供的多種知識架構中存在矛盾時,GPT輸出的內容質量就無法得到保證。因此,我希望能夠用自己的知識框架來訓練模型進行創(chuàng)作,這樣才有意義。
最近幾天,我一直在努力搭建自己的本地知識庫。可惜的是,docker+dify+deep seek的環(huán)境搭建過程并不順利,花費了我兩天的時間才終于搭建成功。今天早上,我終于成功搭建了AnythingLLM+deep seek的知識庫。接下來,我計劃在幾天內將一些重要的供應鏈知識框架加入知識庫,然后再利用Deep Seek創(chuàng)作內容,看看效果如何。