• 正文
    • █ 數(shù)據(jù)倉(cāng)庫(kù)的誕生
    • █?數(shù)據(jù)倉(cāng)庫(kù)的定義和特征
    • █ 數(shù)據(jù)倉(cāng)庫(kù)的架構(gòu)和工作流
    • █?數(shù)據(jù)集市(Data Mart)
    • █?數(shù)據(jù)倉(cāng)庫(kù)的發(fā)展趨勢(shì)
  • 相關(guān)推薦
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

寫(xiě)給小白的“數(shù)據(jù)倉(cāng)庫(kù)”科普

03/12 11:50
797
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

小棗君注:數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)集市、數(shù)據(jù)湖、數(shù)據(jù)中臺(tái)、數(shù)據(jù)飛輪,是這幾年網(wǎng)上比較常見(jiàn)的IT概念。很多人都搞不清它們和傳統(tǒng)數(shù)據(jù)庫(kù)到底有什么區(qū)別。所以,我打算寫(xiě)幾篇專(zhuān)題文章,嘗試做一個(gè)通俗易懂的解讀。今天這篇,先說(shuō)說(shuō)數(shù)據(jù)倉(cāng)庫(kù)。

數(shù)據(jù)倉(cāng)庫(kù),英文全稱(chēng)Data Warehouse,簡(jiǎn)稱(chēng)DW或DWH。

數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)庫(kù)的名字非常接近,但兩者是完全不同的東西。

我們先從數(shù)據(jù)倉(cāng)庫(kù)的歷史開(kāi)始說(shuō)起吧。

數(shù)據(jù)倉(cāng)庫(kù)的誕生

數(shù)據(jù)倉(cāng)庫(kù)并不是一個(gè)新概念。事實(shí)上,它誕生至今,已經(jīng)有幾十年的歷史。

上世紀(jì)70年代,關(guān)系數(shù)據(jù)庫(kù)(也就是傳統(tǒng)數(shù)據(jù)庫(kù)的主要類(lèi)型)剛剛崛起的時(shí)候,美國(guó)康奈爾大學(xué)博士比爾·恩門(mén)(Bill Innmon,也有譯為比爾·因蒙)就開(kāi)始定義和討論數(shù)據(jù)倉(cāng)庫(kù)這一術(shù)語(yǔ)。

1988年,IBM研究人員巴里·德夫林(Barry Devlin)和鮑爾·穆?tīng)柗疲≒aul Murphy),聯(lián)合發(fā)表了文章《商業(yè)和信息系統(tǒng)的架構(gòu)》,其中引入了“商業(yè)數(shù)據(jù)倉(cāng)庫(kù)”一詞。他們還開(kāi)發(fā)了一種叫做“業(yè)務(wù)數(shù)據(jù)倉(cāng)庫(kù)”的系統(tǒng)。

幾年后,1990年,美國(guó)科學(xué)家拉爾夫·金博爾(Ralph Kimball)創(chuàng)立了Red Brick Systems公司,推出專(zhuān)門(mén)用于數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)庫(kù)管理系統(tǒng)Red Brick Warehouse。

1991年,又是前面那個(gè)比爾·恩門(mén),創(chuàng)立了Prism Solutions公司,推出用于開(kāi)發(fā)數(shù)據(jù)倉(cāng)庫(kù)的軟件Prism Warehouse Manager。

同年,比爾·恩門(mén)正式出版了數(shù)據(jù)倉(cāng)庫(kù)的經(jīng)典著作——《構(gòu)建數(shù)據(jù)庫(kù)倉(cāng)庫(kù)》,標(biāo)志著數(shù)據(jù)倉(cāng)庫(kù)概念的正式確立。

后來(lái),比爾·恩門(mén)也被世人譽(yù)為“數(shù)據(jù)倉(cāng)庫(kù)之父”。

?數(shù)據(jù)倉(cāng)庫(kù)的定義和特征

那么,到底什么是數(shù)據(jù)倉(cāng)庫(kù)呢?

比爾·恩門(mén)在《構(gòu)建數(shù)據(jù)庫(kù)倉(cāng)庫(kù)》書(shū)中給出了一個(gè)定義——

數(shù)據(jù)倉(cāng)庫(kù),是一個(gè)面向主題的(Subject Oriented)、集成的(Integrated)、相對(duì)穩(wěn)定的(Non-Volatile)、反映歷史變化(Time Variant)的數(shù)據(jù)集合,用于支持管理決策(Decision Making Support)。

這個(gè)定義非常抽象、燒腦,但準(zhǔn)確概括了數(shù)據(jù)倉(cāng)庫(kù)的幾個(gè)關(guān)鍵特征,值得剖析一下。

支持管理決策

先說(shuō)“支持管理決策”,這是數(shù)據(jù)倉(cāng)庫(kù)的作用,也是創(chuàng)造它的主要目的。

簡(jiǎn)單來(lái)說(shuō),傳統(tǒng)數(shù)據(jù)庫(kù)主要是員工使用,支撐某項(xiàng)具體的工作。例如收銀系統(tǒng)等。

而數(shù)據(jù)倉(cāng)庫(kù),主要是管理層使用,用于掌握宏觀情況,以便做出更合理的決策。

以前小棗君給大家介紹數(shù)據(jù)庫(kù)入門(mén)的時(shí)候,提到過(guò)OLTP和OLAP。

OLTP是聯(lián)機(jī)事務(wù)處理(Online Transaction Processing)數(shù)據(jù)庫(kù),出現(xiàn)較早,也是早期關(guān)系型數(shù)據(jù)庫(kù)的主要用途,用于支持日常業(yè)務(wù)操作,如訂單處理、庫(kù)存管理和銀行交易等。它們通常處理大量簡(jiǎn)單的讀寫(xiě)操作,需要系統(tǒng)能夠快速響應(yīng),且非??煽?。

OLAP是聯(lián)機(jī)分析處理(Online Analytical Processing)數(shù)據(jù)庫(kù),出現(xiàn)較晚,用于支持復(fù)雜的分析查詢(xún),如數(shù)據(jù)挖掘、趨勢(shì)分析和財(cái)務(wù)報(bào)告等。它們通常處理大量復(fù)雜的只讀查詢(xún),對(duì)算力要求高,也需要支持很大的數(shù)據(jù)吞吐量。

數(shù)據(jù)倉(cāng)庫(kù),很顯然就是OLAP型?;蛘咭部梢哉f(shuō),數(shù)據(jù)倉(cāng)庫(kù)是OLAP數(shù)據(jù)庫(kù)場(chǎng)景的延伸和發(fā)展。OLAP類(lèi)應(yīng)用,催生了數(shù)據(jù)倉(cāng)庫(kù)。

概括來(lái)說(shuō),數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)戰(zhàn)略級(jí)的工具。它通常用于商業(yè)智能(Business Intelligence,簡(jiǎn)稱(chēng)BI,咨詢(xún)機(jī)構(gòu)Gartner造出來(lái)的流行詞)和決策支持,可以幫助企業(yè)從大量數(shù)據(jù)中獲得有價(jià)值的信息,增加洞察能力。

終極目的,當(dāng)然是增加收入、提升效率、降低成本。

現(xiàn)在很多企業(yè)搞數(shù)字可視化大屏,背后就是數(shù)據(jù)倉(cāng)庫(kù)的支持

面向主題

傳統(tǒng)數(shù)據(jù)庫(kù),圍繞具體的工作(應(yīng)用)來(lái)組織數(shù)據(jù),用于一個(gè)明確的事務(wù)。例如進(jìn)銷(xiāo)存數(shù)據(jù)庫(kù)、考勤數(shù)據(jù)庫(kù)、財(cái)務(wù)數(shù)據(jù)庫(kù)等。

而數(shù)據(jù)倉(cāng)庫(kù),是按照主題來(lái)組織數(shù)據(jù)的。所謂主題,是一個(gè)特定的業(yè)務(wù)領(lǐng)域,或者一個(gè)明確的分析目標(biāo),例如銷(xiāo)售分析主題、員工敬業(yè)度主題,學(xué)生在校表現(xiàn)主題等等。

主題的范圍更大,level(層級(jí))更高。

簡(jiǎn)單來(lái)說(shuō),數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù),是多個(gè)傳統(tǒng)數(shù)據(jù)庫(kù)的集合和“拉通”。它把不同數(shù)據(jù)庫(kù)表單的信息挑選整合在一起,提供了一個(gè)更全面的數(shù)據(jù)呈現(xiàn)。

主題性的設(shè)計(jì),顯然更適合支持管理者做決策和分析。

集成

集成,是指數(shù)據(jù)倉(cāng)庫(kù)可以整合來(lái)自多個(gè)不同數(shù)據(jù)源(企業(yè)內(nèi)部數(shù)據(jù)庫(kù)、供應(yīng)商數(shù)據(jù)庫(kù)、渠道商數(shù)據(jù)庫(kù)等)的數(shù)據(jù)。

多方面的數(shù)據(jù)源,也是為了提供一個(gè)更全面的視角,以便服務(wù)于分析和決策。

這些數(shù)據(jù),可以包括結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)等。但數(shù)據(jù)倉(cāng)庫(kù),主要還是結(jié)構(gòu)化數(shù)據(jù)為主。

相對(duì)穩(wěn)定

相對(duì)穩(wěn)定,指的是數(shù)據(jù)一旦被加載到數(shù)據(jù)倉(cāng)庫(kù)中,通常不會(huì)更新或修改,確保了數(shù)據(jù)的穩(wěn)定性和用于長(zhǎng)期分析的可靠性。

換言之,數(shù)據(jù)倉(cāng)庫(kù)所涉及的操作,主要是數(shù)據(jù)查詢(xún),而不是修改。

除了數(shù)據(jù)之外,數(shù)據(jù)倉(cāng)庫(kù)的架構(gòu)一般也不會(huì)頻繁變化。

反映歷史變化

傳統(tǒng)數(shù)據(jù)庫(kù),一般都是數(shù)據(jù)更新。寫(xiě)入新數(shù)據(jù),替換舊數(shù)據(jù)。

數(shù)據(jù)倉(cāng)庫(kù)不一樣。它保存了大量的歷史數(shù)據(jù),有利于企業(yè)從時(shí)間的維度,分析業(yè)務(wù)的發(fā)展趨勢(shì)。

面向主題、集成、相對(duì)穩(wěn)定、反映歷史變化,這就是數(shù)據(jù)倉(cāng)庫(kù)的四大特征。

我們還是以超市為例,總結(jié)一下數(shù)據(jù)倉(cāng)庫(kù)和傳統(tǒng)數(shù)據(jù)庫(kù)的區(qū)別。

假如你有一個(gè)大超市。

超市有基于傳統(tǒng)數(shù)據(jù)庫(kù)的很多個(gè)收銀臺(tái),記錄了每天的每一筆交易(賣(mài)出了什么商品,金額是多少)。超市還有庫(kù)存系統(tǒng),記錄了商品的信息(一共有多少個(gè)庫(kù)存)。還有會(huì)員系統(tǒng)、購(gòu)物卡系統(tǒng),等等。

所有這些數(shù)據(jù),分散在不同的系統(tǒng)里,雜亂無(wú)章。

你把所有系統(tǒng)的數(shù)據(jù)(銷(xiāo)售數(shù)據(jù)、顧客信息、供應(yīng)商記錄等),統(tǒng)一做了整理(比如去掉無(wú)效數(shù)據(jù)、統(tǒng)一“日期”格式),按主題分類(lèi)(比如“銷(xiāo)售分析”、“客戶(hù)畫(huà)像”),集中存到一個(gè)龐大的數(shù)據(jù)系統(tǒng)里。這就是數(shù)據(jù)倉(cāng)庫(kù)。

然后,你開(kāi)發(fā)了一些工具,可以分析這些數(shù)據(jù),回答你的一些疑問(wèn):

“過(guò)去5年哪些商品在春節(jié)賣(mài)得最好?”“上海和北京的顧客購(gòu)物習(xí)慣有什么差異?”“如何預(yù)測(cè)明年的商品庫(kù)存需求?”……

也可以以大屏的形式,觀看這些數(shù)據(jù)(掌控全局、運(yùn)籌帷幄的老板既視感):

當(dāng)然了,這些數(shù)據(jù)也可以開(kāi)放給各個(gè)部門(mén)的主管,幫助部門(mén)改善業(yè)績(jī)。

這個(gè)數(shù)據(jù)倉(cāng)庫(kù),是不是輔助了你的決策,創(chuàng)造了價(jià)值?

數(shù)據(jù)倉(cāng)庫(kù)的架構(gòu)和工作流

接下來(lái),我們看看數(shù)據(jù)倉(cāng)庫(kù)的整體架構(gòu),以及如何搭建。

每個(gè)公司的數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)都不太一樣。但基本上都包括以下幾層:

數(shù)據(jù)倉(cāng)庫(kù)的整體架構(gòu)

原始數(shù)據(jù)層(ODS,Operation Data Store):也叫數(shù)據(jù)引入層、操作數(shù)據(jù)層、數(shù)據(jù)準(zhǔn)備層或貼源層,用于采集和存儲(chǔ)原始數(shù)據(jù)。

數(shù)據(jù)公共層(CDM,Common Data Model):數(shù)據(jù)倉(cāng)庫(kù)的主要部分。有時(shí)候又分為基礎(chǔ)層/明細(xì)層(DWD,DW Detail)、匯總層/服務(wù)層(DWS,DW Service)、公共維度層(DIM)。DWD對(duì)源數(shù)據(jù)進(jìn)行清洗以便將其加載到數(shù)據(jù)倉(cāng)庫(kù)中。DWS將經(jīng)過(guò)清洗和轉(zhuǎn)換后的數(shù)據(jù)并輕度匯總。DIW用于保存維度信息,用于建模。

數(shù)據(jù)應(yīng)用層ADS,Application Data Service):主要功能是保存結(jié)果數(shù)據(jù),為外部系統(tǒng)提供查詢(xún)接口,用于滿(mǎn)足特定的商業(yè)智能、數(shù)據(jù)挖掘和報(bào)表應(yīng)用。

數(shù)據(jù)倉(cāng)庫(kù)的架構(gòu)和它的工作流有密切的關(guān)系。

一般來(lái)說(shuō),數(shù)據(jù)倉(cāng)庫(kù)的工作流分為以下幾步:

1、數(shù)據(jù)抽取

前面說(shuō)了,數(shù)據(jù)倉(cāng)庫(kù)有很多的數(shù)據(jù)源。所以,第一步,是從不同的數(shù)據(jù)源系統(tǒng)中抽取數(shù)據(jù)。

數(shù)據(jù)抽取是定期進(jìn)行的,比如每天或每周,以確保數(shù)據(jù)是最新的。

2、數(shù)據(jù)清洗和轉(zhuǎn)換

抽取出的數(shù)據(jù),通常需要經(jīng)過(guò)清洗和轉(zhuǎn)換,以提高數(shù)據(jù)質(zhì)量和一致性。

清洗包括修正錯(cuò)誤、去除重復(fù)項(xiàng)、處理缺失值等。轉(zhuǎn)換則是將數(shù)據(jù)轉(zhuǎn)化為統(tǒng)一的格式,以便在數(shù)據(jù)倉(cāng)庫(kù)中進(jìn)行有效存儲(chǔ)和查詢(xún)。

3、數(shù)據(jù)建模

數(shù)據(jù)倉(cāng)庫(kù)采用特定的數(shù)據(jù)模型,對(duì)數(shù)據(jù)進(jìn)行組織和存儲(chǔ),設(shè)計(jì)數(shù)據(jù)表。選擇合適的模型,可以簡(jiǎn)化數(shù)據(jù)查詢(xún)和分析過(guò)程,提高查詢(xún)性能。

數(shù)據(jù)倉(cāng)庫(kù)建模中,比較有代表性的兩類(lèi)方法論是Ralph Kimball的建模方法論和Bill Inmon建模方法論(沒(méi)錯(cuò),就是前面提到的那兩個(gè)大佬)。

Ralph Kimball的維度建模方法論,是一種常用的數(shù)據(jù)倉(cāng)庫(kù)建模方法,它強(qiáng)調(diào)使用星型模型、雪花模型、星座模型來(lái)設(shè)計(jì)數(shù)據(jù)倉(cāng)庫(kù)。

Bill Inmon則認(rèn)為企業(yè)數(shù)據(jù)倉(cāng)庫(kù)應(yīng)為原子數(shù)據(jù)的集成倉(cāng)庫(kù),應(yīng)用第三范式和ER模型而非維度建模的事實(shí)表、維度表來(lái)建模。

這里要提到一個(gè)元數(shù)據(jù)的概念。

元數(shù)據(jù)是描述數(shù)據(jù)的數(shù)據(jù)。它用以描述數(shù)據(jù)倉(cāng)庫(kù)內(nèi)數(shù)據(jù)的結(jié)構(gòu)、位置和建立方法,便于數(shù)據(jù)倉(cāng)庫(kù)的管理和使用。

4、數(shù)據(jù)存儲(chǔ)

數(shù)據(jù)倉(cāng)庫(kù)通常采用大容量、高性能的存儲(chǔ)系統(tǒng),以滿(mǎn)足大量數(shù)據(jù)的存儲(chǔ)和查詢(xún)需求。數(shù)據(jù)倉(cāng)庫(kù)的存儲(chǔ)結(jié)構(gòu)通常針對(duì)查詢(xún)性能進(jìn)行了優(yōu)化,如列式存儲(chǔ)、索引等。

5、數(shù)據(jù)加載

抽?。‥xtract)、轉(zhuǎn)換(Transform)和加載(Load),就是著名的ETL三板斧。

ETL后的數(shù)據(jù),會(huì)被加載到數(shù)據(jù)倉(cāng)庫(kù)中。

根據(jù)需要,還可能會(huì)進(jìn)一步加工,例如聚合、摘要和索引創(chuàng)建,以?xún)?yōu)化查詢(xún)性能。

另外,數(shù)據(jù)加載可以分為全量加載和增量加載兩種方式,也是根據(jù)需求選擇。

5、數(shù)據(jù)訪問(wèn)與分析

數(shù)據(jù)倉(cāng)庫(kù)完成數(shù)據(jù)存儲(chǔ)后,就可以開(kāi)始用了。

數(shù)據(jù)倉(cāng)庫(kù)支持各種數(shù)據(jù)分析和報(bào)表工具,如商業(yè)智能(BI)、SQL查詢(xún)、OLAP、數(shù)據(jù)挖掘等。用戶(hù)可以通過(guò)這些工具,對(duì)數(shù)據(jù)進(jìn)行深入分析,找到其中的規(guī)律和趨勢(shì)。

值得一提的是,數(shù)據(jù)倉(cāng)庫(kù)不僅支持宏觀趨勢(shì)分析,也支持微觀細(xì)節(jié)探究,能夠滿(mǎn)足各個(gè)層級(jí)的需求。

6、數(shù)據(jù)安全和訪問(wèn)控制

在數(shù)據(jù)倉(cāng)庫(kù)的使用過(guò)程中,當(dāng)然還要注意數(shù)據(jù)安全和訪問(wèn)控制。確保數(shù)據(jù)的安全性和合規(guī)性,防止數(shù)據(jù)泄露和濫用。

?數(shù)據(jù)集市(Data Mart)

數(shù)據(jù)集市可以認(rèn)為是數(shù)據(jù)倉(cāng)庫(kù)的子集,是專(zhuān)用于特定業(yè)務(wù)部門(mén)或功能的數(shù)據(jù)系統(tǒng)。它的數(shù)據(jù)是從數(shù)據(jù)倉(cāng)庫(kù)中提取并進(jìn)一步加工得到的。

例如,一個(gè)銷(xiāo)售數(shù)據(jù)集市,可以提供詳細(xì)的銷(xiāo)售報(bào)告和分析,輔助銷(xiāo)售部門(mén)進(jìn)行決策。

數(shù)據(jù)集市的優(yōu)點(diǎn)包括:

1.規(guī)模小:由于只包含與特定主題相關(guān)的數(shù)據(jù),因此數(shù)據(jù)集市的規(guī)模相對(duì)較小,易于構(gòu)建和維護(hù)。
2.數(shù)據(jù)深:數(shù)據(jù)集市可以滿(mǎn)足特定部門(mén)或用戶(hù)的需求,提供更加詳細(xì)和深入的數(shù)據(jù)支持。
3.響應(yīng)快:因?yàn)樗臄?shù)據(jù)量相對(duì)較小且針對(duì)特定需求進(jìn)行了優(yōu)化,所以能夠提供更快的查詢(xún)響應(yīng)時(shí)間。
4.建設(shè)周期短:由于規(guī)模較小且面向特定需求,數(shù)據(jù)集市的建設(shè)周期通常較短,可以快速實(shí)現(xiàn)并投入使用。(數(shù)據(jù)倉(cāng)庫(kù)的建設(shè)周期一般需要數(shù)個(gè)月甚至一年以上。)
5.靈活性高:數(shù)據(jù)集市的數(shù)據(jù)模型和結(jié)構(gòu)可以根據(jù)特定需求進(jìn)行調(diào)整,具有較高的靈活性。
6.成本低:數(shù)據(jù)集市的實(shí)現(xiàn)成本相對(duì)較低,因?yàn)槠鋽?shù)據(jù)量和復(fù)雜度較數(shù)據(jù)倉(cāng)庫(kù)低。

?數(shù)據(jù)倉(cāng)庫(kù)的發(fā)展趨勢(shì)

數(shù)據(jù)倉(cāng)庫(kù)誕生了幾十年,技術(shù)也一直在發(fā)展。為了實(shí)現(xiàn)處理能力的升級(jí),經(jīng)歷了多個(gè)發(fā)展階段。

早期的時(shí)候,基本上就是基于傳統(tǒng)數(shù)據(jù)庫(kù)產(chǎn)品(例如Oracle),構(gòu)建的數(shù)據(jù)倉(cāng)庫(kù)。數(shù)據(jù)倉(cāng)庫(kù)最早也是離線的,數(shù)據(jù)源通過(guò)離線方式導(dǎo)入到離線數(shù)據(jù)倉(cāng)庫(kù)中。

后來(lái),進(jìn)入21世紀(jì),有了大數(shù)據(jù)技術(shù)(Hadoop、Spark等)。就開(kāi)始將這些技術(shù)引入到數(shù)據(jù)倉(cāng)庫(kù),通過(guò)MapReduce、Hive、SparkSQL等離線計(jì)算引擎進(jìn)行數(shù)據(jù)處理,處理效率有了明顯提升。

再后來(lái),分別發(fā)展出了Lambda架構(gòu)(離線+實(shí)時(shí)結(jié)合)和Kappa架構(gòu)(批流一體)。

再再后來(lái),到了近幾年,就是基于MPP數(shù)據(jù)庫(kù)和數(shù)據(jù)湖的實(shí)時(shí)數(shù)倉(cāng)架構(gòu)。

這些架構(gòu)支持高性能并行處理,支持復(fù)雜查詢(xún)。在處理能力和效率上已經(jīng)今非昔比,能夠幫助企業(yè)更及時(shí)、更準(zhǔn)確地進(jìn)行決策。

從部署方面來(lái)看,數(shù)據(jù)倉(cāng)庫(kù)也有變化。以前是本地單機(jī)部署,后來(lái)是分布式部署,再后來(lái),云計(jì)算崛起,就是云部署。

這兩年,AI很火。所以,很多企業(yè)開(kāi)始研究AI與數(shù)據(jù)系統(tǒng)的深度結(jié)合。

說(shuō)白了,就是看AI怎么讓數(shù)據(jù)倉(cāng)庫(kù)能夠更智能地處理和分析數(shù)據(jù),提高數(shù)據(jù)的準(zhǔn)確性和可靠性。反過(guò)來(lái),AI也是“吃”數(shù)據(jù)的,還要研究如何讓數(shù)據(jù)倉(cāng)庫(kù)這樣的數(shù)據(jù)平臺(tái),更好地服務(wù)于AI的訓(xùn)練和推理。

這里面的發(fā)展前景,還是非常廣闊的。

好啦,關(guān)于數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)集市,就先說(shuō)這么多。

剛才已經(jīng)提到了數(shù)據(jù)湖。下一期,我們?cè)賮?lái)詳細(xì)說(shuō)說(shuō)數(shù)據(jù)湖湖倉(cāng)一體。看看數(shù)據(jù)湖和數(shù)據(jù)倉(cāng)庫(kù)到底有什么區(qū)別。

相關(guān)推薦

登錄即可解鎖
  • 海量技術(shù)文章
  • 設(shè)計(jì)資源下載
  • 產(chǎn)業(yè)鏈客戶(hù)資源
  • 寫(xiě)文章/發(fā)需求
立即登錄

通信行業(yè)知名新媒體鮮棗課堂創(chuàng)始人,通信行業(yè)資深專(zhuān)家、行業(yè)分析師、自媒體作者,《智聯(lián)天下:移動(dòng)通信改變中國(guó)》叢書(shū)作者。通信行業(yè)13年工作經(jīng)驗(yàn),曾長(zhǎng)期任職于中興通訊股份有限公司,從事2/3/4G及5G相關(guān)技術(shù)領(lǐng)域方面的研究,曾擔(dān)任中興通訊核心網(wǎng)產(chǎn)品線產(chǎn)品經(jīng)理、能力提升總監(jiān)、中興通訊學(xué)院二級(jí)講師、中興通訊高級(jí)主任工程師,擁有豐富的行業(yè)經(jīng)驗(yàn)和積累。