這是一個視頻無處不在的大時代。
娛樂,靠視頻。
學習,看視頻。
甚至圖文工作,也在視頻化。
視頻,已然逐步成為了信息傳遞的主要載體和介質。
如果非要給它加一個定語,那或許應該就是“硬核性感”。
(咳咳,不是“你以為你以為的就是你以為”的那種性感。)
為什么?又該如何走?
視頻,應該走“硬核性感”路線
全視頻時代之下,各行業(yè)對視頻有了一個新的需求,主要體現(xiàn)在體驗、應用和效能三方面。
整體來看,這種需求的升級,歸結為一句話便是:
視頻技術要夠硬核,視頻體驗要夠性感。
從直觀感受角度,視頻的“硬核性感”應該是怎樣的?
首先,是體驗超清化。
簡而言之,就是將低清視頻轉超清,卡頓變流暢。
例如人人都愛的經典老電影,若是用更清晰的方式打開,豈不美哉?
利用去噪、去劃痕等技術,便可以實現(xiàn)讓經典超清再現(xiàn)。
除此之外,SDR向HDR的過渡,可以讓視頻細節(jié)展現(xiàn)的更加豐富。
包括色澤、光線、光感等,讓體驗沉浸化。
最后,則是理解+分析+生成+交互智能化。
這種“硬核性感”的背后,體現(xiàn)出的實則是視頻的智能。
而歸結智能的背后,則是AI與云計算不斷發(fā)展所帶來的驅動力。
“硬核性感”,也是需要實力的
在智能視頻時代下,體驗超清化、體驗沉浸化、分析智能化,這是偏向消費者的新需求。
而面向視頻產業(yè),隨即而來的新難題則是海量視頻采集接入、數(shù)據(jù)分析、視頻處理存儲等。
此局又該如何破解?
云智一體,了解一下。
云,顧名思義,不僅是指云計算這個強有力的輸出載體,還包括云邊端一體技術,能夠保障視頻的高擴展、高穩(wěn)定、高性能、高效率。
智,則是智能視頻云中的AI技術,可以通過視頻中的圖像、人物、聲音等信息進行多模態(tài)分析和理解,實現(xiàn)視頻的智能理解分析、生產與交互生成。
云智一體,是百度智能云的獨特競爭優(yōu)勢,也是百度智能視頻云3.0“全景圖”中的關鍵核心。
整體來看,此次升級的百度智能視頻云3.0,包含三大方面,即一個一體化、兩個平臺和三大場景。
△百度智能視頻云3.0全景圖
先來看看應用到視頻領域,“云”和“智”分別擔任何種角色?
在云方面,云邊端一體的基礎技術架構,是此次智能視頻云3.0的底座。
在此基礎之上,云能力的輸出體現(xiàn)在了五大方面:
視頻轉碼處理:自研的BD265編碼器,可以通過深度學習網絡來提取視頻特征,從而生成自適應編碼參數(shù);具有60多種優(yōu)化算法,使碼率節(jié)省30%、速度提升2倍。
實時音視頻通訊:也是基于自研的多種算法,實現(xiàn)超低延時的交互體驗。
低延時直播:則采用的是全鏈路SRT協(xié)議技術,并與mpegTS封裝結合,千萬級的并發(fā)直播也能hold得住。
內容分發(fā)加速CDN:在全球范圍內,擁有1000多個節(jié)點,帶寬存儲達到了100T之多,提高了視頻分發(fā)體驗和效率。
智能視頻SDK:針對視頻的不同場景提供All in one的矩陣能力,涵蓋視頻特效、短視頻、互動直播、播放器、增強超分等。
而在云的基礎之上,智的能力讓視頻變得更加“聰明”。
以視頻理解分析為例,百度擁有業(yè)界最大的多元異構知識圖譜,量級達到了5500億。
通過這樣的知識圖譜能力,可以根據(jù)視頻中人物、場景等特征,更好地理解其背后所蘊含的知識,從而提高了視頻編目的效率,也在視頻分析、審核、檢索等方面得到了廣泛應用。
再如視頻生產方面,也是基于知識圖譜的能力,可以根據(jù)已有的圖文咨詢、數(shù)據(jù)等內容進行向短視頻的轉換;也可以理解事件的脈絡,生成新的視頻內容。
還有在視頻交互與生成方面,可以根據(jù)元學習-遷移學習的視頻生成技術,按照需求快速定制不同風格的高質量視頻;也可以低成本生成虛擬人物形象進行交互。
例如今年兩會期間擔任直播主持的“小C”,雖說是個虛擬人,但不難看出,發(fā)絲、肌膚毛孔等細節(jié)清晰可見。
不僅如此,“小C”與參會人員還進行了實時順暢的獨家對話,為采訪增添了不少的趣味性。
△數(shù)字人虛擬主播“小C”
OK,視頻硬核的能力有了,接下來的一個問題,便是如何用起來?
這就是此次全景圖中的所涵蓋的兩個平臺:視頻創(chuàng)作分發(fā)平臺和視聯(lián)網感知平臺。
視頻創(chuàng)作分發(fā)平臺,是百度智能云的音視頻統(tǒng)一入口,所涵蓋的服務包括音視頻上傳存儲、生產處理、媒資管理等。
例如在泛互聯(lián)網應用場景中,內容和用戶是兩大核心要素,通過視頻創(chuàng)作分化平臺,內容創(chuàng)作者可以輕松降低碼率、提升畫質,而且分發(fā)方面還是低成本的那種。
而視聯(lián)網感知平臺,將全場景深度理解視頻、優(yōu)化視頻質量等服務接入進來,滿足產業(yè)對安全生產、視頻監(jiān)控等需求。
例如在產業(yè)界,往往需要將業(yè)務對接系統(tǒng)和數(shù)據(jù)進行平臺化處理,而通過視聯(lián)網感知平臺具有通過信息獲取對多種業(yè)務進行決策的特性,可以通過EasyDL算子生產技術,與云邊端深度融合,讓平臺形成模塊化,并開放接口服務,實現(xiàn)快速對接構建。
由此可見,智能視頻所體現(xiàn)出的“硬核性感”,靠的便是背后云智一體的強實力,以及平臺化的便捷、全面。
哪里來的底氣?
在百度智能視頻云的這張全景圖中,還涉及到一層,便是三大場景:
泛互聯(lián)網:點播/直播、編解碼優(yōu)化、推薦/搜索
廣電媒體:策/采/編/發(fā)、媒資管理、營銷
政企/工業(yè)/交通:會議培訓、安全生產、智慧園區(qū)/交通
不難看出,所涉及的場景,近乎是視頻能夠涉足的所有領域。
真實落地的應用案例正是寫照。
例如百度智能云與央視網合作打造的“人工智能編輯部”,以新聞視頻智能媒資建設作為切入口,不僅完成了超過200萬小時的視頻結構化處理,還打造了統(tǒng)一的媒體AI中臺,能夠根據(jù)不同業(yè)務場景生產岀不同的新聞內容。
宜昌市點軍區(qū)積極擁抱人工智能、視聯(lián)網與物聯(lián)網,在百度智能視頻云的參與和助力下,在公共衛(wèi)生、鄉(xiāng)村振興、基層醫(yī)療、環(huán)境保護等方面為民生帶來更多便捷、智能的服務,讓百姓有安全感、獲得感、幸福感。
杭州星犀科技有限公司聯(lián)合百度智能視頻云為零售直播進行數(shù)字化智能化賦能,通過百度智能視頻云PaaS能力與云犀直播SaaS應用的的結合,解決零售品牌自播執(zhí)行門檻高、門店直播運營力缺乏的關鍵問題。
眾所周知,視頻所涵蓋的形式、結構、內容紛繁多雜,要想吃下這塊“大餅”,定是需要精通十八般武藝之大能。
而除了自身因素,還有外界條件。
單是在短視頻領域,抖音、快手的迅速崛起,就讓視頻市場的競爭變得格外激烈。
在這種“兩面夾擊”的沖擊之下,百度此次在視頻中的舉動,不免讓人產生一個疑問:
哪里來的底氣?
在今年百度赴港二次上市之際,對其自身所具備的AI能力,灼識咨詢報告中總結道:
同時,百度持有最多中國AI專利申請,按開發(fā)者數(shù)目計,百度AI開放平臺于中國排名第一。
云計算方面,全球權威咨詢機構IDC的報告中顯示,百度智能云在整體調用量、市場份額方面均名列第一。
再具體到視頻領域,國際比賽獲獎情況也是“拿到手軟”。
例如智感超清方面,在計算機視覺頂會ECCV 2020中,便以自研“圖像超分辨技術”,包攬了AIM 2020 Real Image Super-Resolution Challenge全部3項冠軍。
百度智能視頻技術能力,由此可見一斑。
而除了AI公司,百度從另外一個層面對自身的定位,便是平臺公司。
在視頻這一大場景、大領域中,各行各業(yè)所涉及業(yè)務的需求可謂是“千變萬化”,通用性自然成了一大難點。
因為視頻本身就是具有“重數(shù)據(jù)”的屬性,除了需要強悍的智能分析與處理能力之外,在采集、存儲、傳輸和分發(fā)等方面也有極高的要求。
雖說云智一體在一定程度上能夠很好解決這方面的需求,但面對具體業(yè)務的萬變,還是需要另外一個能力的助攻——生態(tài)伙伴的合作。
以算法為例,端上的算法與云上的算法需要協(xié)同,而視頻處理算法依舊是處于不斷完善、發(fā)展階段。
因此,百度智能云在云智一體的能力基礎上,還需要滲入到產業(yè)、廠商的細節(jié)過程當中去,與生態(tài)伙伴共同合作。
一言蔽之,云智一體,便是百度在視頻領域發(fā)力的底氣。
而之于智能視頻的未來,應當是百度在AI深耕的生態(tài)能量與視頻應用場景的結合。
這便是智能視頻“硬核性感”路線的一種正解。