亚洲AV无码黄色高清网站|日本爱久久在线免费观看|亚洲视频一区二区在线观看|免费的黄片在线播放视频|国产86无码一区在线观看|91久久亚洲国产精品日韩影院|av高清无码动漫|成人av导航站点|亚洲成人A片在线观看|亚洲91一区二区

5G開啟倒計時 AI內(nèi)容服務已進入新賽道

  2019年被譽為中國的“5G元年”,它將為視頻行業(yè)帶來巨大的改變。在5G技術的支撐下,傳輸速度較于4G將快百倍,高速度、泛在網(wǎng)、低功耗、低時延的5G優(yōu)勢將革新當前的視頻產(chǎn)業(yè)。第七屆中國網(wǎng)絡視聽大會上,圍繞這一話題,金山云高級技術總監(jiān)韓博發(fā)表主題演講,重點闡述5G背景下,AI內(nèi)容服務產(chǎn)業(yè)隨著視頻生產(chǎn)、服務、消費方式的升級,在技術演進過程中的突破性進展。

5G開啟倒計時  AI內(nèi)容服務已進入新賽道-DVBCN

  金山云高級技術總監(jiān)韓博在大會發(fā)表主題演講

  AI內(nèi)容服務隨5G同行

  5G網(wǎng)絡是信息基礎設施又一次全面升級,能為跨領域、全方位、多層次的產(chǎn)業(yè)深度融合提供堅實支撐。韓博表示,5G將促進數(shù)字內(nèi)容制作、分發(fā)、呈現(xiàn)的全產(chǎn)業(yè)鏈升級。AI內(nèi)容服務作為貫穿視頻內(nèi)容生產(chǎn)全過程的重要“參與者”,已做好了迎接5G時代到來的準備。

  以金山云金睛為例,它基于金山云強大的云計算基礎資源能力和海量數(shù)據(jù)積累,專注于圖像識別、語音識別、多模態(tài)視頻分析、文本識別、人臉識別、行人車輛識別等人工智能領域的研究,提供跨行業(yè)、多場景的AI解決方案。在AI內(nèi)容服務方面,已覆蓋內(nèi)容生產(chǎn)、內(nèi)容風控、內(nèi)容分發(fā)全環(huán)節(jié)。

  “我們的生活不僅是一系列的靜態(tài)快照,而是隨著時間變化在現(xiàn)實世界動態(tài)發(fā)生事件,視頻內(nèi)容更是如此。內(nèi)容趨勢的變遷,同時也會推動人工智能技術的演進?;诖?,金山云金睛在單模態(tài)識別的基礎上,升級為多模態(tài)融合理解,以應對5G時代低延時、高速率、龐大體量的AI內(nèi)容服務需求。”韓博介紹道。

5G開啟倒計時  AI內(nèi)容服務已進入新賽道-DVBCN

  多模態(tài)融合理解帶來認知升級

  多模態(tài),簡單來說是相對于單一的視覺、語音、OCR識別等,將多個模態(tài)的信息結(jié)合起來,也就是視頻中的音視圖文內(nèi)容進行綜合判定、理解。相比傳統(tǒng)單一的交互模式,多模態(tài)融合技術。表達效率和表達的信息完整度更高,是智能交互的發(fā)展趨勢。

  韓博介紹,多模態(tài)融合理解技術可以對視頻內(nèi)容進行精準的場景識別、對象跟蹤、行為理解、圖文聯(lián)想等。比如基于單模態(tài)的圖像識別很難判斷出直播過程中,主播是在抽煙,還是在吃棒棒糖。但是基于多模態(tài)的視頻理解,我們可以通過將連貫主播的行為動作進行分析,判斷是否有點煙行為,是否有吐煙行為,從而準確的判斷主播是否在抽煙。

  除此之外,在視頻內(nèi)容的生產(chǎn)過程中,多模態(tài)融合理解技術優(yōu)勢明顯。例如自動進行語音轉(zhuǎn)寫,并且放到指定位置;實現(xiàn)智能BGM功能,根據(jù)視頻內(nèi)容自動推薦背景音樂;支持視頻特效功能,對應視頻場景或者動作,給出視頻特效等。

5G開啟倒計時  AI內(nèi)容服務已進入新賽道-DVBCN

  相對于 AI 目前所展示出在圖像和語音領域的單一感知能力,視頻理解更加復雜,也更加困難,這體現(xiàn)在理解視頻是二者的疊加,實現(xiàn)多模態(tài)融合理解的背后,需要技術的突破。韓博在現(xiàn)場重點介紹了金山云金睛在多模態(tài)理解技術上的突破——AI算法團隊通過訓練超千萬個高質(zhì)量的短視頻,得到的具有很強的泛化能力的內(nèi)容理解模型和金山云金睛專利時序算法。

  多模態(tài)融合理解必須全面捕捉視頻內(nèi)容中的時序信息。金山云內(nèi)容理解模型通過三維時空卷積(3D conv)和三維時空卷積長短時注意力循環(huán)神經(jīng)網(wǎng)絡(LSTM and Attention)來精細捕捉視頻單幀圖片的局部與整體時空信息。受人腦注意力機制的啟發(fā),引入“時空注意力機制”,使得模型可以聚焦關鍵幀、關鍵位置的信息,降低無關幀對模型性能的影響。整個模型不需要任何人工干預,輸入原始視頻,就可以得到最終的預測結(jié)果,整個模型精度高、速度快。

  金山云金睛內(nèi)容識別已經(jīng)全面運用多模態(tài)視頻識別技術進行視頻內(nèi)容處理,可以更加精準的理解視頻內(nèi)容,幫助內(nèi)容平臺快速、精準審核視頻內(nèi)容,以及對視頻進行精準的標簽分類和特征提取,用于內(nèi)容推薦和分發(fā)。為平臺優(yōu)質(zhì)內(nèi)容產(chǎn)出、打通作者和用戶間壁壘,實現(xiàn)平臺差異化布局夯實了技術基礎。

相關文章
四川廣電與四川移動召開共建共享共贏總經(jīng)理聯(lián)席會 目標高度一致
四川廣電與四川移動召開共建共享共贏總…
中國廣電亮相2025中國國際信息通信展覽會,5G基建、數(shù)字文化等方面新成果亮相
中國廣電亮相2025中國國際信息通信展覽…
江蘇有線召開部分公司大眾業(yè)務發(fā)展分析會
江蘇有線召開部分公司大眾業(yè)務發(fā)展分析會
江蘇有線今年5G活躍用戶凈增超50%,ARPU值提升達19%
江蘇有線今年5G活躍用戶凈增超50%,ARPU…
江蘇有線召開2025年8月大眾客戶市場經(jīng)營分析會
江蘇有線召開2025年8月大眾客戶市場經(jīng)營…
中國廣電5G的“新戰(zhàn)法”
中國廣電5G的“新戰(zhàn)法”
我還沒有學會寫個人說明!