音視頻AI多模態(tài)融合引爆產(chǎn)業(yè)變革,華為云領(lǐng)航媒體與智能交互新時(shí)代
近日,在華為開發(fā)者大會(huì)期間,華為云舉辦了《音視頻AI多模態(tài)融合, 媒體 重塑行業(yè)數(shù)字化新價(jià)值》高峰論壇。本次論壇圍繞音視頻AI多模態(tài)融合,分享媒體技術(shù)如何應(yīng)用到千行萬業(yè),與行業(yè)客戶伙伴共同把握AI普惠催生的百億市場(chǎng)機(jī)遇。華為云、引望、人形機(jī)器人(上海)有限公司、微贊直播及安樸酒店等企業(yè)代表齊聚,共同探討AI多模態(tài)技術(shù)如何驅(qū)動(dòng)媒體、智能駕駛、具身智能、直播、酒店等行業(yè)的創(chuàng)新升級(jí)。
“AI for Media, Media for AI”雙輪驅(qū)動(dòng),重構(gòu)媒體生產(chǎn)力
華為云媒體服務(wù)產(chǎn)品部總裁呂陽明在開場(chǎng)演講中指出,人工智能走向多模態(tài)融合,從感知理解邁向深度思考與生成創(chuàng)造,推動(dòng)音視頻產(chǎn)業(yè)進(jìn)入“智能化、個(gè)性化、互動(dòng)化”的新階段。華為云圍繞媒體核心能力,構(gòu)建了音視頻、傳輸、建模、推理、渲染五大能力引擎,同時(shí)將AI與媒體能力深度融合,通過“AI for Media”、“Media for AI”互賦能,重新定義AI時(shí)代的媒體生產(chǎn)力。
???AI for Media:?編解碼+AI(AI MPC)顯著提升畫質(zhì),加速超高清普及;渲染+AI實(shí)現(xiàn)“In-Scene”個(gè)性化廣告;3DGS+AI高效重建毫米級(jí)精度的3D數(shù)字空間;CG+AI(AIG-3D)突破數(shù)據(jù)泛化瓶頸,賦能具身智能訓(xùn)練效率飛躍。
???Media for AI:?AI+RTC(SparkRTC)升級(jí)實(shí)時(shí)互動(dòng)體驗(yàn);AI+數(shù)字人+云會(huì)議推動(dòng)交互從功能邁向情感共生。
端邊云協(xié)同,破解智能駕駛實(shí)時(shí)交互難題
引望ADS云項(xiàng)目經(jīng)理林凌分享了華為乾崑智駕與華為云音視頻技術(shù)的協(xié)同創(chuàng)新。面對(duì)車載場(chǎng)景復(fù)雜網(wǎng)絡(luò)環(huán)境、數(shù)據(jù)安全監(jiān)管高要求情況下保障智駕體驗(yàn)的挑戰(zhàn),通過調(diào)度、網(wǎng)絡(luò)和算法三項(xiàng)技術(shù)攻堅(jiān)實(shí)現(xiàn)突破:
? 網(wǎng)絡(luò)架構(gòu)優(yōu)化:車載物聯(lián)卡就近接入公網(wǎng),RTC專線一跳入云,流量直達(dá)華為云骨干網(wǎng),解決時(shí)延問題;
??弱網(wǎng)抗丟包算法:JSCC算法聯(lián)合信道編碼,幀粒度Pacer提升傳輸管道緩存利用率,50%丟包網(wǎng)絡(luò)下可以正??剀嚭筒榭窜囕v監(jiān)控,保障畫面流暢;
??業(yè)務(wù)分級(jí)傳輸:優(yōu)先保障智駕指令流,傳輸加密、內(nèi)容加密,雙重保證數(shù)據(jù)安全。
“用戶一鍵召喚車輛時(shí), 手機(jī) 可實(shí)時(shí)查看車載攝像頭畫面,這重新定義了人車關(guān)系。”林凌強(qiáng)調(diào),“智能駕駛的發(fā)展趨勢(shì)正從單車智能向多元協(xié)同轉(zhuǎn)變。華為通過手機(jī)、車和云的協(xié)同,構(gòu)建了強(qiáng)大的生態(tài)系統(tǒng)”。
訓(xùn)練場(chǎng)革命:具身智能開發(fā)新范式
上海交通大學(xué)博士,人形機(jī)器人(上海)有限公司具身算法與運(yùn)控框架負(fù)責(zé)人尹云鵬在分享中提出“模型訓(xùn)推+操作系統(tǒng)+具身應(yīng)用”的具身智能新開發(fā)范式。
國(guó)家地方共建人形機(jī)器人創(chuàng)新中心(國(guó)地中心)打造了全國(guó)首個(gè)虛實(shí)融合異構(gòu)人形機(jī)器人訓(xùn)練場(chǎng),并構(gòu)建虛擬仿真采集場(chǎng)、實(shí)現(xiàn)訓(xùn)練數(shù)據(jù)增廣和仿真數(shù)據(jù)高效生成,完成智能開發(fā)效率的突破?!皞鹘y(tǒng)機(jī)械臂訓(xùn)練需1周的數(shù)據(jù)采集,現(xiàn)在1天即可完成。這是具身智能落地的關(guān)鍵一躍。”尹云鵬表示。
國(guó)地中心發(fā)布了全球首個(gè)百萬量級(jí)、真實(shí)場(chǎng)景、異構(gòu)機(jī)器人平臺(tái)的高質(zhì)量具身數(shù)據(jù)集“白虎數(shù)據(jù)集”,構(gòu)建“訓(xùn)練場(chǎng)-異構(gòu)數(shù)據(jù)-具身智能開發(fā)平臺(tái)-模型”的全鏈路平臺(tái),希望以國(guó)地中心具身智能開發(fā)的共性技術(shù)賦能人形機(jī)器人產(chǎn)業(yè),聯(lián)合行業(yè)所有生產(chǎn)伙伴推進(jìn)具身智能開發(fā)的新升級(jí)。
直播新體驗(yàn):AI媒體處理+低時(shí)延網(wǎng)絡(luò)雙輪驅(qū)動(dòng)
微贊直播副總裁何祖恒分享了技術(shù)賦能直播 營(yíng)銷 的實(shí)踐,深度解讀了微贊依托華為云技術(shù)底座打造的一站式私域直播解決方案,為企業(yè)數(shù)字化轉(zhuǎn)型提供創(chuàng)新路徑與工具。
微贊直播聚焦企業(yè)私域場(chǎng)景,依托華為云領(lǐng)先的音視頻基礎(chǔ)技術(shù)方案,創(chuàng)新性地以“低延時(shí)網(wǎng)絡(luò)+AI媒體處理”雙向驅(qū)動(dòng),打造高并發(fā)、超低延遲、高清流暢且安全可靠的直播服務(wù)體系。
微贊直播方案深度整合華為云音視頻技術(shù),通過實(shí)現(xiàn)超低延時(shí)播放與AI智能畫質(zhì)增強(qiáng),雙效保障觀眾端的優(yōu)質(zhì)體驗(yàn)。一方面,方案顯著降低播放延遲,確保流暢實(shí)時(shí)互動(dòng);另一方面,AI媒體轉(zhuǎn)碼結(jié)合音視頻大模型,可自動(dòng)優(yōu)化畫質(zhì),提升清晰度、豐富細(xì)節(jié)與色彩表現(xiàn),有效控制碼率,進(jìn)一步提升了直播的效率和呈現(xiàn)效果。
酒店賓客數(shù)字化體驗(yàn)升級(jí):AI數(shù)字人點(diǎn)亮旅居新故事
安樸酒店管理有限公司IT總監(jiān)孫海龍分享了酒店行業(yè)數(shù)字化的新趨勢(shì)和自身的實(shí)踐經(jīng)驗(yàn),他提到,賓客數(shù)字化體驗(yàn)躍居酒店行業(yè)數(shù)字化目標(biāo)首位,這反映出行業(yè)從“流量爭(zhēng)奪”向“體驗(yàn)深耕”逐步轉(zhuǎn)變。安樸酒店的智能交互數(shù)字人管家,打造酒店行業(yè)的AI創(chuàng)新,從傳統(tǒng)的人機(jī)對(duì)話、或賓客通過給前臺(tái)打電話的溝通方式,變成人和“人”的面對(duì)面交流,讓賓客有了不一樣的入住體驗(yàn)。
在酒店大堂,安樸打造數(shù)字人禮賓服務(wù),提升酒店的服務(wù)效率;在客房場(chǎng)景,安樸對(duì)客房電視進(jìn)行升級(jí),基于盤古大模型的智能交互數(shù)字人的植入,讓原本功能單一的電視機(jī)搖身一變成為智慧中樞。數(shù)字人的多重角色,幫助酒店重塑數(shù)字化體驗(yàn)。
“數(shù)字人不僅是工具,更是酒店的情感連接器?!睂O海龍總結(jié)道。AI 數(shù)字人帶來的不僅是服務(wù)模式的創(chuàng)新,更是提升競(jìng)爭(zhēng)力、實(shí)現(xiàn)營(yíng)收增長(zhǎng)的新引擎。安樸酒店的數(shù)字人管家應(yīng)用,為酒店行業(yè)的數(shù)字化升級(jí)提供了可借鑒的范本。
AI與音視頻的融合已抵達(dá)產(chǎn)業(yè)爆發(fā)的臨界點(diǎn),當(dāng)技術(shù)創(chuàng)新與行業(yè)痛點(diǎn)深度咬合,數(shù)字化價(jià)值釋放才真正開始。華為云將持續(xù)開放五大引擎能力,與開發(fā)者、伙伴共同定義智能交互新范式,邁向更加“智能化、個(gè)性化、互動(dòng)化”的媒體時(shí)代。