多語種虛擬主播,「掰頭」央視記者,新聞可以AI編?
IDC在最新的報告中指出,隨著AI技術的進步,媒體在內容的生產、管理、分發和交互上都發生著本質的變化。
那么,我們不禁要問:
5G、8K、AI……未來媒體會是什么模樣?
內容、技術、責任……媒體融合如何持續深入?
近日,2021年中國網絡媒體論壇在廣州召開。
在這個被譽為「觀察中國網絡媒體發展走向重要窗口」的年度盛會上,來自中央和國家機關,中央新聞單位,以及業界專家學者、編輯記者和社會各界代表紛紛出席。
這場論壇,究竟有多大的吸引力?
現場,中央廣播電視總臺記者和數字虛擬主播小C進行了一場新聞播報語速大PK,你猜誰更勝一籌?
百度?虛擬主播小C
另外,央視新聞的首個「冬奧AI手語主播」在網絡媒體論壇上正式亮相。她將在2022年冬奧會上為中國聽障人群帶來手語服務。?
?
百度AI手語主播
除了虛擬人小C和手語主播,科大訊飛自主研發的全球首個多語種AI虛擬主播小晴也在論壇上展出。
?
「大家好,我是科大訊飛AI虛擬主播小晴,我可以用多語種進行播報?!?/p>
這位端莊大氣的女主播說話聲音、動作和神情惟妙惟肖,讓人難以分辨是真是假。她不僅可以用30余種(含外語及方言)語言播報新聞,還支持文本到視頻的自動輸出。
科大訊飛多語種AI虛擬主播小晴
此次論壇上匯集了來自中央和地方新聞單位、知名互聯網企業、縣級融媒體中心等43家單位。他們紛紛亮出自家的網絡媒體「黑科技」。
可以看出,人工智能的發展已經讓這個信息社會進入了融媒體時代,AI+媒體正在進行中...
AI助力媒體的智能轉型
過去,新聞由人來完成,現在,語音識別、語音合成、機器翻譯、圖像識別、自然語言處理等人工智能技術正在改變媒體傳統故事的生產和傳播方式。
從國內來看,2015年,騰訊財經最先發表了由Dreamwriter新聞寫作機器人編寫的經濟消息,開創了中國機器人寫稿先河。
騰訊寫作機器人編寫的新聞
由此看出,AI從最初進駐新聞機構,到寫稿機器人交出新聞稿,再到機器人搶獨家新聞,前后不過3-4年時間。
那么,效果如何?
2019年,新華社智能化編輯部建成運行,在智能系統助力下,生產效率可提升3-5倍。
在AI加入之后,媒體的融合也不是一蹴而就的,其先后經歷了「從流程中心轉變為數據中心」的數媒時代,「從新媒體轉向為融媒體」的融媒時代。現在則是探索「大數據+智能化為賦能」的智媒時代。
近日,IDC發布了一份關于《「AI+媒體」助力內容生產、審核、分發、創新四大環節》的報告。
報告顯示,近年來中國智能媒體解決方案的市場規模正處在快速增長的階段。僅2020年的規模就已經達到了4.8億元人民幣,并預計在2021年底達7億元左右。
復合年均增長率(CAGR)方面,2020到2025年期間將達到46.3%,尤其是2022年,增長率預計將超過50%,達到近5年的峰值。
中國智能媒體解決方案市場規模預測
從智能媒體市場生態上來看,科大訊飛、百度智能云、阿里云等公司基于自身的AI技術能力,面向媒體等相關領域打造越來越豐富、深入場景的產品及垂直行業解決方案。
智能媒體市場生態(來源:IDC報告)
在AI賦能傳統媒體這條路上,這些企業給出了很多「AI+媒體」的想象,尤其是那些綜合AI技術供應商。
比如,基于人臉識別、知識圖譜、語音等技術,阿里云視頻和人民日報社共同研發的「人民日報社AI智能編輯部」,為媒體的新聞采編生產提供了看、聽、悟、審、查等各方面能力。
人民日報社AI智能編輯部
新華智云則是將AI能力與媒體行業場景結合,自主研發了覆蓋媒體生產策、采、寫、編、發、審全流程的「媒體大腦」。
同樣,以人工智能為核心的科大訊飛「AI+媒體」整體解決方案早已在媒介傳播「采編播審存」的各個環節落地應用。
這背后,便是科大訊飛22年來在AI領域深耕的成果,尤其是語音技術基礎算法貫穿了科大訊飛「AI+媒體」整個解決方案。
其中,以虛擬主播進行新聞播報的「播」,可以說是最具有代表性的一環了。
虛擬主播演變史
多年來,基于語音合成、人臉識別、圖像合成、機器翻譯等多項AI技術,科大訊飛推出了一代又一代虛擬人。
2018年,科大訊飛和南方財經推出AI虛擬主播俎江濤「上崗」,播報了當天的財經新聞。
在科大訊飛先進的語音合成技術加持下推出的虛擬主播,通過模仿真實主持人俎江濤的聲音,使其音質及自然度更加貼近本人的聲音。
此后,以虛擬主播「小晴」為代表的語音+圖像的AI虛擬主播家族陸續上崗,小晴還可以講30多種語言。
科大訊飛AI虛擬主播家族
他們都是通過采集錄制真人的聲音素材,再通過聲音標注以及機器的深度學習算法,構建發音聲學模型建成。
再應用上圖像處理等技術,使得他們在播報過程能達到自然的表情和精準的口型。
為了讓虛擬主播從聲音到形象都能實現多元化,科大訊飛陸續推出了定制化多語種AI虛擬主播。
就比如,2019年,科大訊飛與中央廣播電視總臺聯合打造AI虛擬記者「通通」,在視頻中帶領觀眾游歷「一帶一路」沿途的風土人情。
科大訊飛AI虛擬記者通通
緊接著在同年央視4套五一特別節目中,科大訊飛打造出虛擬主播形象「紀小萌」亮相。
還有人民日報和訊飛聯手打造虛擬主播「果果」亮相數博會現場,能夠流利地向觀眾播報國內外熱點事件。
科大訊飛虛擬主播果果
之后,合肥電視臺定制了男女雙主播「王小健」和「馬小騰」。2020年3月,新華報業聯合訊飛推出交匯點云媒的虛擬主播「匯匯」,能聽會說,還能懂你。
科大訊飛虛擬主播匯匯
在剛剛過去的第四屆世界聲博會暨2021科大訊飛全球1024開發者節上,科大訊飛董事長劉慶峰發布了業界首個虛擬人交互系統,一分鐘就可以定制一個虛擬人。
科大訊飛個性化真人捏臉系統,支持根據個人喜好快速生成3D個性化人臉的主播視頻
現場,虛擬人愛加和大家打招呼。
一路走來,訊飛虛擬人在推進媒體智能化過程中經歷不斷迭代升級。
這些虛擬主播能與真人無異地播報新聞的背后,其實都是科大訊飛的人工智能技術在助力。
從最初語音合成主播,到語音+圖像的多語種AI主播,再到現在由語音識別、語義理解、語音合成、虛擬形象等多種AI技術加持下的虛擬人,科大訊飛在AI+媒體中的「播」這一環節一直在攀登。
當然,采、編、審、存也不例外。
構建完整的AI+媒體解決方案
巧婦難為無米之炊,對于內容的生產,素材的采集可以說是重中之重了。
在2019年的兩會現場,《中國日報》抖音號的一個小視頻分分鐘播放量突破一千萬,點贊數超過五十萬。
只見會場里,拿著手機、錄音筆、單反等設備的記者把被采訪人圍著水泄不通,而《中國日報》的記者則淡定地站在人群外面,手機的屏幕上顯示著講話的文字,完全不同于其他記者的緊張狀態。
而記者當時用的,正是訊飛聽見的APP。
中國日報記者在兩會現場使用訊飛聽見APP
一直以來,整理采訪錄音都是非常繁瑣的工作。1個小時的錄音,整理成文字大概要花費3個小時以上的時間。
于是,科大訊飛在「采」這個環節上,推出了訊飛聽見APP、錄音筆等設備。
通過語音和機器翻譯技術,不僅可以實現最基礎的錄音功能,而且還可以實時看到相應的文字版本。
而且在科大訊飛的語音技術加持下,除了可以將現場語音1秒轉換成文字,還可以只用5到10分鐘就把1個小時的會議內容轉換成文稿,極大地提高了出稿效率。
現在,科大訊飛更是支持8大語種、12種方言和2個民族語言的實時轉寫,讓記者們可以在更多的場景下高效的獲取文字素材。
科大訊飛錄音筆
有了素材,接下來就到了「編」這個步驟。
為此,訊飛推出了「智能文稿唱詞系統」和「智能直播字幕系統」。
文稿唱詞系統集成了采集、轉碼、轉寫、音頻編輯等功能,可以實現5-10分鐘將1小時的音頻轉寫成文稿和字幕。
早在2019年科大訊飛就為中央電視臺的春節聯歡晚會提供了字幕制作支持,其文稿唱詞系統將傳統的流程簡化為語音AI轉寫、核對修改、字幕生成審核三步。
對于字幕/時碼的編輯校驗工作來說,所需的人員數量從往年的16人減少到4人,平均的制作時間也減少23%,有效地減輕了字幕編輯者的負擔。
此外,在這個環節中還有直播字幕系統,可以在進行直播工作的同時,提供高正確率的初稿字幕文本。
央視春晚字幕制作
新聞在正式發布之前,「審」顯然是必不可少的。
同樣,訊飛推出了相應的「智能內容監審平臺」。
通過語音轉寫、人臉識別、聲紋識別等人工智能技術,可以從關鍵詞、人臉、圖片以及聲紋等不同維度與關鍵庫信息進行匹配,承擔起新聞質量「把關人」的責任。
新聞信息安全審核管理系統
最后,在「存」這個環節,訊飛推出了「智能內容管理平臺」。
利用語音識別,聲紋識別,人臉識別,NLP 等人工智能技術,智能內容管理平臺提供了音視頻內容監管、檢索、自動編目、自動化標簽等功能。
由此,也就解決了困擾音視頻管理多年的檢索和編目困難的問題。
智能內容管理平臺
那么,這個「采編播審存」和其他的方案又有何不同呢?
從IDC的報告中可以看出,現階段智能媒體的流程可以概括為:素材的輸入,內容的生產,成品的輸出,以及審核和管理。
而這對應的也就是,采、編、播、審、存這5個環節。(從設定的重合度上來說,創新應用完全可以放到「播」這個環節。)
智能媒體技術架構圖(來源:IDC報告)
當然,如果想細化一些,分發運營也有對應的解決方案:內容運營和內容傳播。
AI智慧媒體解決方案生態架構
所以其實不難得出,從最初素材的收集到最終呈現的新聞,科大訊飛憑借著自己的生態構成了一個完整的AI+媒體解決方案。
而從始至終不變的是,科大訊飛在語音方面的核心能力。從語音合成技術一直到現在AI虛擬人,科大訊飛在人工智能發展史上樹立了里程碑。
人工智能發展史
比人類更強大的不是AI,而是掌握了AI的新人類。在新聞傳播領域,比傳統采編更強大的不是虛擬主播,而是掌握了虛擬主播、掌握了AI賦能之下「采、編、播、審、存」能力的AI新聞人。
從讓設備發聲到讓新聞發聲,科大訊飛一直在改變著世界溝通的方式。
未來,我們或許也可以從「靜默如謎」變成「萬物有靈」吧。
參考資料:
https://www.iflyrec.com/html/products/zhmt.html
https://www.sohu.com/a/354525160_609520
https://www.xfyun.cn/solution/AI-smart-media-solution
https://baijiahao.baidu.com/s?id=1627258276246348865&wfr=spider&for=pc
https://www.sohu.com/a/503103748_99900743
本文來自微信公眾號“新智元”(ID:AI_era),作者:新智元,36氪經授權發布。