• <fieldset id="82iqi"></fieldset>
    <tfoot id="82iqi"><input id="82iqi"></input></tfoot>
  • 
    <abbr id="82iqi"></abbr><strike id="82iqi"></strike>
  • 多語種虛擬主播,「掰頭」央視記者,新聞可以AI編?

    IDC在最新的報告中指出,隨著AI技術(shù)的進(jìn)步,媒體在內(nèi)容的生產(chǎn)、管理、分發(fā)和交互上都發(fā)生著本質(zhì)的變化。

    那么,我們不禁要問:

    5G、8K、AI……未來媒體會是什么模樣?

    內(nèi)容、技術(shù)、責(zé)任……媒體融合如何持續(xù)深入?

    近日,2021年中國網(wǎng)絡(luò)媒體論壇在廣州召開。

    在這個被譽為「觀察中國網(wǎng)絡(luò)媒體發(fā)展走向重要窗口」的年度盛會上,來自中央和國家機(jī)關(guān),中央新聞單位,以及業(yè)界專家學(xué)者、編輯記者和社會各界代表紛紛出席。

    這場論壇,究竟有多大的吸引力?

    現(xiàn)場,中央廣播電視總臺記者和數(shù)字虛擬主播小C進(jìn)行了一場新聞播報語速大PK,你猜誰更勝一籌?

    百度?虛擬主播小C

    另外,央視新聞的首個「冬奧AI手語主播」在網(wǎng)絡(luò)媒體論壇上正式亮相。她將在2022年冬奧會上為中國聽障人群帶來手語服務(wù)。?

    ?

    百度AI手語主播

    除了虛擬人小C和手語主播,科大訊飛自主研發(fā)的全球首個多語種AI虛擬主播小晴也在論壇上展出。

    ?

    「大家好,我是科大訊飛AI虛擬主播小晴,我可以用多語種進(jìn)行播報。」

    這位端莊大氣的女主播說話聲音、動作和神情惟妙惟肖,讓人難以分辨是真是假。她不僅可以用30余種(含外語及方言)語言播報新聞,還支持文本到視頻的自動輸出。

    科大訊飛多語種AI虛擬主播小晴

    此次論壇上匯集了來自中央和地方新聞單位、知名互聯(lián)網(wǎng)企業(yè)、縣級融媒體中心等43家單位。他們紛紛亮出自家的網(wǎng)絡(luò)媒體「黑科技」。

    可以看出,人工智能的發(fā)展已經(jīng)讓這個信息社會進(jìn)入了融媒體時代,AI+媒體正在進(jìn)行中...

    AI助力媒體的智能轉(zhuǎn)型

    過去,新聞由人來完成,現(xiàn)在,語音識別、語音合成、機(jī)器翻譯、圖像識別、自然語言處理等人工智能技術(shù)正在改變媒體傳統(tǒng)故事的生產(chǎn)和傳播方式。

    從國內(nèi)來看,2015年,騰訊財經(jīng)最先發(fā)表了由Dreamwriter新聞寫作機(jī)器人編寫的經(jīng)濟(jì)消息,開創(chuàng)了中國機(jī)器人寫稿先河。

    騰訊寫作機(jī)器人編寫的新聞

    由此看出,AI從最初進(jìn)駐新聞機(jī)構(gòu),到寫稿機(jī)器人交出新聞稿,再到機(jī)器人搶獨家新聞,前后不過3-4年時間。

    那么,效果如何?

    2019年,新華社智能化編輯部建成運行,在智能系統(tǒng)助力下,生產(chǎn)效率可提升3-5倍。

    在AI加入之后,媒體的融合也不是一蹴而就的,其先后經(jīng)歷了「從流程中心轉(zhuǎn)變?yōu)閿?shù)據(jù)中心」的數(shù)媒時代,「從新媒體轉(zhuǎn)向為融媒體」的融媒時代。現(xiàn)在則是探索「大數(shù)據(jù)+智能化為賦能」的智媒時代。

    近日,IDC發(fā)布了一份關(guān)于《「AI+媒體」助力內(nèi)容生產(chǎn)、審核、分發(fā)、創(chuàng)新四大環(huán)節(jié)》的報告。

    報告顯示,近年來中國智能媒體解決方案的市場規(guī)模正處在快速增長的階段。僅2020年的規(guī)模就已經(jīng)達(dá)到了4.8億元人民幣,并預(yù)計在2021年底達(dá)7億元左右。

    復(fù)合年均增長率(CAGR)方面,2020到2025年期間將達(dá)到46.3%,尤其是2022年,增長率預(yù)計將超過50%,達(dá)到近5年的峰值。

    中國智能媒體解決方案市場規(guī)模預(yù)測

    從智能媒體市場生態(tài)上來看,科大訊飛、百度智能云、阿里云等公司基于自身的AI技術(shù)能力,面向媒體等相關(guān)領(lǐng)域打造越來越豐富、深入場景的產(chǎn)品及垂直行業(yè)解決方案。

    智能媒體市場生態(tài)(來源:IDC報告)

    在AI賦能傳統(tǒng)媒體這條路上,這些企業(yè)給出了很多「AI+媒體」的想象,尤其是那些綜合AI技術(shù)供應(yīng)商。

    比如,基于人臉識別、知識圖譜、語音等技術(shù),阿里云視頻和人民日報社共同研發(fā)的「人民日報社AI智能編輯部」,為媒體的新聞采編生產(chǎn)提供了看、聽、悟、審、查等各方面能力。

    人民日報社AI智能編輯部

    新華智云則是將AI能力與媒體行業(yè)場景結(jié)合,自主研發(fā)了覆蓋媒體生產(chǎn)策、采、寫、編、發(fā)、審全流程的「媒體大腦」。

    同樣,以人工智能為核心的科大訊飛「AI+媒體」整體解決方案早已在媒介傳播「采編播審存」的各個環(huán)節(jié)落地應(yīng)用。

    這背后,便是科大訊飛22年來在AI領(lǐng)域深耕的成果,尤其是語音技術(shù)基礎(chǔ)算法貫穿了科大訊飛「AI+媒體」整個解決方案。

    其中,以虛擬主播進(jìn)行新聞播報的「播」,可以說是最具有代表性的一環(huán)了。

    虛擬主播演變史

    多年來,基于語音合成、人臉識別、圖像合成、機(jī)器翻譯等多項AI技術(shù),科大訊飛推出了一代又一代虛擬人。

    2018年,科大訊飛和南方財經(jīng)推出AI虛擬主播俎江濤「上崗」,播報了當(dāng)天的財經(jīng)新聞。

    在科大訊飛先進(jìn)的語音合成技術(shù)加持下推出的虛擬主播,通過模仿真實主持人俎江濤的聲音,使其音質(zhì)及自然度更加貼近本人的聲音。

    此后,以虛擬主播「小晴」為代表的語音+圖像的AI虛擬主播家族陸續(xù)上崗,小晴還可以講30多種語言。

    科大訊飛AI虛擬主播家族

    他們都是通過采集錄制真人的聲音素材,再通過聲音標(biāo)注以及機(jī)器的深度學(xué)習(xí)算法,構(gòu)建發(fā)音聲學(xué)模型建成。

    再應(yīng)用上圖像處理等技術(shù),使得他們在播報過程能達(dá)到自然的表情和精準(zhǔn)的口型。

    為了讓虛擬主播從聲音到形象都能實現(xiàn)多元化,科大訊飛陸續(xù)推出了定制化多語種AI虛擬主播。

    就比如,2019年,科大訊飛與中央廣播電視總臺聯(lián)合打造AI虛擬記者「通通」,在視頻中帶領(lǐng)觀眾游歷「一帶一路」沿途的風(fēng)土人情。

    科大訊飛AI虛擬記者通通

    緊接著在同年央視4套五一特別節(jié)目中,科大訊飛打造出虛擬主播形象「紀(jì)小萌」亮相。

    還有人民日報和訊飛聯(lián)手打造虛擬主播「果果」亮相數(shù)博會現(xiàn)場,能夠流利地向觀眾播報國內(nèi)外熱點事件。

    科大訊飛虛擬主播果果

    之后,合肥電視臺定制了男女雙主播「王小健」和「馬小騰」。2020年3月,新華報業(yè)聯(lián)合訊飛推出交匯點云媒的虛擬主播「匯匯」,能聽會說,還能懂你。

    科大訊飛虛擬主播匯匯

    在剛剛過去的第四屆世界聲博會暨2021科大訊飛全球1024開發(fā)者節(jié)上,科大訊飛董事長劉慶峰發(fā)布了業(yè)界首個虛擬人交互系統(tǒng),一分鐘就可以定制一個虛擬人。

    科大訊飛個性化真人捏臉系統(tǒng),支持根據(jù)個人喜好快速生成3D個性化人臉的主播視頻

    現(xiàn)場,虛擬人愛加和大家打招呼。

    一路走來,訊飛虛擬人在推進(jìn)媒體智能化過程中經(jīng)歷不斷迭代升級。

    這些虛擬主播能與真人無異地播報新聞的背后,其實都是科大訊飛的人工智能技術(shù)在助力。

    從最初語音合成主播,到語音+圖像的多語種AI主播,再到現(xiàn)在由語音識別、語義理解、語音合成、虛擬形象等多種AI技術(shù)加持下的虛擬人,科大訊飛在AI+媒體中的「播」這一環(huán)節(jié)一直在攀登。

    當(dāng)然,采、編、審、存也不例外。

    構(gòu)建完整的AI+媒體解決方案

    巧婦難為無米之炊,對于內(nèi)容的生產(chǎn),素材的采集可以說是重中之重了。

    在2019年的兩會現(xiàn)場,《中國日報》抖音號的一個小視頻分分鐘播放量突破一千萬,點贊數(shù)超過五十萬。

    只見會場里,拿著手機(jī)、錄音筆、單反等設(shè)備的記者把被采訪人圍著水泄不通,而《中國日報》的記者則淡定地站在人群外面,手機(jī)的屏幕上顯示著講話的文字,完全不同于其他記者的緊張狀態(tài)。

    而記者當(dāng)時用的,正是訊飛聽見的APP。

    中國日報記者在兩會現(xiàn)場使用訊飛聽見APP

    一直以來,整理采訪錄音都是非常繁瑣的工作。1個小時的錄音,整理成文字大概要花費3個小時以上的時間。

    于是,科大訊飛在「采」這個環(huán)節(jié)上,推出了訊飛聽見APP、錄音筆等設(shè)備。

    通過語音和機(jī)器翻譯技術(shù),不僅可以實現(xiàn)最基礎(chǔ)的錄音功能,而且還可以實時看到相應(yīng)的文字版本。

    而且在科大訊飛的語音技術(shù)加持下,除了可以將現(xiàn)場語音1秒轉(zhuǎn)換成文字,還可以只用5到10分鐘就把1個小時的會議內(nèi)容轉(zhuǎn)換成文稿,極大地提高了出稿效率。

    現(xiàn)在,科大訊飛更是支持8大語種、12種方言和2個民族語言的實時轉(zhuǎn)寫,讓記者們可以在更多的場景下高效的獲取文字素材。

    科大訊飛錄音筆

    有了素材,接下來就到了「編」這個步驟。

    為此,訊飛推出了「智能文稿唱詞系統(tǒng)」和「智能直播字幕系統(tǒng)」。

    文稿唱詞系統(tǒng)集成了采集、轉(zhuǎn)碼、轉(zhuǎn)寫、音頻編輯等功能,可以實現(xiàn)5-10分鐘將1小時的音頻轉(zhuǎn)寫成文稿和字幕。

    早在2019年科大訊飛就為中央電視臺的春節(jié)聯(lián)歡晚會提供了字幕制作支持,其文稿唱詞系統(tǒng)將傳統(tǒng)的流程簡化為語音AI轉(zhuǎn)寫、核對修改、字幕生成審核三步。

    對于字幕/時碼的編輯校驗工作來說,所需的人員數(shù)量從往年的16人減少到4人,平均的制作時間也減少23%,有效地減輕了字幕編輯者的負(fù)擔(dān)。

    此外,在這個環(huán)節(jié)中還有直播字幕系統(tǒng),可以在進(jìn)行直播工作的同時,提供高正確率的初稿字幕文本。

    央視春晚字幕制作

    新聞在正式發(fā)布之前,「審」顯然是必不可少的。

    同樣,訊飛推出了相應(yīng)的「智能內(nèi)容監(jiān)審平臺」。

    通過語音轉(zhuǎn)寫、人臉識別、聲紋識別等人工智能技術(shù),可以從關(guān)鍵詞、人臉、圖片以及聲紋等不同維度與關(guān)鍵庫信息進(jìn)行匹配,承擔(dān)起新聞質(zhì)量「把關(guān)人」的責(zé)任。

    新聞信息安全審核管理系統(tǒng)

    最后,在「存」這個環(huán)節(jié),訊飛推出了「智能內(nèi)容管理平臺」。

    利用語音識別,聲紋識別,人臉識別,NLP 等人工智能技術(shù),智能內(nèi)容管理平臺提供了音視頻內(nèi)容監(jiān)管、檢索、自動編目、自動化標(biāo)簽等功能。

    由此,也就解決了困擾音視頻管理多年的檢索和編目困難的問題。

    智能內(nèi)容管理平臺

    那么,這個「采編播審存」和其他的方案又有何不同呢?

    從IDC的報告中可以看出,現(xiàn)階段智能媒體的流程可以概括為:素材的輸入,內(nèi)容的生產(chǎn),成品的輸出,以及審核和管理。

    而這對應(yīng)的也就是,采、編、播、審、存這5個環(huán)節(jié)。(從設(shè)定的重合度上來說,創(chuàng)新應(yīng)用完全可以放到「播」這個環(huán)節(jié)。)

    智能媒體技術(shù)架構(gòu)圖(來源:IDC報告)

    當(dāng)然,如果想細(xì)化一些,分發(fā)運營也有對應(yīng)的解決方案:內(nèi)容運營和內(nèi)容傳播。

    AI智慧媒體解決方案生態(tài)架構(gòu)

    所以其實不難得出,從最初素材的收集到最終呈現(xiàn)的新聞,科大訊飛憑借著自己的生態(tài)構(gòu)成了一個完整的AI+媒體解決方案。

    而從始至終不變的是,科大訊飛在語音方面的核心能力。從語音合成技術(shù)一直到現(xiàn)在AI虛擬人,科大訊飛在人工智能發(fā)展史上樹立了里程碑。

    人工智能發(fā)展史

    比人類更強大的不是AI,而是掌握了AI的新人類。在新聞傳播領(lǐng)域,比傳統(tǒng)采編更強大的不是虛擬主播,而是掌握了虛擬主播、掌握了AI賦能之下「采、編、播、審、存」能力的AI新聞人。

    從讓設(shè)備發(fā)聲到讓新聞發(fā)聲,科大訊飛一直在改變著世界溝通的方式。

    未來,我們或許也可以從「靜默如謎」變成「萬物有靈」吧。

    參考資料:

    https://www.iflyrec.com/html/products/zhmt.html

    https://www.sohu.com/a/354525160_609520

    https://www.xfyun.cn/solution/AI-smart-media-solution

    https://baijiahao.baidu.com/s?id=1627258276246348865&wfr=spider&for=pc

    https://www.sohu.com/a/503103748_99900743

    本文來自微信公眾號“新智元”(ID:AI_era),作者:新智元,36氪經(jīng)授權(quán)發(fā)布。