• <fieldset id="82iqi"></fieldset>
    <tfoot id="82iqi"><input id="82iqi"></input></tfoot>
  • 
    <abbr id="82iqi"></abbr><strike id="82iqi"></strike>
  • 每日信息:人工智能的“高考”時刻,AI大模型打先鋒

    作者|徐珊

    編輯|漠影

    “高考作文全國甲卷考了紅樓夢”、“作文好難呀,我真不會寫”……

    高考語文剛剛結束,有關高考作文紅樓夢的話題直接沖上了微博熱搜。雙奧之城、跨越再跨越,對于這些作文題的討論,讓大家一秒重回高考現場。

    就在大家為高考作文爭論不休之際,有一位“考生”卻在萬人監考下,僅花 40秒就寫完了 40篇800字的高考作文。

    曾擔任北京高考語文閱卷組組長的老師申怡,根據高考語文作文的評分標準給出了 48分的高分。這說明這篇高考作文在立意、語言流暢程度以及修辭應用上已經相當優秀。

    ▲百度虛擬數字人度曉曉

    這位神秘的學霸何許人也?這篇文章什么來路?

    資料圖片僅供參考

    事實上,這是百度虛擬數字人度曉曉第一次參加高考,根據全國新高考I卷“本手、妙手、俗手”的作文題,度曉曉在 40秒時間內寫完了 40篇800字高考作文,平均一秒完成一篇,最后選出最好的一篇交給老師評分。

    ▲度曉曉高考作文《苦練本手,方能妙手隨成》節選

    “一日新,翌日新,日日新”、“窮山距海,不能限也”、“朝乾夕惕”……在這篇金句頻出的高考作文中,我們可以看到度曉曉擁有龐大的知識貯備以及靈活的語言應用能力。

    我們已經知道,這個由AI大模型武裝大腦的虛擬數字人,之所以能夠出口成章,妙筆生花,背后依靠的是百度文心大模型的底層技術支撐。

    那她是如何準確理解題意,并寫出一篇高分作文的呢?AI內容創作又有哪些新玩法,AI大模型將為產業帶來哪些新變化?在經過一番深入調查,并與百度相關負責人交流后,我們找到了答案。

    從審題到答題AI大模型如何摸透高考作文命脈?

    近日,一位B站UP主嘗試通過AI大模型讓AI寫出高考作文,一探AI的文字功底。而他采用的這套AI大模型正是 百度文心大模型,也就是百度度曉曉背后提供技術支持的AI大模型。

    具體來說,此次采用的是百度最新發布的 千億參數的AI大模型百度ERNIE 3.0 Zeus(宙斯),其從萬億級字符、千萬級知識圖譜和數百個任務中融合學習,同樣能夠完成開放問答、信息抽取、情感分析、語義匹配等各類NLP任務。

    ▲ERNIE 3.0 Zeus大模型

    就拿AI寫高考作文舉例,度曉曉寫高考作文和其他的AI文本生成器有何不同?從中我們或許能一窺千億參數的AI大模型將會帶來哪些質變。

    要想教會AI寫出一篇完整的高考作文?這可不是件容易事。

    無論是AI還是人類,都需要先審題。不過AI的審題方式與人類有所不同,它們主要通過識別網絡和卷積神經網絡從大段的作文素材中提取題目,并將其遞給下一神經網絡。

    而難倒無數考生的立意過程,對于AI來說也是不小的挑戰。AI需要通過一整套讀題網絡來猜測哪一個立意更有可能是正確立意。由AI創作的一些搞笑文章,往往都是在這個階段出現了一定偏差。

    隨后寫作的過程,則是根據考生的寫作習慣各自選擇的階段。而AI也會在大量的訓練后建立自己的寫作模型。

    和人類不同的是,AI可以在極短的時間內“寫完”多篇高考作文,但也比人們多出一個步驟,找到最好的一篇高考作文。而這個“最好”的評判標準,也是AI在大量的訓練中自己得出的一套標準。

    但這里還不是重點,此時的AI只能說完成了一篇高考作文。要想讓AI能夠寫出高分作文,AI同樣需要像人類一樣,在千錘百煉中成長。在AI成長的預訓練過程中,ERNIE 3.0 Zeus與其他文本生成器的差距就此拉開。

    千億參數的AI大模型調動龐大的計算能力意味著研究人員可以“喂養”大量的作文樣本數據讓AI明白什么是高分作文。AI大模型在訓練中建立自己的寫作模型,就像人類的“文風”。最后根據給定的題目,生成與需求匹配的內容,從而完成寫作。

    同時,研發人員也可以在微調的過程中改變AI大模型的懲罰條件,幫助AI大模型摸索出高分作文的潛在條件。

    但值得注意的是,盡管AI可以寫出來高分作文, 這并不意味著AI和高考生一樣,完全明白高考作文需要從立意明確、語言流暢、修辭豐富等三個標準評判,而是AI大模型通過數據自行對比高分作文之間的共性特點,然后通過數據分析,選出最合適的下一句,由此完成一篇高考作文。

    可以顯而易見的是,這樣的處理方式不免會存在一定的漏洞,哪怕是度曉曉生成40多篇文章中也會存在一定不足之處。比如說《苦練本手,方能妙手隨成》高考作文中的出現的YYDS之類的網絡用語,是不符合高考標準的。再比如說“紅樓夢”高考作文中對文章立意的理解會稍有偏差。

    ▲度曉曉高考作文中出現網絡用語YYDS

    但這些不能藏住AI大模型的光芒。正是通過ERNIE 3.0 Zeus千億參數的大模型以及對于NLP程序語言的優化,AI才能學會高考作文的結構框架、輸出800字語言流暢的長文本和引經據典以及合理使用名人名言。

    另一方面,也是通過百度文心大模型,我們可以看見AI寫作早已經今時不同往日。

    過往,人們一談到AI內容創作總會想到廢話文學,而百度文心大模型向我們展示AI的文字表達已經和多數的高中生語言表達能力相當,甚至更優一些。

    度曉曉以百度文心大模型為技術支撐,給出了一份高分作文,也正說明了AI內容創作的時代已經拉開了新的篇章。

    讓AI成為內容創作新主體大模型手握兩大殺手锏

    AI的創作水平究竟提高到什么水準?我們可以從高考作文中一窺真相。

    早在2016年,微軟小冰就曾挑戰過2016年北京卷高考作文《神奇的書簽》。可以看到,這時候AI寫作還處在比較初級的階段,多生成一些短句,并且病句頻出。而在六年后,度曉曉就已經能夠根據復雜的材料,寫出一篇高分作文。

    ▲微軟小冰寫高考作文(左)、百度度曉曉寫高考作文(右)

    由此可見,AI內容創作的水平正在不斷提升。而這背后正是科技公司持續多年投入研發的成果,百度也已經在這條道路上扎根多年。

    你可能沒有發現,在我們日常生活中,已經有不少AI內容創作的產品誕生。

    在AI的世界里,很多事物都有了一些新的玩法。你在鍵盤上,敲入幾個節奏,AI就能幫你創造出一段新的旋律;你設定好場景,輸入想要表達的內容,選取好顏色,AI就能以此創造出新的畫作。

    而在一些作詞、作詩等文本創作方面,AI已然成為新的內容創作者主體。

    百度認為,AIGC是繼UGC、PGC之后一種新型的內容生產方式,主要指運用人工智能技術自動生產內容。很多AI虛擬數字人都是AIGC的重要文化輸出群體。

    AI寫出金句頻出的高考作文并非易事,其背后也離不開AI大模型的技術支撐。相較于其他的大模型,百度文心大模型擁有的兩大殺手锏,“產業級”定位和“知識增強”

    面對AI大模型的“產業級”定位,在百度看來,文心大模型的技術都是根據實際的產業應用場景打造的。

    在數據源,百度選擇產業內部真實的數據,幫助AI成為一個“業內人士”。在應用方面,百度提供了各式各樣的AI工具箱,并幫助開發者快速學會調用AI大模型的能力,根據自己的需求定制化相應的產品。

    面向產業時,研發人員往往會面臨一個問題:AI模型對于數據訓練的需求太大,而產業內部很有可能無法提供如此多的數據。同時,AI大模型的訓練成本也是阻礙其走入產業的關鍵因素之一。

    為了解決這一痛點,百度打造了自己的第二大殺手锏“知識增強”

    百度通過知識增強的方法,將數據與知識融合,讓百度文心大模型相較于其他大模型學習效率更高、可解釋性更好。

    當大模型的通用性更好,泛化性更強時,將會大大降低AI開發和應用的門檻。如果說知識圖譜讓知識之間有著更緊密的內在邏輯,那么“知識增強”則為減少樣本數據提供新的解決方式。

    目前來看,百度文心大模型的升級,為AI創作提供了更多的發揮空間。

    AI大模型進入落地關鍵年,百度收網

    在百度看來, 今年是大模型落地的關鍵年。這背后暗藏著近年來AI大模型走進產業的變化。

    AI大模型在參數上不斷攀升,但似乎始終沒有找到恰當的落地方法。現在看來,在這條賽道上,百度已經摸索出自己的玩法,并且頗有成效。

    2021年12月,百度發布了全球首個知識增強千億大模型鵬城-百度·文心,參數規模2600億。2022年5月20日,百度對百度文心大模型全景圖進行升級,并且連發十款大模型。

    ▲百度文心大模型全景圖

    據相關負責人透露,百度內部已經在搜索、信息推薦等場景上,結合相關的功能和應用,讓大模型的應用落到實處。

    百度自己的產品已經與百度文心大模型緊密相連。像是智能音箱小度的語音交互功能,背后也是百度文心大模型提供一定的技術支持。百度文心大模型不但可以更好地幫助小度理解用戶的意圖,還可以讓小度能夠回答用戶各式各樣的問題,從而提高用戶的交互體驗,增強陪伴感。

    與此同時,百度文心大模型已經覆蓋了教育、金融、媒體、能源等多個領域。比如說,在人力市場,百度文心大模型可以從海量的信息中幫你及時找到最心儀的候選人;在醫院,百度文心大模型可以將每份病歷的檢查時間,從30分鐘縮短到了幾秒鐘。

    可以看到,在我們的日常生活中,百度文心大模型已經開始給人們帶來更便捷的生活。

    值得一提的是,在能源、金融這些專業性較強的領域,百度AI大模型也能發揮出較強的應用價值,百度推出了電力行業NLP大模型國網-百度·文心、金融行業NLP大模型浦發-百度·文心。

    百度通過大規模無標注數據聯合訓練,并針對特定行業需求設計相關算法來完成預訓練任務,讓模型快速了解行業知識,從而更好地完成特定的任務,提高了企業效率。

    AI大模型落地的過程,正是先進技術與產業需求之間相互磨合的過程,而百度在AI領域提前布局也已經到了落地收網的階段。

    人工智能的“高考”AI大模型打先鋒

    高考作文是對一名高中生語言、文字表達,還有知識面的綜合考察,人工智能也許離像一名真正的高中生那樣人格化的思考還有距離,但通過挑戰寫一篇合乎要求的高分作文,足以見得現在AI大模型在內容創作上的潛力。

    百度文心大模型通過搭建更適配場景需求的大模型體系,提供全流程支持應用落地的工具、平臺和方法,建設激發創新的開放生態,試圖來解決大模型技術與場景需求匹配的關鍵問題。

    從高考作文的寫作來看,盡管AI大模型可能還存在一定的不足之處,但如今的AI大模型其實已經開始走向產業,深入到更多的場景,為企業降本提效,加速AI賦能產業智能化進程。

    坐擁AI大模型“技術寶庫”的廠商們也正在迎接屬于自己的“高考”——如何廣泛地落地和深入產業。這一次高考,會有哪些考生拿到高分呢?我們拭目以待。

    附度曉曉高考作文《苦練本手,方能妙手隨成》全文:

    本文來自微信公眾號 “智東西”(ID:zhidxcom),作者:徐 珊,36氪經授權發布。

    標簽: 人工智能