• <fieldset id="82iqi"></fieldset>
    <tfoot id="82iqi"><input id="82iqi"></input></tfoot>
  • 
    <abbr id="82iqi"></abbr><strike id="82iqi"></strike>
  • 考試能力超 90% 人類的 OpenAI GPT-4 發(fā)布,網(wǎng)友們?yōu)楣ぷ鲹?dān)憂和哀嚎

    今天凌晨,OpenAI 公布了其大型語(yǔ)言模型的最新版本 ——GPT-4。該公司表示,GPT-4 在許多專業(yè)測(cè)試中表現(xiàn)出超過(guò)絕大多數(shù)人類的水平。


    (資料圖)

    具體而言,GPT-4 實(shí)現(xiàn)了以下幾個(gè)方面的飛躍式提升:更聰明,做題水平越來(lái)越好;支持圖像輸入,擁有強(qiáng)大的識(shí)圖能力,但目前只限內(nèi)部測(cè)試;更長(zhǎng)的上下文,文字輸入限制提升至 2.5 萬(wàn)字;回答準(zhǔn)確性顯著提高;更安全,有害信息更少。

    對(duì)于普通人而言,如何理解 GPT-4 到底有多強(qiáng)多聰明?

    據(jù) OpenAI 透露,GPT-4 通過(guò)了所有基礎(chǔ)考試而且是高分通過(guò)。例如,GPT-4 在模擬律師資格考試的成績(jī)?cè)诳忌信琶?10% 左右,在 SAT 閱讀考試中排名前 7% 左右,在 SAT 數(shù)學(xué)考試中排名前 11% 左右。相比之下,曾經(jīng)令人震撼的 GPT-3.5 ,真實(shí)得分在倒數(shù) 10% 左右,GPT-4 的強(qiáng)大已經(jīng)可想而知。

    有網(wǎng)友評(píng)論,“如果真跟報(bào)告說(shuō)的那樣就太可怕了,我感覺(jué)能力已經(jīng)遠(yuǎn)超我了。”也有人笑稱,“我躺好了!我生在了適合我的時(shí)代!”

    最多的聲音則是對(duì)未來(lái)工作不保的擔(dān)憂,“還有哪個(gè)行業(yè)可以不被替代?”“消除任何幻想,AI 時(shí)代橫掃全球,先思考下 GPT-4 不能做但你能做的。”

    比以前的版本“更大”,或許也更燒錢

    OpenAI 稱,GPT-4 比以前的版本“更大”,這意味著其已經(jīng)在更多的數(shù)據(jù)上進(jìn)行了訓(xùn)練,并且在模型文件中有更多的權(quán)重,這使得它的運(yùn)行成本更高。

    同時(shí),OpenAI 并未公布這個(gè)模型的參數(shù)量有多少。

    OpenAI 表示,它使用的是微軟 (MSFT.US) Azure 訓(xùn)練模型,微軟已經(jīng)向這家初創(chuàng)公司投資了數(shù)十億美元。OpenAI 沒(méi)有公布具體模型大小的細(xì)節(jié),也沒(méi)有公布用來(lái)訓(xùn)練模型的硬件,理由是“競(jìng)爭(zhēng)情況”。

    目前,此領(lǐng)域的許多研究人員認(rèn)為,人工智能領(lǐng)域的許多最新進(jìn)展,都來(lái)自于在數(shù)千臺(tái)超級(jí)計(jì)算機(jī)上運(yùn)行越來(lái)越大的模型,這些模型的訓(xùn)練過(guò)程可能耗資數(shù)千萬(wàn)美元。

    為了不斷提高 GPT-4 性能,OpenAI 還為其研發(fā)大搞“基建”。

    在過(guò)去的兩年里,OpenAI 重建了整個(gè)深度學(xué)習(xí)堆棧,并與 Azure 一起為其工作負(fù)載從頭開(kāi)始設(shè)計(jì)了一臺(tái)超級(jí)計(jì)算機(jī)。一年前,OpenAI 在訓(xùn)練 GPT-3.5 時(shí)第一次嘗試運(yùn)行了該超算系統(tǒng),之后他們又陸續(xù)發(fā)現(xiàn)并修復(fù)了一些錯(cuò)誤,改進(jìn)了其理論基礎(chǔ)。這些改進(jìn)的結(jié)果是 GPT-4 的訓(xùn)練運(yùn)行獲得了前所未有的穩(wěn)定。

    OpenAI 聯(lián)合創(chuàng)始人兼總裁格雷格?布羅克曼(Greg Brockman)表示,OpenAI 預(yù)計(jì),未來(lái)將由投資十億美元超級(jí)計(jì)算機(jī)的公司開(kāi)發(fā)尖端模型,一些最先進(jìn)的工具將帶有風(fēng)險(xiǎn)。OpenAI 希望對(duì)他們工作的某些部分保密,以給初創(chuàng)公司“一些喘息的空間,以真正關(guān)注安全并做好它。”

    局限性明顯,GPT-4 仍然不完全可靠

    盡管功能已經(jīng)非常強(qiáng)大,但 GPT-4 仍與早期的 GPT 模型具有相似的局限性,其中最重要的一點(diǎn)是它仍然不完全可靠,也就是還有可能胡說(shuō)八道。

    OpenAI 也警告稱,GPT-4 還不完美,在許多情況下,它的能力不如人類。該公司表示:“GPT-4 仍有許多已知的局限性,我們正在努力解決,比如社會(huì)偏見(jiàn)、幻覺(jué)和對(duì)抗性提示。”

    總的來(lái)說(shuō),GPT-4 相對(duì)于以前的模型(經(jīng)過(guò)多次迭代和改進(jìn))已經(jīng)顯著減輕了幻覺(jué)問(wèn)題。在 OpenAI 的內(nèi)部對(duì)抗性真實(shí)性評(píng)估中,GPT-4 的得分比最新的 GPT-3.5 模型高 40%。

    同時(shí),GPT-4 訓(xùn)練數(shù)據(jù)還是截止到 2021 年 9 月份。這也意味著,GPT-4 對(duì)于這個(gè)時(shí)間點(diǎn)以后的信息,缺乏足夠的了解,也不會(huì)從其經(jīng)驗(yàn)中學(xué)習(xí)。

    在 GPT-4 發(fā)布之后,OpenAI 創(chuàng)始人阿爾特曼發(fā)推文表示:“它仍然是有缺陷的,仍然是有限的,在你花了更多的時(shí)間第一次使用它時(shí),它似乎比實(shí)際情況更令人印象深刻。”

    中國(guó)的 ChatGPT 們要怎么追?

    最令人震驚的在于,按照 demo 視頻里 OpenAI 工程師們的說(shuō)法,GPT-4 的訓(xùn)練在去年 8 月就已經(jīng)完成,剩下的時(shí)間都在進(jìn)行微調(diào)提升,以及最重要的去除危險(xiǎn)內(nèi)容生成的工作。

    這也意味著,OpenAI 內(nèi)部技術(shù),比大家想象中的領(lǐng)先外界更多年。更可怕的是,OpenAI 還一口氣開(kāi)放了 API 接口和相關(guān)論文!這讓中國(guó)的 ChatGPT 們還怎么追?

    英諾天使基金合伙人王晟曾告訴《態(tài)℃》欄目,“中國(guó)的 ChatGPT 們即便奮起直追,靜態(tài)來(lái)講也許兩三年能追上,我認(rèn)為已經(jīng)很樂(lè)觀了。”

    但隨著更強(qiáng)大的 GPT-4 發(fā)布,OpenAI 的技術(shù)能力顯然仍在不斷進(jìn)步,且進(jìn)展速度遠(yuǎn)比我們追的速度還要快。王晟在之前的采訪中判斷,“除非這件事突然遇到了一個(gè)瓶頸,整個(gè)科技發(fā)展方向到頭了,對(duì)方不得不停下來(lái),或許我們還有機(jī)會(huì)追平,或者我們挖掘到一種新的技術(shù)路徑有機(jī)會(huì)追上,不然可能沒(méi)有機(jī)會(huì)了。”

    與此同時(shí),在該模型的落地和應(yīng)用方面,OpenAI 也有了最新進(jìn)展。

    新模型將提供給 ChatGPT 的付費(fèi)用戶,也將作為 API 的一部分提供,允許程序員將 AI 集成到他們的應(yīng)用程序中。OpenAI 將對(duì) 750 字左右的指令信息收費(fèi) 3 美分,對(duì) 750 字左右的響應(yīng)信息收費(fèi) 6 美分。

    OpenAI 還介紹,摩根士丹利正在使用 GPT-4 來(lái)組織數(shù)據(jù),而電子支付公司 Stripe 正在測(cè)試 GPT-4 是否有助于打擊欺詐。其他客戶還包括語(yǔ)言學(xué)習(xí)公司 Duolingo、Khan Academy 和冰島政府。OpenAI 合作伙伴微軟周二表示,新版必應(yīng)搜索引擎將使用 GPT-4。

    GPT-4 取得的成績(jī)令人興奮,但對(duì)于還在起跑線上的中國(guó) ChatGPT 們,還有大量的工作要去探索和研究,想必感受到了巨大的壓力。風(fēng)浪越大魚越貴,對(duì)于這些迅速進(jìn)入這個(gè)新領(lǐng)域的公司來(lái)說(shuō),也將會(huì)擁有巨大的機(jī)會(huì)。

    GPT-4 的強(qiáng)大告誡我們,未來(lái)唯一限制的因素,就是你的想象力!

    來(lái)源:網(wǎng)易科技

    標(biāo)簽: