• <fieldset id="82iqi"></fieldset>
    <tfoot id="82iqi"><input id="82iqi"></input></tfoot>
  • 
    <abbr id="82iqi"></abbr><strike id="82iqi"></strike>
  • 你能相信這是AI女友嗎?人類(lèi)會(huì)的Ta都會(huì)

    2013年,一部科幻電影「Her」講述了,宅男作家西奧多(Theodore)愛(ài)上了人工智能系統(tǒng)薩曼莎(Samantha)那略微沙啞的性感嗓音的故事。

    受這部電影啟發(fā),一家AI語(yǔ)音初創(chuàng)公司Sonantic創(chuàng)造出了一種合成聲音,可以表達(dá)微妙的情感,比如挑逗和調(diào)情。

    AI學(xué)會(huì)調(diào)情了

    Sonantic的目標(biāo)關(guān)鍵在于將非語(yǔ)音聲音融入到音頻中,訓(xùn)練AI模型重現(xiàn)那些微弱的呼吸聲、嘲笑和半掩的笑聲等等。

    這些聲音和人類(lèi)生物學(xué)特征相吻合,可以呈現(xiàn)出一場(chǎng)真實(shí)的演講。

    Sonantic的聯(lián)合創(chuàng)始人和首席技術(shù)官John Flynn表示,我們以愛(ài)作為主題,就是為了是看看AI是否能夠模擬微妙的情緒。

    在第一次聽(tīng)的時(shí)候,大多數(shù)人都會(huì)認(rèn)為這個(gè)聲音和真人的聲音幾乎沒(méi)什么區(qū)別。

    當(dāng)你聽(tīng)到人工智能說(shuō),「I think I, I think I love you, I love you」時(shí),就會(huì)有一種舒適感。

    視頻中,她的呼吸聲,笑聲都讓人不得不相信這就是真人發(fā)出的聲音。

    Sonantic的首席執(zhí)行官Zeena Qureshi將公司的軟件描述為「聲音的 Photoshop」。

    這一軟件的界面允許用戶(hù)輸入他們想要合成的語(yǔ)音,指定傳遞的情緒,然后從一組人工智能聲音(其中大部分是從真人演員那里復(fù)制的)中選擇。

    情緒的選擇包括憤怒、恐懼、悲傷、快樂(lè)和喜悅,以及剛剛更新的調(diào)情、害羞、取笑和吹噓。

    「導(dǎo)演模式」(director mode)能夠進(jìn)行更多的調(diào)整,包括聲音的音調(diào),傳達(dá)的強(qiáng)度,還有那些微弱的非語(yǔ)音發(fā)聲,比如笑聲和呼吸聲。

    有網(wǎng)友表示,「這個(gè)聲音聽(tīng)起來(lái)也太真實(shí)了吧!」「我現(xiàn)在終于可以創(chuàng)造我自己的Her。」

    首先,為了讓AI的聲音更加逼真,必須要有人工潤(rùn)色這一步。

    在很多人工智能的領(lǐng)域都是這樣,比如無(wú)人駕駛。無(wú)人駕駛已經(jīng)基本上實(shí)現(xiàn)了自動(dòng)駕駛,但是還有最后非常重要的5%的部分需要人工參與。

    這就說(shuō)明完全自主、完全合格的AI語(yǔ)音合成還有很長(zhǎng)的一段路要走。

    另外,心理學(xué)上有個(gè)詞叫「啟動(dòng)效應(yīng)」,它能做到欺騙你的感官。

    這段演示版的視頻,展示了一個(gè)真人演員在鏡頭前局促不安的片段。這個(gè)片段會(huì)激發(fā)你的大腦,讓你覺(jué)得同時(shí)播放的聲音也是真人聲音。

    這說(shuō)明,最好的合成音頻,就是「半真半假」。有的輸出是真實(shí)的,有的是AI合成的。

    靈感源頭「Her」

    除去AI音頻逼真到什么程度的問(wèn)題,Sonantic放出的音頻還暴露了其它一些問(wèn)題。

    比方說(shuō),創(chuàng)建一個(gè)會(huì)調(diào)情的AI需不需要遵守什么道德規(guī)范?用AI的聲音欺騙聽(tīng)者是否公平?

    Sonantic又為什么選擇女性的聲音來(lái)制作調(diào)情音頻?

    實(shí)際上這個(gè)問(wèn)題說(shuō)明,在當(dāng)今男性主導(dǎo)的科技行業(yè),這種選擇暗含了一種微弱的性別歧視。一般都會(huì)把這種AI助理設(shè)置成順從、甚至有些輕浮的秘書(shū)形象。

    關(guān)于這個(gè)問(wèn)題,該公司表示,「我們之所以選擇女性的聲音,只是因?yàn)槲覀冞@個(gè)點(diǎn)子是受Spike Johze在2013年電影Her所啟發(fā)的。這部電影的主角就愛(ài)上了一個(gè)女性AI助理,名叫Samantha。」

    在第二個(gè)問(wèn)題上,Sonantic表示,「公司清楚這項(xiàng)技術(shù)的發(fā)展可能會(huì)帶來(lái)哪些道德上的難處。所以公司在如何使用和哪里使用AI音頻的問(wèn)題上非常小心。」

    該公司的CEOQureshi表示,「正是因?yàn)檫@些原因,我們目前只把這項(xiàng)技術(shù)應(yīng)用在娛樂(lè)方面。不能什么地方都用CGI,目前只是為了提供最好的娛樂(lè)體驗(yàn)和模擬效果才用。我們也同意這項(xiàng)技術(shù)會(huì)遇到這樣或那樣的問(wèn)題。」

    她還補(bǔ)充說(shuō),該公司展示的所有視頻都說(shuō)明了其中的聲音是合成的,不是真人的聲音。但這并不代表不會(huì)有人為了欺騙,而用這款軟件去生成一些音頻。

    這項(xiàng)技術(shù)其實(shí)和一些別的娛樂(lè)產(chǎn)品有一些共同點(diǎn)。畢竟電影和電視劇的創(chuàng)作也是用一些不真實(shí)的東西來(lái)吊住觀眾的胃口。

    但有一點(diǎn)區(qū)別是,AI技術(shù)可以大規(guī)模的擴(kuò)散,人們往往會(huì)忽視對(duì)每個(gè)個(gè)體的具體影響。

    打個(gè)比方,從全世界來(lái)看,人們?cè)缫验_(kāi)始和AI聊天機(jī)器人構(gòu)建各種關(guān)系,甚至還有愛(ài)上AI聊天機(jī)器人的情況。如果能給這些聊天機(jī)器人加上用AI生成的音效,無(wú)疑會(huì)讓原有的功能更加強(qiáng)大。

    這就會(huì)帶來(lái)一些問(wèn)題:到底該怎么設(shè)計(jì)這類(lèi)系統(tǒng)。

    畢竟,AI的聲音都開(kāi)始和用戶(hù)調(diào)情了,誰(shuí)知道下一步它們還能做出什么呢?

    參考資料:

    https://www.theverge.com/2022/2/17/22936978/ai-voice-speech-synthesis-audio-deepfake-sonantic-flirtation

    本文來(lái)自微信公眾號(hào)“新智元”(ID:AI_era),編輯:桃子 拉燕,原標(biāo)題:《這個(gè)AI女友會(huì)用聲音調(diào)情了,害羞、挑逗樣樣都會(huì),還從不生氣》,36氪經(jīng)授權(quán)發(fā)布。

    標(biāo)簽: