亚洲一区二区3,秋霞av亚洲一区二区三,一本久道久久久

2013年，一部科幻電影「Her」講述了，宅男作家西奧多（Theodore）愛(ài)上了人工智能系統(tǒng)薩曼莎（Samantha）那略微沙啞的性感嗓音的故事。

受這部電影啟發(fā)，一家AI語(yǔ)音初創(chuàng)公司Sonantic創(chuàng)造出了一種合成聲音，可以表達(dá)微妙的情感，比如挑逗和調(diào)情。

AI學(xué)會(huì)調(diào)情了

Sonantic的目標(biāo)關(guān)鍵在于將非語(yǔ)音聲音融入到音頻中，訓(xùn)練AI模型重現(xiàn)那些微弱的呼吸聲、嘲笑和半掩的笑聲等等。

這些聲音和人類(lèi)生物學(xué)特征相吻合，可以呈現(xiàn)出一場(chǎng)真實(shí)的演講。

Sonantic的聯(lián)合創(chuàng)始人和首席技術(shù)官John Flynn表示，我們以愛(ài)作為主題，就是為了是看看AI是否能夠模擬微妙的情緒。

在第一次聽(tīng)的時(shí)候，大多數(shù)人都會(huì)認(rèn)為這個(gè)聲音和真人的聲音幾乎沒(méi)什么區(qū)別。

當(dāng)你聽(tīng)到人工智能說(shuō)，「I think I, I think I love you, I love you」時(shí)，就會(huì)有一種舒適感。

視頻中，她的呼吸聲，笑聲都讓人不得不相信這就是真人發(fā)出的聲音。

Sonantic的首席執(zhí)行官Zeena Qureshi將公司的軟件描述為「聲音的 Photoshop」。

這一軟件的界面允許用戶(hù)輸入他們想要合成的語(yǔ)音，指定傳遞的情緒，然后從一組人工智能聲音（其中大部分是從真人演員那里復(fù)制的）中選擇。

情緒的選擇包括憤怒、恐懼、悲傷、快樂(lè)和喜悅，以及剛剛更新的調(diào)情、害羞、取笑和吹噓。

「導(dǎo)演模式」（director mode）能夠進(jìn)行更多的調(diào)整，包括聲音的音調(diào)，傳達(dá)的強(qiáng)度，還有那些微弱的非語(yǔ)音發(fā)聲，比如笑聲和呼吸聲。

有網(wǎng)友表示，「這個(gè)聲音聽(tīng)起來(lái)也太真實(shí)了吧！」「我現(xiàn)在終于可以創(chuàng)造我自己的Her。」

首先，為了讓AI的聲音更加逼真，必須要有人工潤(rùn)色這一步。

在很多人工智能的領(lǐng)域都是這樣，比如無(wú)人駕駛。無(wú)人駕駛已經(jīng)基本上實(shí)現(xiàn)了自動(dòng)駕駛，但是還有最后非常重要的5%的部分需要人工參與。

這就說(shuō)明完全自主、完全合格的AI語(yǔ)音合成還有很長(zhǎng)的一段路要走。

另外，心理學(xué)上有個(gè)詞叫「啟動(dòng)效應(yīng)」，它能做到欺騙你的感官。

這段演示版的視頻，展示了一個(gè)真人演員在鏡頭前局促不安的片段。這個(gè)片段會(huì)激發(fā)你的大腦，讓你覺(jué)得同時(shí)播放的聲音也是真人聲音。

這說(shuō)明，最好的合成音頻，就是「半真半假」。有的輸出是真實(shí)的，有的是AI合成的。

靈感源頭「Her」

除去AI音頻逼真到什么程度的問(wèn)題，Sonantic放出的音頻還暴露了其它一些問(wèn)題。

比方說(shuō)，創(chuàng)建一個(gè)會(huì)調(diào)情的AI需不需要遵守什么道德規(guī)范？用AI的聲音欺騙聽(tīng)者是否公平？

Sonantic又為什么選擇女性的聲音來(lái)制作調(diào)情音頻？

實(shí)際上這個(gè)問(wèn)題說(shuō)明，在當(dāng)今男性主導(dǎo)的科技行業(yè)，這種選擇暗含了一種微弱的性別歧視。一般都會(huì)把這種AI助理設(shè)置成順從、甚至有些輕浮的秘書(shū)形象。

關(guān)于這個(gè)問(wèn)題，該公司表示，「我們之所以選擇女性的聲音，只是因?yàn)槲覀冞@個(gè)點(diǎn)子是受Spike Johze在2013年電影Her所啟發(fā)的。這部電影的主角就愛(ài)上了一個(gè)女性AI助理，名叫Samantha。」

在第二個(gè)問(wèn)題上，Sonantic表示，「公司清楚這項(xiàng)技術(shù)的發(fā)展可能會(huì)帶來(lái)哪些道德上的難處。所以公司在如何使用和哪里使用AI音頻的問(wèn)題上非常小心。」

該公司的CEOQureshi表示，「正是因?yàn)檫@些原因，我們目前只把這項(xiàng)技術(shù)應(yīng)用在娛樂(lè)方面。不能什么地方都用CGI，目前只是為了提供最好的娛樂(lè)體驗(yàn)和模擬效果才用。我們也同意這項(xiàng)技術(shù)會(huì)遇到這樣或那樣的問(wèn)題。」

她還補(bǔ)充說(shuō)，該公司展示的所有視頻都說(shuō)明了其中的聲音是合成的，不是真人的聲音。但這并不代表不會(huì)有人為了欺騙，而用這款軟件去生成一些音頻。

這項(xiàng)技術(shù)其實(shí)和一些別的娛樂(lè)產(chǎn)品有一些共同點(diǎn)。畢竟電影和電視劇的創(chuàng)作也是用一些不真實(shí)的東西來(lái)吊住觀眾的胃口。

但有一點(diǎn)區(qū)別是，AI技術(shù)可以大規(guī)模的擴(kuò)散，人們往往會(huì)忽視對(duì)每個(gè)個(gè)體的具體影響。

打個(gè)比方，從全世界來(lái)看，人們?cè)缫验_(kāi)始和AI聊天機(jī)器人構(gòu)建各種關(guān)系，甚至還有愛(ài)上AI聊天機(jī)器人的情況。如果能給這些聊天機(jī)器人加上用AI生成的音效，無(wú)疑會(huì)讓原有的功能更加強(qiáng)大。

這就會(huì)帶來(lái)一些問(wèn)題：到底該怎么設(shè)計(jì)這類(lèi)系統(tǒng)。

畢竟，AI的聲音都開(kāi)始和用戶(hù)調(diào)情了，誰(shuí)知道下一步它們還能做出什么呢？

參考資料：

https://www.theverge.com/2022/2/17/22936978/ai-voice-speech-synthesis-audio-deepfake-sonantic-flirtation

本文來(lái)自微信公眾號(hào)“新智元”（ID:AI_era），編輯：桃子拉燕，原標(biāo)題：《這個(gè)AI女友會(huì)用聲音調(diào)情了，害羞、挑逗樣樣都會(huì)，還從不生氣》，36氪經(jīng)授權(quán)發(fā)布。

你能相信這是AI女友嗎？人類(lèi)會(huì)的Ta都會(huì)

AI學(xué)會(huì)調(diào)情了

靈感源頭「Her」

參考資料：

相關(guān)推薦