中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

觀色知喜怒:麻省理工成功開發(fā)情緒解讀機(jī)器學(xué)習(xí)模型

2018-07-26    來源:raincent

容器云強(qiáng)勢上線!快速搭建集群,上萬Linux鏡像隨意使用
麻省理工媒體實驗室的研究人員開發(fā)出一種機(jī)器學(xué)習(xí)模型,它能讓計算機(jī)像人一樣自然地解讀我們情緒。該模型能更好地捕捉細(xì)微的面部表情變化,從而更好地判斷情緒。通過額外的數(shù)據(jù)訓(xùn)練,該模型在全新的人群中也能達(dá)到相同效果。

在不斷發(fā)展的「情感計算」領(lǐng)域,用于分析面部表情、解讀我們的情緒、并做出相應(yīng)反應(yīng)的機(jī)器人和計算機(jī)不斷被開發(fā)出來。例如一些應(yīng)用,包括:監(jiān)測個人健康、觀察學(xué)生上課的興致、輔助診斷疾病病征,以及開發(fā)陪伴型機(jī)器人。

由于各種因素,人們表達(dá)情感的方式完全不同,這給情感計算帶來一大挑戰(zhàn)。文化、性別和年齡的不同,造成了這種普遍的差異。但其它的差異則更為細(xì)致:時間、睡眠狀況、甚至你對交談對象的熟悉程度,都會導(dǎo)致你在特定時刻表達(dá)快樂或悲傷的方式發(fā)生細(xì)微的變化。

人類的大腦可以本能地捕捉到這些偏差,但機(jī)器卻不行。近年來,深度學(xué)習(xí)技術(shù)的發(fā)展幫助人們理解了其中的微妙之處,但這些技術(shù)在不同的人群中仍不準(zhǔn)確且適應(yīng)性不強(qiáng)。

媒體實驗室的研究人員現(xiàn)已開發(fā)出一種機(jī)器學(xué)習(xí)模型,它在捕捉這些細(xì)微的面部表情變化時超越了傳統(tǒng)系統(tǒng)。為了更好解讀情緒,已在該模型上訓(xùn)練了數(shù)千張人臉圖像。此外,通過額外的數(shù)據(jù)訓(xùn)練,這個模型在全新的人群中也同樣有效。其目的是改進(jìn)現(xiàn)有的情感計算技術(shù)。

「它以不引人注目的方式來監(jiān)控我們的情緒,」Oggi Rudovic 說:「如果想讓機(jī)器人具有社會智能,就必須讓它們像人一樣自然地對我們的情緒作出反應(yīng)。」Oggi Rudovic 是媒體實驗室的研究員,也是此論文的合著者,該論文上周在 MLDM(機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘)會議上發(fā)表。

論文的共同作者有:第一作者 Michael Feffer,電氣工程和計算機(jī)科學(xué)的本科生;Rosalind Picard,媒體藝術(shù)與科學(xué)的教授,情感計算研究小組的創(chuàng)始人。

個性化的『專家』

傳統(tǒng)的情感計算模型采用「一刀切」的概念。他們訓(xùn)練一組描述各種面部表情的圖像,優(yōu)化特征——比如微笑時嘴唇如何卷曲——并把這些特征映射到一組全新的圖像中。

而在本文的研究中,研究人員將「多專家模型」(MoE) 技術(shù)與模型個性化技術(shù)結(jié)合在一起,這種技術(shù)有助于從個體中挖掘出更細(xì)粒度的面部表情數(shù)據(jù)。Rudovic 說,這是首次將兩種技術(shù)結(jié)合到一起進(jìn)行情感計算。

在「多專家模型」中,許多被稱為「專家」的神經(jīng)網(wǎng)絡(luò)模型被訓(xùn)練成專門處理一個單獨(dú)任務(wù)并產(chǎn)生一個輸出。研究人員還加入了一個「門限網(wǎng)絡(luò)」,計算出哪位「專家」能最好地檢測到未被發(fā)現(xiàn)的受試者的情緒。Feffer 說:「網(wǎng)絡(luò)基本可以區(qū)分個體,并指出『這是給定圖像的正確專家』!

在他們的模型中,研究人員通過將每個專家與 RECOLA 數(shù)據(jù)庫中 18 個獨(dú)立視頻記錄中的一個進(jìn)行匹配,從而對 MoEs 進(jìn)行個性化設(shè)置。RECOLA 是一個公共數(shù)據(jù)庫,內(nèi)容是人們?yōu)榍楦杏嬎銘?yīng)用設(shè)計的視頻聊天平臺上的對話。他們用 9 個實驗對象訓(xùn)練該模型,并在其他 9 個實驗對象上進(jìn)行評估,所有的視頻都被分解成單個的幀。

每個專家和門控網(wǎng)絡(luò)都在殘差網(wǎng)絡(luò)(ResNet,用于分類的神經(jīng)網(wǎng)絡(luò))的幫助下跟蹤每個人的面部表情。在此過程中,模型根據(jù)情緒效價(高興或難過)和情緒喚醒(興奮)程度——對不同情緒進(jìn)行編碼的指標(biāo)——對每一幀進(jìn)行評分。另外,六名人類專家給每一幀情緒效價與喚醒做了標(biāo)注,標(biāo)注打分范圍從-1(低)到 1(高),此模型也會被用于訓(xùn)練。

然后研究人員進(jìn)行了進(jìn)一步的模型個性化實驗,在實驗中,他們喂給模型的數(shù)據(jù)是剩余視頻的部分幀,然后用視頻中未出現(xiàn)過的幀來測試模型。結(jié)果顯示只有 5% 到 10% 的數(shù)據(jù)來自新人群,這個模型在很大程度上優(yōu)于傳統(tǒng)模型——即它在未出現(xiàn)的圖像上對情緒效價和喚醒的評測水平更接近人類專家的標(biāo)注。

「這顯示了模型在數(shù)據(jù)很少的情況下,從人群到人群或者從個人到個人的適應(yīng)能力!筊udovic 說,「這是關(guān)鍵,當(dāng)出現(xiàn)新的人群時,必須要有方法來解釋數(shù)據(jù)分布的變化(微表情變化)。一個模型分析一種文化下的表情時,它也需要適應(yīng)不同的文化。如果不考慮這種數(shù)據(jù)轉(zhuǎn)移,模型就會表現(xiàn)不佳。但如果只是從一種新的文化中抽取一些樣本來適應(yīng)我們的模型,那這些模型可以做得更好,尤其是在個人層面上。這就是模型個性化最重要的地方!

當(dāng)前可獲得的情感計算研究數(shù)據(jù)在膚色方面不夠多樣,因此研究者的訓(xùn)練數(shù)據(jù)受到限制。如果可以獲得更多樣的數(shù)據(jù),訓(xùn)練后的模型就能用于更多元的人群。Fetter 表示,下一步就是在「一個包含多元文化的更大數(shù)據(jù)集」上訓(xùn)練模型。

更佳的人機(jī)交互

研究者表示,另一個目標(biāo)是訓(xùn)練模型,幫助計算機(jī)和機(jī)器人從少量變化的數(shù)據(jù)中自動學(xué)習(xí),以更自然的方法對人的情感進(jìn)行檢測,從而更好地滿足人類需求。

例如,它可以在計算機(jī)或移動設(shè)備中運(yùn)行,跟蹤用戶的視頻對話,學(xué)習(xí)不同背景下微妙的面部表情變化。Feffer 說,「你可以根據(jù)智能手機(jī)或網(wǎng)站來了解人們的感受,推薦應(yīng)對壓力或痛苦的方法,并找出對他們生活產(chǎn)生負(fù)面影響的其它東西!

另外,這也有助于監(jiān)測抑郁癥或癡呆癥,因為人們的面部表情會因為這些情況而發(fā)生微妙的變化。Rudovic 說,「我們可以通過長期監(jiān)控用戶的表情來為他們定制個性化模型,并監(jiān)控他們每天有多少偏差——偏離了面部表情的平均水平——并將其用作健康和幸福的指標(biāo)。」

Rudovic 說,比較有前景的應(yīng)用是人機(jī)交互,如個人機(jī)器人或教育機(jī)器人,機(jī)器人需要適應(yīng)評估很多人的情緒狀態(tài)。例如,有一種版本被用來幫助機(jī)器人更好地解讀自閉癥兒童的情緒。

Roddy Cowie 是貝爾法斯特女王大學(xué)心理學(xué)名譽(yù)教授,同時也是一位情感計算學(xué)者,他表示,MIT 的研究「說明了這個領(lǐng)域的研究現(xiàn)狀」。「我們正慢慢打造一個系統(tǒng),這個系統(tǒng)可以從面部照片判斷出人們的情緒,從非常積極到非常消極,從非常主動到非常被動。直觀說來,一個人給出的情感信號與另一個人的不同,因此當(dāng)我們使情感識別個性化時,它能更好地工作,這很有意義。個性化方法反映出另一個有趣的點,即訓(xùn)練多個『專家』并綜合它們的判斷比訓(xùn)練一個單獨(dú)的超級專家要更加有效。二者合在一起可以構(gòu)成一個令人滿意的組合!顾f。

標(biāo)簽: 大數(shù)據(jù) 媒體 評測 數(shù)據(jù)庫 網(wǎng)絡(luò)

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:中國有意超越美國,計劃到2030年成為主要的AI創(chuàng)新大國

下一篇:AI 計算趨勢解析:四年之內(nèi),沒人玩得起下一個 AlphaGo