中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

大型數(shù)據(jù)庫支持面部識別抓取,隱私何處安放?

2020-12-04    來源:raincent

容器云強勢上線!快速搭建集群,上萬Linux鏡像隨意使用

人臉識別技術(shù)日漸強大,這要感謝科技,更要感謝你的“臉”。

在美國,很多公司和研究人員基于眾多“人臉識別數(shù)據(jù)庫”進行編譯和分析,這些圖片在全球被廣泛流傳,而這些操作都是在人們不知情的情況下進行的。

根據(jù)《紐約時報》報道,“人臉識別數(shù)據(jù)庫”抓取從社交網(wǎng)站、圖片網(wǎng)站、像 OkCupid 這樣的約會網(wǎng)站,以及在餐廳和大學(xué)校園架設(shè)的攝像機得來的圖片。雖然目前的數(shù)據(jù)尚不精確,隱私維權(quán)者還是指出,微軟建立的數(shù)據(jù)庫有超過一億張圖片,斯坦福大學(xué)有超過兩億張。

 

 

圖 | MS Celeb 數(shù)據(jù)庫中 2000 個人像信息可視化圖(來源:Megapixels)

這樣大規(guī)模的面部收集是為了能快人一步創(chuàng)造出領(lǐng)先的人臉識別技術(shù)。這項技術(shù)需要盡可能多地運用“神經(jīng)網(wǎng)絡(luò)”分析數(shù)字圖片,從而鑒別人類。而所謂的“神經(jīng)網(wǎng)絡(luò)”是一個復(fù)雜的算法系統(tǒng),它建立在大批量的數(shù)據(jù)所建立的認(rèn)知模型上。

收集面部圖像的過程已經(jīng)進行了十多年,但建立面部識別技術(shù)需要包括數(shù)據(jù)庫在內(nèi)的更多條件,涉及到生物學(xué)、生理學(xué)、心理學(xué)、認(rèn)知學(xué)、圖像圖形學(xué)、模式識別等領(lǐng)域,數(shù)據(jù)庫只是其中一個層面。人們往往不知道他們的圖片已經(jīng)在數(shù)據(jù)集中。盡管照片上沒有名字,但是每個人都可以被認(rèn)出來,因為每張臉都是獨一無二的。

根據(jù)研究報告顯示,像 Facebook 和 Google 這樣的科技巨頭聚集了大量的人臉識別數(shù)據(jù),這些數(shù)據(jù)是不會被散播的。但根據(jù)一些學(xué)者、相關(guān)人士和公開論文顯示,一些公司和大學(xué)與澳大利亞、中國、印度、新加坡和瑞士的研究人員、政府和私人企業(yè)廣泛分享了他們的圖像數(shù)據(jù)。

數(shù)據(jù)集所帶來的問題正在凸顯,因為目前所啟用的技術(shù)正在以潛在的入侵方式被使用。近日公布的文件顯示,美國移民和海關(guān)執(zhí)法局用這一技術(shù)掃描司機照片以識別非法移民。根據(jù)美國政府問責(zé)局上個月的一份報告,美國聯(lián)邦調(diào)查局在過去十年里使用這一技術(shù)將駕照和簽證照片與犯罪嫌疑人的臉進行對比。7 月 10 日,美國國會聽證會就該技術(shù)的使用問題進行了討論。

由于缺少對數(shù)據(jù)集的監(jiān)管,人們的肖像可能被用在有道德問題的科技上,甚至這些照片會被濫用,維權(quán)者對這其中的可能性表示憤怒。

過去幾周,出于隱私考慮,微軟和斯坦福大學(xué)這類的公司和大學(xué)已經(jīng)從互聯(lián)網(wǎng)上抹掉了它們的人臉識別數(shù)據(jù)。但研究人員和維權(quán)者認(rèn)為,鑒于這些圖像早已被廣泛散播出去,它們?nèi)詫⒃诿绹推渌胤奖皇褂谩?/p>

 

圖 | “洗腦”數(shù)據(jù)已從斯坦福大學(xué)文獻庫刪除(來源:斯坦福大學(xué)文獻庫)

 

斯坦福大學(xué)在 2014 年建立的人臉識別數(shù)據(jù)庫被稱為“洗腦”(Brainwash),在三天時間里,研究人員用相機拍攝超過 10000 張圖像并存入數(shù)據(jù)庫,這些數(shù)據(jù)被用來與其他人分享。但當(dāng)時咖啡廳的顧客并不知道自己被拍照且照片被用來做技術(shù)研究。

杜克大學(xué)的研究人員也在 2014 年用八臺攝像機建立了一個人臉識別數(shù)據(jù)庫,這些攝像機架設(shè)在校園里,這些攝像頭上標(biāo)有號碼和電子郵件,不想被拍攝的人可以跟他聯(lián)系。根據(jù)報道,杜克大學(xué)的研究人員最終收集到了 200 多萬幀視頻,其中包含 2700 多人的圖像。但這些圖像可能因為角度和采光原因不能被采用。

微軟聲稱他們建立了最大的面部數(shù)據(jù)集之一。這個名為 MS Celeb 的數(shù)據(jù)集包括超過 10 萬人的 1000 萬張照片。MS Celeb 表面上是一個名人數(shù)據(jù)庫,因為數(shù)據(jù)都來自公眾人物,這些圖片也被認(rèn)為是公平的。但這仍然招來維權(quán)人士的不滿。這一數(shù)據(jù)庫曾在國際間傳播,但在今年春天被維權(quán)者發(fā)現(xiàn)之后便被撤下。

對此,民間成立了一個名為“監(jiān)視技術(shù)監(jiān)督項目”的民權(quán)和隱私組織,該組織建立了一個工具,可以讓人們檢查他們的肖像是否被收集在公開分享的人臉數(shù)據(jù)庫中。

標(biāo)簽: 數(shù)據(jù) 

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:PartiQL:一種用于所有數(shù)據(jù)的查詢語言

下一篇:我是一名數(shù)據(jù)科學(xué)家,但我對大數(shù)據(jù)持懷疑態(tài)度