中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

我是怎么用機(jī)器學(xué)習(xí)技術(shù)找到女票的

2018-07-20    來(lái)源:raincent

容器云強(qiáng)勢(shì)上線!快速搭建集群,上萬(wàn)Linux鏡像隨意使用
機(jī)器學(xué)習(xí)在我們生活中的用處有多大,就不用我們多說(shuō)了,大到醫(yī)療診斷,小到手機(jī)應(yīng)用,機(jī)器學(xué)習(xí)都應(yīng)用的風(fēng)風(fēng)火火。但是用機(jī)器學(xué)習(xí)幫自己在學(xué)校找對(duì)象,你聽(tīng)說(shuō)過(guò)嗎?

 

 

最近滑鐵盧大學(xué)一位叫 Bai Li 的留學(xué)生(李白?應(yīng)是中國(guó)同胞)在 medium 上分享了如何用 ML 中的邏輯回歸方法幫自己找女票的神操作。像這么實(shí)用的技術(shù),我們必須觀摩學(xué)習(xí)一個(gè)。

這里插一嘴,以前老有人搞錯(cuò)滑鐵盧大學(xué),這里的滑鐵盧在加拿大,不是比利時(shí)那個(gè)讓拿破侖最后真的拿了破輪的滑鐵盧;F盧大學(xué)是加拿大一所著名高校,是北美地區(qū)最優(yōu)大學(xué)之一,其數(shù)學(xué)、計(jì)算機(jī)科學(xué)和工程學(xué)科教學(xué)水平居世界前列,其中優(yōu)勢(shì)專(zhuān)業(yè)計(jì)算機(jī)科學(xué)名列 2017 年 usnews 世界大學(xué)排行榜第 18 位。

好了廢話不說(shuō),我們觀看少年的表演:

滑鐵盧大學(xué)是出了名的缺少社交活動(dòng)和很難找到對(duì)象。和我(原作者Bai Li——譯者注)一樣,滑大的很多計(jì)算機(jī)專(zhuān)業(yè)男生都覺(jué)得,找女票是不可能找到的,大概畢業(yè)前都不會(huì)找到的。找也不知道該怎么找,談戀愛(ài)又不會(huì),就只能敲敲代碼才能維持得了生活這樣子。

 

 

有些人覺(jué)得愛(ài)情這種東西是沒(méi)法量化的,你只管“做你自己”就好了。不過(guò),作為滑鐵盧大學(xué)的一個(gè)數(shù)據(jù)科學(xué)家,我對(duì)此持不同意見(jiàn)。我就想了,既然是搞計(jì)算機(jī)的,干嘛不試試借助機(jī)器學(xué)習(xí)找女朋友呢?

方法論

心動(dòng)不如行動(dòng),馬上著手研究如何用機(jī)器學(xué)習(xí)技術(shù)找女票。

這個(gè)研究的核心問(wèn)題是:具備哪些屬性,能在滑鐵盧大學(xué)眾多男生中脫穎而出找到女朋友?

很多人覺(jué)得兜里有錢(qián)會(huì)更能吸引妹子,此外身高、有沒(méi)有肌肉這些指標(biāo)也會(huì)起作用。

我們下面就試著找出哪些是最有預(yù)測(cè)力的屬性,哪些假設(shè)沒(méi)有數(shù)據(jù)支撐。

我首先想到了下面這些屬性:

約會(huì)(目標(biāo)變量):有女朋友,或者過(guò)去5年內(nèi)曾有過(guò)至少維持了半年感情的女朋友。
國(guó)籍:留學(xué)生(因?yàn)槲乙彩橇魧W(xué)生)
專(zhuān)業(yè):CS,SE和ECE專(zhuān)業(yè)
事業(yè):在學(xué)術(shù)上很成功,找到了薪水優(yōu)渥的實(shí)習(xí)工作
有趣性:能說(shuō)會(huì)道,總能找到有趣的談資
社交性:外向性格,總想認(rèn)識(shí)新朋友
自信:看著比較自信
身高:身高比我高(> 175 cm)
眼鏡:戴眼鏡(我也戴)
健身:定期去健身房,或者運(yùn)動(dòng)
時(shí)尚:注重外在形象,穿著有品位
加拿大:過(guò)去5年內(nèi)基本生活在加拿大
亞洲人:來(lái)自東亞地區(qū)(因?yàn)槲乙彩牵?/p>

看到這里你應(yīng)該會(huì)發(fā)現(xiàn),上面有些屬性非常主觀,比如怎么證明一個(gè)人很有趣?

 

 

在上面這些情況中,我按照是否符合標(biāo)準(zhǔn)會(huì)賦予 1 或 0 這兩個(gè)值。所以,我們是在衡量人們的上述屬性和能找到對(duì)象之間的關(guān)系(當(dāng)然是根據(jù)我自己的理解,不喜勿噴)。

所以,假如你是想看那種超硬核又嚴(yán)格統(tǒng)計(jì)的研究,那么后面的內(nèi)容可能不是你的菜。

為了收集數(shù)據(jù),我把自己能想到的每個(gè)人都列在表格里,在每個(gè)屬性里會(huì)以 0 或 1 給他們打分。最終,數(shù)據(jù)集有 N=70 行。如果你過(guò)去兩年待在滑大,和我認(rèn)識(shí),多半這個(gè)表格上有你。

分析

首先,我們將精確概率法(Fisher’s Exact Test)對(duì)目標(biāo)約會(huì)變量和所有的說(shuō)明變量進(jìn)行分析,發(fā)現(xiàn)其中有 3 個(gè)變量影響最為顯著:

健身:定期去健身房或運(yùn)動(dòng)的人有女朋友的概率會(huì)高出兩倍以上(P值=0.02)

眼鏡:不戴眼鏡的人有女朋友的概率比戴眼鏡的人會(huì)高出 70%(P值=0.08)

自信:有自信心的人有朋友的概率更高(P 值=0.09)

和我預(yù)期的一樣,有肌肉有自信的小伙更有吸引力。不過(guò)我對(duì)戴眼鏡與否影響這么大感到很意外,好奇是不是因?yàn)榇餮坨R一般會(huì)給人產(chǎn)生“書(shū)呆子”的印象。所以我又查了些資料,發(fā)現(xiàn)還真有這么一回事,有篇研究論文講到大多數(shù)人認(rèn)為不管男性還是女性,戴眼鏡會(huì)降低自身吸引力。

有些變量對(duì)于能否成功約會(huì)可能比較有預(yù)測(cè)力,不過(guò)很難確定,因?yàn)闃颖据^。

留學(xué)生比加拿大本地學(xué)生的約會(huì)成功率要高
亞洲人和其它人種相比約會(huì)機(jī)會(huì)更少
縱覽其它因素,雖然女生很少,計(jì)算機(jī)專(zhuān)業(yè)的男生似乎并不處于劣勢(shì)

剩下的變量(身高/事業(yè)/有趣性/社交性/時(shí)尚/居住地)這些和成功約會(huì)的關(guān)系不是很大。不好意思,哪怕你在 Facebook 上班,該沒(méi)女票還是沒(méi)有。

本次實(shí)驗(yàn)的完整結(jié)果:

 

 

接著我們檢查各變量之間的關(guān)系,這可以幫我們識(shí)別出不正確的模型假設(shè)。紅色表示正相關(guān),藍(lán)色表示負(fù)相關(guān)。我們只展示統(tǒng)計(jì)顯著性 <0.1 的相關(guān)性,因此大部分變量之間的關(guān)系為空白。

 

 

從圖中看起來(lái){有女朋友,看起來(lái)自信,去健身房,不戴眼鏡}有相互關(guān)系。

在接著往下看之前,我得強(qiáng)調(diào)一下我的這些朋友不能代表滑鐵盧大學(xué)的整體情況。我平時(shí)都是在課堂上或工作中認(rèn)識(shí)的他們(雖然什么樣的人都有,但都是從事計(jì)算機(jī)相關(guān)的事情),要么是熟人(雖然來(lái)自不同專(zhuān)業(yè),但大部分來(lái)自東亞地區(qū),在加拿大生活)。

用這些數(shù)據(jù)訓(xùn)練后的模型也會(huì)反應(yīng)這些偏差,未來(lái)我也會(huì)擴(kuò)大調(diào)查范圍,收集更多數(shù)據(jù)。

用邏輯回歸預(yù)測(cè)找女票

要是有個(gè)算法能夠預(yù)測(cè)你有多大幾率可以找到女票,豈不美哉?我們?cè)囋?

我訓(xùn)練了一個(gè)邏輯回歸廣義線性模型,根據(jù)我們前文列舉的這些說(shuō)明變量預(yù)測(cè)是否會(huì)有女票。借助 R 語(yǔ)言中的 glmnet 和 caret 包,我用彈性網(wǎng)絡(luò)正則化訓(xùn)練了這個(gè)廣義線性模型。然后用標(biāo)準(zhǔn)網(wǎng)格搜索法優(yōu)化了超參數(shù),在每次迭代中使用留一交叉驗(yàn)證法,并優(yōu)化 kappa 系數(shù)。

 

 

最終模型的交叉驗(yàn)證 ROC AUC 分?jǐn)?shù)為 0.673,也就是說(shuō)模型在預(yù)測(cè)你找到女票的幾率方面,比你憑感覺(jué)亂猜還是更靠譜些。當(dāng)然了,生活中總會(huì)有些偶然的不確定因素,人生也會(huì)有驚喜嘛。

好了不說(shuō)了,我去健身房了,還要努力摘掉眼鏡!

后話:小哥在原文中將自己的模型分享了出來(lái)(很可能已經(jīng)找到另一半所以也不藏私了),用它就能測(cè)試自己在滑鐵盧大學(xué)找到女票的概率。奈何打開(kāi)鏈接后,目前已無(wú)法獲取模型。如果后期能正常訪問(wèn),我們會(huì)把這款能預(yù)測(cè)你“姻緣”的模型分享給大家。當(dāng)然了,如果你能自己創(chuàng)建一款這樣可以預(yù)測(cè)桃花運(yùn)概率的AI“半仙”,那是墜吼滴!

參考資料: Learning to find a Girlfriend at the University of Waterloo by Logistic Regression

https://medium.com/@uw_data_scientist/learning-to-find-a-girlfriend-at-the-university-of-waterloo-by-logistic-regression-18a0d22da896

標(biāo)簽: 代碼 搜索 網(wǎng)絡(luò)

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點(diǎn)!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請(qǐng)與原作者聯(lián)系。

上一篇:看重?cái)?shù)據(jù)還是看重體驗(yàn)?

下一篇:你很懂大數(shù)據(jù),但是真的懂大數(shù)據(jù)營(yíng)銷(xiāo)嗎?