中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

為什么每個數(shù)據(jù)科學(xué)家都要讀一讀Judea Pearl的《The Book of Why》

2019-03-19    來源:raincent

容器云強勢上線!快速搭建集群,上萬Linux鏡像隨意使用

《The Book of Why: The New Science of Cause and Effect》(為什么:因果關(guān)系的新科學(xué))是人工智能先驅(qū)、貝葉斯網(wǎng)絡(luò)之父 Judea Pearl 的一本著作,是作者對自己過去 25 年在因果關(guān)系方面所做研究的一次總結(jié)。這本書頗具啟發(fā)性,以至于本文作者讀過之后忍不住向所有人推薦。

 

 

我熱衷于機器學(xué)習(xí)已經(jīng)有 4 個年頭,對深度學(xué)習(xí)感興趣也有一年了。我構(gòu)建了用于娛樂和工作的預(yù)測模型,也了解很多算法,從梯度提升(gradient boosting)這種傳統(tǒng)模型到LSTM這種很深的模型。盡管習(xí)得了很多算法,但是我的困惑依然存在。

算法自己也無法解決的困惑

如果你不是那種只關(guān)心 0.01% 的錯誤率降低,而是努力使自己的模型有意義的數(shù)據(jù)科學(xué)家,你可能一次又一次地這樣問自己:

♦ 我應(yīng)該把這個變量添加到模型里面嗎?

♦ 為什么這個反直覺的變量會作為一個預(yù)測結(jié)果出現(xiàn)?

♦ 為什么當(dāng)我增加另一個變量的時候這個變量就會突然變得沒有意義?

♦ 為什么相關(guān)性的方向與我所認(rèn)為的會相反呢?

♦ 為什么我所認(rèn)為的一個很高的相關(guān)性結(jié)果卻是零相關(guān)呢?

當(dāng)我將數(shù)據(jù)分解成幾個子部分的時候,為什么關(guān)系的方向會反過來?

隨著時間的推移,我已經(jīng)建立了足夠的意識來解決這些基本問題,例如,我知道雙變量關(guān)系和多變量關(guān)系可能是非常不同的,或者是數(shù)據(jù)受到了選擇偏差的影響。但我還是缺乏一個堅定的框架來確定地說服我自己和其他人。更重要的是,或許直到關(guān)系和我的想法矛盾的時候我才會意識到!值得注意的是,當(dāng)某件事情出現(xiàn)矛盾的時候,說明它早已出了嚴(yán)重的偏差。如果沒有地圖,怎么才能在意識到迷路之前確定我走的方向有沒有問題呢?

沒錯,關(guān)聯(lián)和因果關(guān)系都是可以預(yù)測的

當(dāng)我讀了 Judea Pearl 的《為什么:因果關(guān)系的新科學(xué)》這本書之后,這個困惑完全消除了,F(xiàn)在它已經(jīng)成為我的數(shù)據(jù)科學(xué)指南了。在本文中,我會簡要地介紹一下這本書。簡言之,它就是在講因果——原因與結(jié)果之間的關(guān)系。有兩種方式可以預(yù)測未來的某件事情:

♦ 我知道當(dāng) X 出現(xiàn)的時候,Y 也會出現(xiàn)(關(guān)聯(lián))

♦ 我知道 X 會導(dǎo)致 Y(因果)

這兩種方式都可以用于預(yù)測。兩種方式都可以得到相似的模型性能。所以,它們有什么不同呢?為什么要費心理解因果關(guān)系呢?如果它是一個強大的工具,那么因果關(guān)系可以通過數(shù)據(jù)來研究嗎?

隨機對照實驗為何有時候并不可行?

作為一個黃金準(zhǔn)則,隨機對照試驗(RCT)(也就是市場營銷中所謂的 A/B 測試)被用來進(jìn)行因果測試。在臨床試驗中,這項技術(shù)被用來研究某個特定的藥物/治療方法是否能夠改善健康。

隨機就是為了最小化選擇偏倚,所以我們知道,我們不會特意選擇病情更嚴(yán)重的病人來應(yīng)用某種治療方法,這種做法明顯收益更低,如果我們不選擇病情更嚴(yán)重的病人收益要更高?刂谱兞科鸬搅嘶鶞(zhǔn)的作用,以便我們比較接受了治療和沒接受治療的病人。作為一個標(biāo)準(zhǔn),這里也有一個所謂的雙盲機制,病人不知道他們是否接受了治療,這是為了避免心理作用。

盡管這是一個黃金準(zhǔn)則,但是它在某些條件下可能是不切實際的。例如,如果我們想研究吸煙對肺癌的影響,很顯然我們不能強迫某人去吸煙。另一個例子就是:如果我想知道讀博對我的人生有多大的促進(jìn)作用,那肯定也不能進(jìn)行對照實驗,因為時間一去不復(fù)返。畢竟,一項實驗會有很多限制,例如,樣本是否能夠代表全體?是否是合乎道德的?等等。

從觀察的數(shù)據(jù)到因果分析?

如果開展實驗是不現(xiàn)實的,那么我們可不可以使用觀察到的數(shù)據(jù)來研究因果關(guān)系呢?觀察到的數(shù)據(jù)意味著我們不能做任何干預(yù),我們只能觀察。這是否可能呢?

不管是否了解統(tǒng)計,你可能都聽過這個說法:相關(guān)性并不意味著因果關(guān)系。但是,它并沒有告訴你如何研究因果關(guān)系。好消息就是,在閱讀完這本書之后,你會得到一個更好的框架,利用它判斷如何研究因果關(guān)系,以及決定何時可以/不可以利用手頭的數(shù)據(jù)來做研究,這樣一來你就知道應(yīng)該收集什么數(shù)據(jù)了。

這本書中的一些觀點

我在這里并不展開具體的技術(shù)或者公式。一方面,我只是讀完了這本書,并不是因果關(guān)系方面的專家;另一方面,我鼓勵你讀這本書,以防錯過任何一個見解,因為我也可能是有偏見的。

盡管大數(shù)據(jù)很重要,但是將所有的東西都添加到你的模型中或許并不可行。

大數(shù)據(jù)時代幾乎擁有無限的計算力和數(shù)據(jù),你或許想要將所有的數(shù)據(jù)都放到一個深度神經(jīng)網(wǎng)絡(luò)中來進(jìn)行自動特征提取。我也受到了這種誘惑。

這本書告訴了你一些關(guān)于添加變量的注意事項。例如,你想要預(yù)測 Z,而且基本的關(guān)系是 X→Y→Z(箭頭代表的是「導(dǎo)致」,在這里 Y 是一個中間變量,它連接著從 X 到 Z 的作用)。如果你將 X 和 Y 作為模型的變量添加進(jìn)去,Y 可能會吸收所有的「解釋力」,它會將 X 從你的模型中踢出去,因為從 Z 的角度來看,Y 比 X 更加直接。這便阻礙了你研究從 X 到 Z 的因果關(guān)系。你或許會說,這在預(yù)測上是沒有區(qū)別的,不是嗎?從模型性能的角度來看的確是這樣的,但是,倘若我告訴你 Y 離 Z 是如此之近,以至于當(dāng)你知道 Y 的時候,Z 已經(jīng)發(fā)生了,這將如何?

同樣,不添加某些變量也是有風(fēng)險的。你可能聽過偽相關(guān)或者混雜變量這個術(shù)語。基本的思想可以在這個關(guān)系中描述:Z←X←Y(也就是說,X 是一個混雜變量)。注意這里的 Y 和 Z 之間是沒有因果關(guān)系的,但是如果你不考慮 X 的話,Z 和 Y 之間就會出現(xiàn)一個關(guān)系。一個著名的例子就是巧克力消費量與諾貝爾獎獲獎數(shù)之間的正相關(guān)關(guān)系。結(jié)果這兩者的一個共同影響因素是國家的富裕程度。同樣,你可能認(rèn)為預(yù)測沒有問題,但是你可能很難向別人解釋你的模型。

當(dāng)然,世界遠(yuǎn)比我們想的復(fù)雜,但是這就是領(lǐng)域知識發(fā)揮作用的地方。因果圖是有關(guān)事物如何運作的簡單而有力的表征。

書中還有很多高級的腦筋急轉(zhuǎn)彎和現(xiàn)實生活的例子。

因果關(guān)系或許更加魯棒

因果關(guān)系可能隨著時間發(fā)生變化。如果你希望模型一直是魯棒的,可以建立 Z←X→Y 這樣的模型。在這個模型中,由于你建模的是 X → Y,所以如果關(guān)系 Z←X 變?nèi)趿,你并不會受到影響,但如果你?Z 和 Y 之間建模就會受到影響了。

從另一個角度來說,如果我們相信因果是比關(guān)聯(lián)更強的一種關(guān)系,那么這意味著,當(dāng)我們從一個領(lǐng)域借用到另一個領(lǐng)域時,那種關(guān)系更有可能保持。正如書中所提到的,這就是所謂的遷移學(xué)習(xí)/可遷移性。書中引用了一個關(guān)于可遷移性的非常富有見解的例子,它描述了我們?nèi)绾我钥梢姷姆绞竭M(jìn)行調(diào)整,以便將因果關(guān)系從一個領(lǐng)域遷移到另一個領(lǐng)域。

干預(yù)變得更加容易了,尤其是在數(shù)字時代

干預(yù)實際上是研究因果關(guān)系最重要的動機之一。通過僅僅學(xué)習(xí)關(guān)聯(lián)得到的預(yù)測模型不能給你提供關(guān)于干預(yù)的深入見解。例如,在 Z← X → Y 這個關(guān)系中,你不能改變 Z 來影響 Y,因為它們沒有因果關(guān)系。

如果你能理解基本關(guān)系的話,干預(yù)本身就是一個更為強大的工具。這意味著,你可以通過改變管理策略來讓我們的世界變得更加美好;你可以改變治療方法來拯救更多的病人,等等...... 這就是你拯救病人和預(yù)測病人會死但不能干預(yù)之間的區(qū)別!或許這是數(shù)據(jù)科學(xué)家能做的最好的事情,只需要這個工具就行。

在這個數(shù)字時代,干預(yù)并不費力,而且確切的是,你有很多數(shù)據(jù)來研究因果關(guān)系。

這就是我們推理的方式,也或許是通向真正人工智能的道路

最后是關(guān)于人工智能的內(nèi)容。推理是智能的必要部分,這也是我們的感覺。在閉環(huán)的世界中,強化學(xué)習(xí)在預(yù)定義的獎勵和規(guī)則下通過平衡探索和開發(fā)能夠?qū)崿F(xiàn)卓越的性能,并且,在這種機制下,采取的動作能夠改變狀態(tài),狀態(tài)反過來又能夠決定獎勵。在這個復(fù)雜的世界中,保持這種機制有點不太可能。

從哲學(xué)角度來說,我們應(yīng)該理解我們做出決定的方式。最有可能的是,你會問「如果我這么做了,會發(fā)生什么;如果我那么做了,又將如何?」。請注意,你僅僅是創(chuàng)建了兩個并沒有發(fā)生的幻想世界。有時候當(dāng)你為了從錯誤中學(xué)習(xí)而做一些反思時,你可能會問:「如果我這么做了,那件事就不會發(fā)生!乖僖淮,你創(chuàng)建了反事實的世界。事實上我們比自己想像的更有想象力。想象的世界都是基于因果關(guān)系建立的。

也許機器人有它們自己的邏輯,但如果希望它們能夠像我們一樣,就要教會它們推理。這讓我想起了 DeepMind 發(fā)表過的一篇論文——《Measuring abstract reasoning in neural networks》(在神經(jīng)網(wǎng)絡(luò)中衡量抽象推理),這篇論文證明,將推理作為訓(xùn)練數(shù)據(jù)的一部分能夠增強泛化性能。我深受此文啟發(fā),這正是我們教機器人推理的例子!這也是在模式上從關(guān)聯(lián)到推理的一次跳躍。

我猜測:因果關(guān)系對泛化是有幫助的。雖然我沒有證據(jù),但這就是我們理解世界的方式。我們學(xué)習(xí)了一兩個例子,然后學(xué)習(xí)因果關(guān)系,再然后我們將因果關(guān)系應(yīng)用在我們認(rèn)為可以用到的任何地方。

將所有的東西放在一張因果圖中,或許推理就是 IQ 測試問答中的混雜變量?我們是不是可以這么認(rèn)為:推理導(dǎo)致人在問題中設(shè)計這種模式,它也「導(dǎo)致」了問題的答案?或者,它是將問題轉(zhuǎn)換成推理的中間媒介,推理反過來又導(dǎo)致了問題的答案?或者可能兩者都是?請注意,我刻意假設(shè)問題和答案之間沒有因果關(guān)系,因為它們只是單純的模式關(guān)聯(lián)。

 

 

這一切僅僅是我的猜想。我不知道答案是什么。我不是一個專業(yè)的研究者或哲學(xué)家。但是我可以確定的是:當(dāng)我們在解決問題的時候,因果關(guān)系提供了一個新的角度。因果關(guān)系和深度學(xué)習(xí)之間的協(xié)同聽起來很有前景。

結(jié)語

我承認(rèn)這篇文章的主題或許有些激進(jìn),但是我覺得自己有責(zé)任向所有的人推薦這本書。它告訴了我們因果關(guān)系的全部潛力。因果關(guān)系是與生俱來的,但是在大數(shù)據(jù)時代我們卻忽略了它。這個框架已經(jīng)存在了。只是有待于部署和付諸實踐。

作為一名從業(yè)者,我相信我會使用這個工具產(chǎn)生更好的影響。

擴展閱讀:觀點 | 專訪貝葉斯網(wǎng)絡(luò)之父 Judea Pearl:我是 AI 社區(qū)的「叛徒」

原文鏈接:https://towardsdatascience.com/why-every-data-scientist-shall-read-the-book-of-why-by-judea-pearl-e2dad84b3f9d

標(biāo)簽: [db:TAGG]

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:Gartner報告:我們正處于數(shù)據(jù)科學(xué)與機器學(xué)習(xí)工具 “大爆炸”的時代

下一篇:中國移動公布2019年物聯(lián)網(wǎng)USIM卡產(chǎn)品集采中標(biāo)結(jié)果