中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

數(shù)據(jù)行業(yè)大夢一場:從瘋狂到覆滅

2019-12-03    來源:raincent

容器云強(qiáng)勢上線!快速搭建集群,上萬Linux鏡像隨意使用

 

來源:馨金融 作者:洪偌馨 圖片來自“123RF”

大數(shù)據(jù)、人工智能為我們勾畫了未來宏偉藍(lán)圖的同時,卻從鮮少向人們顯示與「便捷」孿生的「危險」底色,直到有人將現(xiàn)實(shí)撕開一道口子。

最近,江蘇淮安警方依法打擊了7家涉嫌侵犯公民個人信息犯罪的公司。其中,2015年3月以來,北京考拉征信公司非法提供查詢返照9800余萬次,獲利3800余萬元,警方在公司服務(wù)器中查獲并收繳被非法獲取、存儲的公民姓名、身份證號、照片近1億條。

海量信息泄露的背后,是一整條完整的個人信息挖掘、收集、交易、利用的產(chǎn)業(yè)鏈,以及其所帶來的巨大利益誘惑。

在這條產(chǎn)業(yè)鏈上,公民個人信息被稱為「流量」,可以隨意被打包倒買倒賣,甚至一個普通員工的電腦里都可以存儲著幾萬人的隱私信息。而一條包含了用戶姓名、身份證號、住址、電話、銀行卡號等個人信息的「流量」,價格只有幾毛錢。

此前,公安部通報「凈網(wǎng)2019」專項(xiàng)行動工作情況及典型案例時也提到,專項(xiàng)行動的成果之一是搗毀了一批為「套路貸」提供技術(shù)、數(shù)據(jù)服務(wù)的科技公司。據(jù)財(cái)新報道,涉案的部分大數(shù)據(jù)服務(wù)商分別為新顏科技、聚信立、信川科技(同盾科技子公司)、魔蝎科技。

相比與C端與用戶直接接觸的貸款平臺,這些公司的名字可能并不為大眾所知,但他們所掌握的數(shù)據(jù)庫和客戶數(shù)量遠(yuǎn)超過我們的想象。

在過去幾年時間里,伴隨著互聯(lián)網(wǎng)貸款行業(yè)的快速發(fā)展,他們以低廉的成本獲取用戶信息,再通過各種方式變現(xiàn)獲得了超額利潤,同時也裹挾了大量資本,頂著「科技」的光環(huán)一往無前。

如今,這場殘暴的歡愉,終將以殘暴終結(jié)。但在一地雞毛之外,這個行業(yè)值得一場更全面的反思。

風(fēng)口之上

時間回到2013年,時任阿里巴巴集團(tuán)安全部技術(shù)總監(jiān)將離職創(chuàng)業(yè)的消息一經(jīng)傳出,投資圈里便開始躁動。因?yàn),?013」、「阿里巴巴」、「互聯(lián)網(wǎng)金融」這幾個關(guān)鍵詞湊在一起,一個標(biāo)簽呼之欲出——獨(dú)角獸。

那一年,余額寶問世、P2P崛起、移動支付普及,在阿里系的離職創(chuàng)業(yè)大軍中,互聯(lián)網(wǎng)金融成為了一個重要領(lǐng)域。那一年,何俊創(chuàng)辦銅板街,錢志龍?jiān)囁異蹖W(xué)貸,被IDG緊盯的李治國出任挖財(cái)CEO,這些創(chuàng)業(yè)公司無一例外都成為了資本追逐的對象。

而蔣韜帶著幾乎是全「阿里巴巴」的班底創(chuàng)立同盾科技,無異于手握一張?zhí)焓馆喨谫Y百萬美元起步的底牌。風(fēng)口之下,形勢一片大好。同盾科技產(chǎn)品總監(jiān)祝偉當(dāng)時剛剛升職拿到阿里巴巴的期權(quán),還沒捂熱乎就轉(zhuǎn)頭加入了蔣韜的創(chuàng)業(yè)團(tuán)隊(duì)。

華創(chuàng)資本的當(dāng)家人吳海燕在與蔣韜見面后迅速敲定了這筆投資,并為蔣韜介紹了第一個客戶。IDG資本也參與了投資,天使輪的融資規(guī)模便在千萬級人民幣。資本、團(tuán)隊(duì)、項(xiàng)目逐一到手,而這一切距離蔣韜離職不過剛剛一個月。

當(dāng)然,并非所有的創(chuàng)業(yè)者都這般幸運(yùn)。

同樣是2013年年下半年,羅皓在結(jié)束了一場為期一年零七個月的創(chuàng)業(yè)后,注冊了上海誠數(shù)信息科技有限公司,也就是后來我們熟知的「聚信立」。見完了一波又波投資人后,他終于拿到了100萬的啟動資金,而等這筆錢到賬已是2014年年中的時候了。

如蔣韜般幸運(yùn)也好,如羅皓般不易也罷,在2013年前后,一大批「數(shù)據(jù)」公司如雨后春筍般涌現(xiàn)。但在互聯(lián)網(wǎng)金融剛剛萌芽的初期,在數(shù)據(jù)市場還處于一片混沌的時候,這些探路者的進(jìn)程并不順利。

當(dāng)時,在國外已經(jīng)出現(xiàn)Sift Science、 Signifyd等利用大數(shù)據(jù)反欺詐的公司,其主要的客戶是電商,通過設(shè)計(jì)反欺詐監(jiān)測模型,幫助電商平臺及其他公司監(jiān)測虛假賬戶、虛假支付記錄、低俗內(nèi)容等等,以減少損失。

最初,蔣韜想要復(fù)制這個路徑,通過SaaS服務(wù)先切入電商、支付市場。但是當(dāng)時線下收單企業(yè)沒有風(fēng)控需求;而線上支付主要被巨頭壟斷,而這些大公司都有風(fēng)控部門,會依據(jù)自己的數(shù)據(jù)做評分、建模,并不會選擇與外部合作,因此同盾科技不得不轉(zhuǎn)而尋找其他方向。

事實(shí)上不只是同盾科技,羅皓此前已經(jīng)在大數(shù)據(jù)領(lǐng)域有過一次失敗的創(chuàng)業(yè)經(jīng)歷。當(dāng)時那個項(xiàng)目主要是為用戶提供微博的精準(zhǔn)營銷,但這一領(lǐng)域?qū)τ跀?shù)據(jù)量級有著較高的要求,再加上社交數(shù)據(jù)壁壘高,客戶很難將其交給第三方,清洗挖掘難度也很大,最終他不得不關(guān)停項(xiàng)目。

與數(shù)據(jù)公司們在諸多領(lǐng)域艱難探索相對應(yīng)的是,P2P行業(yè)以一種近乎野蠻的速度開始崛起。

數(shù)據(jù)顯示,從2013年到2015年,中國市場上P2P網(wǎng)貸平臺數(shù)量就從800家增長至2595家,累計(jì)交易規(guī)模超過1.4萬億。而從業(yè)務(wù)邏輯來看,網(wǎng)貸業(yè)務(wù)與數(shù)據(jù)業(yè)務(wù)有著天然的契合。

在這樣一個急速擴(kuò)張的市場里,大部分P2P平臺的數(shù)據(jù)能力、風(fēng)控能力卻極為薄弱。因?yàn)镻2P平臺無法獲得央行征信數(shù)據(jù),若要大規(guī)模展業(yè),必須依賴第三方大數(shù)據(jù)輔助做風(fēng)控。而這無形間也為同盾科技、聚信立這樣的公司創(chuàng)造了巨大的市場機(jī)會。

「惡」的種子

2015年初,聚立信發(fā)布了一款新產(chǎn)品,標(biāo)志著公司徹底放棄在社交等其他領(lǐng)域的數(shù)據(jù)服務(wù)探索,轉(zhuǎn)而專注于互聯(lián)網(wǎng)消費(fèi)金融領(lǐng)域。

在該產(chǎn)品發(fā)布的同時,羅皓驕傲地向媒體宣布,在過去一年多時間里,該產(chǎn)品將數(shù)據(jù)分析的維度從50個擴(kuò)展至5000+個,「爬蟲」爬過的網(wǎng)站超過100個,接入數(shù)據(jù)接口增加到80個。

在今天看來,「爬蟲」技術(shù)是個人信息泄露的罪魁禍?zhǔn),但在?dāng)時它確是炙手可熱的「寶貝」。作為一種誕生已久的互聯(lián)網(wǎng)技術(shù),它幫助這些數(shù)據(jù)公司以最低的技術(shù)門檻和最低的成本迅速拓展數(shù)據(jù)源。

而對于第三方數(shù)據(jù)公司們,數(shù)據(jù)是一切商業(yè)模式的起點(diǎn)——沒有足夠的數(shù)據(jù)就無法建立起有效的模型,而模型的效果不好就無法吸引更多客戶使用服務(wù),沒有數(shù)據(jù)源的擴(kuò)充也就進(jìn)一步喪失完善模型的可能。如此,環(huán)環(huán)相扣。

但這也成為了「惡」的原點(diǎn)。

為了加快數(shù)據(jù)沉淀,不同公司都有一套自己的方法論。具體來看,聚信立通過B端合作來驅(qū)動C端主動授權(quán)提供個人信息。方法也很簡單,他們與大量的網(wǎng)貸平臺、小貸公司等合作,當(dāng)后者接到貸款申請時,他們會要求用戶提供一份由聚信立提供的信用評估報告。

C端客戶為了順利從B端拿到資金,勢必授權(quán)給聚信立,聚信立就能直接到數(shù)據(jù)源去爬取借款人的相關(guān)信息,并將非標(biāo)準(zhǔn)化信息轉(zhuǎn)為標(biāo)準(zhǔn)化,最終形成對借款人的綜合評估。

同盾科技旗下公司「數(shù)據(jù)魔盒」路徑也類似。他們在早期通過「免費(fèi)」的方式大量拓展B端平臺,「認(rèn)可效果再付費(fèi)」是他們快速發(fā)展的重要戰(zhàn)略之一。同盾科技還拓展了許多跨行業(yè)的客戶,比如婚戀、航旅網(wǎng)站等等,這些數(shù)據(jù)都被納入數(shù)據(jù)采集的維度當(dāng)中。

「算法的上限是數(shù)據(jù),如果說這個公司只是依賴于自己的數(shù)據(jù)去做分析,那么不管你招再牛的人、做再牛逼的算法,它的效果都是有上限的!故Y韜如是評價自己的商業(yè)模式。

在當(dāng)時,這是一個看起來「三贏」的生意,借款人獲得了資金,平臺有效控制了風(fēng)險,第三方數(shù)據(jù)公司獲得了數(shù)據(jù),甚至看起來沒有任何不合規(guī)——數(shù)據(jù)公司在爬取數(shù)據(jù)之前先獲得了用戶的授權(quán)。

但是,當(dāng)用戶交出個人信息、數(shù)據(jù)公司以極低的成本聚攏了海量數(shù)據(jù)之后,「惡」的種子便已經(jīng)埋下。只是在市場發(fā)展早期,一切規(guī)則都尚未成型,互聯(lián)網(wǎng)貸款市場的急速擴(kuò)張、資本市場的加速涌入,使得市場參與者們都來不及多想。

公開信息顯示,截止2015年10月,同盾科技累計(jì)服務(wù)客戶超2000家,這一數(shù)字在一年之后便增長至5000家。在數(shù)據(jù)調(diào)取上,同盾科技每天的數(shù)據(jù)被調(diào)取量約為3000萬,其中信貸業(yè)務(wù)平均每天約500萬筆。

也是在2015年,同盾科技完成B輪3000萬美元融資。

鮮花簇錦

高歌猛進(jìn)的互聯(lián)網(wǎng)貸款行業(yè)也將數(shù)據(jù)公司帶入了發(fā)展的高峰。

2016年初,時任51信用卡CTO的周江翔離職,隨后便創(chuàng)辦了魔蝎科技;天翼征信前副總經(jīng)理黃向前也離開供職多年的「電信系」金融科技公司,出任新顏科技CEO;在銀行體系內(nèi)有著豐富技術(shù)研發(fā)經(jīng)驗(yàn)的楊攸斌也「下!梗瑒(chuàng)辦了白騎士。

 

 

馨金融根據(jù)公開資料整理

越來越多的有著專業(yè)背景和光鮮履歷的創(chuàng)業(yè)者扎進(jìn)了數(shù)據(jù)行業(yè)。

這種現(xiàn)象的出現(xiàn)并非偶然。2016年,盡管P2P增速有所放緩,但現(xiàn)金貸平臺洶涌。數(shù)據(jù)顯示,這一年國內(nèi)現(xiàn)金貸平臺數(shù)量有千家,放貸規(guī)模已達(dá)萬億量級,這是一個比P2P還要野蠻的領(lǐng)域。一個更直觀的例子是,僅二三四五一家平臺在2016年的放貸金額就增長了20倍。

而每一家平臺,從獲客到風(fēng)控,再到催收都需要「數(shù)據(jù)」的支持,而頻繁的數(shù)據(jù)調(diào)取、使用,讓數(shù)據(jù)公司賺的盆滿缽滿。

新流財(cái)經(jīng)曾披露一份文件顯示,同盾科技在2016年的付費(fèi)調(diào)用量已經(jīng)達(dá)到4.99億次,這一數(shù)據(jù)在2017年攀升至18.08億次,到2018年進(jìn)一步增長至驚人的22.87億次。與此同時,單次調(diào)用的價格也水漲船高,從2016年的0.09元/次增長至2018年的0.21元/次。

事實(shí)上,經(jīng)歷了前幾年的發(fā)展之后,此時的數(shù)據(jù)公司們已經(jīng)形成了完整的底層數(shù)據(jù)+產(chǎn)品服務(wù)+增值服務(wù)的業(yè)務(wù)鏈,可以為現(xiàn)金貸平臺提供從基礎(chǔ)數(shù)據(jù)到創(chuàng)新產(chǎn)品的全流程服務(wù),需求如井噴般涌現(xiàn)。下圖是聚信立在2017年的主打產(chǎn)品和數(shù)據(jù)底層組成情況:

以聚信立為例,當(dāng)時它的爬蟲接口,可授權(quán)爬取總計(jì)1200家網(wǎng)站覆蓋所有電商、社保網(wǎng)站,90%以上的公積金網(wǎng)站、主流保險網(wǎng)站,涵蓋央行征信、運(yùn)營商數(shù)據(jù)、學(xué)歷學(xué)籍、信用卡賬單、電商數(shù)據(jù)等等信息。

由于現(xiàn)金貸平臺無法接入央行征信,當(dāng)然它們獲得征信報告的意義也并不大,因?yàn)槠涓采w的用戶大多缺乏在傳統(tǒng)金融機(jī)構(gòu)的信貸記錄。那么只能通過其它渠道的數(shù)據(jù)來甄別是否有欺詐風(fēng)險、共債風(fēng)險。

在這樣的背景之下,第三方數(shù)據(jù)公司們所扮演的角色已然發(fā)生了轉(zhuǎn)變。如果說之前他們更多是扮演金融「外包」的角色,那么在建立了一定的客戶和數(shù)據(jù)基礎(chǔ)后,它們無形間成為了互聯(lián)網(wǎng)貸款市場中隱形的「征信中心」,或者說「信息共享中心」。

由于覆蓋的群體特殊,連持牌金融機(jī)構(gòu)等開始尋求合作。

烈火油烹

上帝欲使人滅亡,必先使其瘋狂。

2017年下半年開啟的「現(xiàn)金貸」整治不僅沒有讓這些數(shù)據(jù)公司及時收手,它們更隨著現(xiàn)金貸行業(yè)開始了「最后的狂歡」。

「只要有人還在借錢,就會有數(shù)據(jù)需求,而且行業(yè)越是收緊、風(fēng)控越是嚴(yán)格,頭部數(shù)據(jù)公司的生意也就約好。」一個從業(yè)者朋友如是感慨到。在巨大的利益面前,大部分?jǐn)?shù)據(jù)公司都選擇忽略風(fēng)險。

2017年年中,魔蝎科技便被媒體曝出,其開發(fā)的「同業(yè)爬蟲」產(chǎn)品直接將其他現(xiàn)金貸平臺的放款額和風(fēng)控?cái)?shù)據(jù)爬出來,手段太過野蠻。當(dāng)時魔蝎科技COO張俊九在內(nèi)部信中表示,

「未來2個月,我們將逐漸關(guān)停爬蟲業(yè)務(wù),同時會啟動向已簽約客戶的賠償機(jī)制。」

然而,事后證明,魔蝎科技的爬蟲業(yè)務(wù)并未關(guān)停,反而變本加厲。

當(dāng)時的現(xiàn)金貸行業(yè)已經(jīng)陷入瘋狂,「714高炮」等超利貸產(chǎn)品屢禁不止。為了在最短時間內(nèi)收割最大的利潤,一些現(xiàn)金貸平臺瘋狂到,只要拿到運(yùn)營商報告(通話詳單),能夠保證催收,就可以放款。

前述被調(diào)查的考拉征信,更是牽出了一條由數(shù)據(jù)公司主導(dǎo)的黑產(chǎn)鏈條——考拉征信從上游公司獲取接口后,又將查詢接口出售,非法緩存公民個人信息,供下游公司查詢牟利。

而更令人發(fā)指的是,這些上下游的公司不僅通過販賣信息獲利,還經(jīng)營現(xiàn)金貸平臺,利用手上掌握的個人信息進(jìn)行貸款推銷、軟暴力催收等等。

從某個角度來看,第三方數(shù)據(jù)服務(wù)本身就是一個生于灰色地帶邊緣的產(chǎn)業(yè)。一部分業(yè)務(wù)長在陽光下,不斷獲得資本的澆灌,向人們描繪著這個行業(yè)未來會開出燦爛的花、結(jié)出誘人的果。但另一部分業(yè)務(wù)卻潛藏在地底,不斷在法律和道德邊緣試探。

這場踐踏了法律與道德底線的狂歡,終究不可持續(xù)。

2017年,徐玉玉案發(fā),開始引起全社會對于信息泄露的高度關(guān)注。

一個女大學(xué)生接到了為她「量身定制」的詐騙電話,以教育部門下發(fā)獎學(xué)金為借口被騙走了全部學(xué)費(fèi)。當(dāng)晚,在報案后回家的路上,徐玉玉突然暈厥,不治身亡。此事掀起了一場關(guān)于數(shù)據(jù)行業(yè)的撻伐。

從2017年年中開始,中央網(wǎng)信辦、工信部、公安部和國家標(biāo)準(zhǔn)委等部門就開始密集合作,針對國內(nèi)大數(shù)據(jù)行業(yè)野蠻生長中的各種亂象展開各種行動,先后將30家大數(shù)據(jù)風(fēng)控平臺列入調(diào)查,其中就包括新三板上市公司數(shù)據(jù)堂。

調(diào)查結(jié)果顯示,在8個月內(nèi),涉案公司日均傳輸公民個人信息1億3千萬余條,累計(jì)傳輸數(shù)據(jù)壓縮后約為4000GB左右,公民個人信息達(dá)數(shù)百億條,數(shù)據(jù)量巨大。

進(jìn)入2018年以后,重點(diǎn)垂直行業(yè)的數(shù)據(jù)監(jiān)管力度進(jìn)一步提升。尤其是新金融領(lǐng)域里,包括個人征信試點(diǎn)機(jī)構(gòu)、上市公司等都屢屢受到波及。2018年11月,針對大數(shù)據(jù)行業(yè)亂象,監(jiān)管再次帶走大量從業(yè)者調(diào)查。

眼下,數(shù)據(jù)行業(yè)迎來第三輪整治。杭州、北京、深圳等地全面排查數(shù)據(jù)公司,央行、「兩高」等各部委接連下發(fā)打擊套路貸、加強(qiáng)個人信息數(shù)據(jù)保護(hù)等文件,連「助貸」、「催收」等業(yè)務(wù)鏈上的各個環(huán)節(jié)都被嚴(yán)查。

拷問未來

數(shù)據(jù)行業(yè)帶上「緊箍咒」。

今年年中,國家互聯(lián)網(wǎng)信息辦公室發(fā)布《數(shù)據(jù)安全管理辦法(征求意見稿)》,文件系統(tǒng)地規(guī)定了網(wǎng)絡(luò)運(yùn)營者數(shù)據(jù)收集、數(shù)據(jù)處理使用、數(shù)據(jù)安全監(jiān)督管理等覆蓋數(shù)據(jù)全生命周期的綜合合規(guī)要求,以及強(qiáng)制捆綁授權(quán)、網(wǎng)絡(luò)爬蟲等新型數(shù)據(jù)安全問題。

隨后,《信息安全技術(shù)移動互聯(lián)網(wǎng)應(yīng)用程序(APP)收集個人信息基本規(guī)范》最新版草案中則對于網(wǎng)絡(luò)支付、金融借貸等部分服務(wù)類型所需最小必要信息進(jìn)行完善,內(nèi)容包括不應(yīng)強(qiáng)制讀取用戶的通訊錄,僅用于實(shí)現(xiàn)用戶借貸歷史查詢和處理用戶糾紛的使用要求下,可收集借貸交易記錄等。

數(shù)據(jù)行業(yè)的野蠻生長,就此畫上休止符,但由此引發(fā)的風(fēng)暴卻遠(yuǎn)未停止。

按照這個邏輯,不止是獨(dú)立的第三方數(shù)據(jù)公司,所有自身不產(chǎn)生數(shù)據(jù)(而又高度倚賴數(shù)據(jù))的商業(yè)模式可能都將面臨艱難的處境。比如,金融科技公司、人工智能公司.....沒有數(shù)據(jù)的持續(xù)「喂養(yǎng)」,如何迭代各種模型?

所以,長期來看,這一次數(shù)據(jù)行業(yè)的「地震」,所波及的范圍可能比想象中要廣的多。在缺少了上游數(shù)據(jù)服務(wù)商以及其所提供的「白名單」、「黑名單」等服務(wù)之后,首當(dāng)其沖的當(dāng)然是那些缺乏風(fēng)控能力的貸款平臺們。

此外,如果仔細(xì)查看這些數(shù)據(jù)公司的合作伙伴名單就會發(fā)現(xiàn),他們的合作對象早已不止于所謂的現(xiàn)金貸、P2P平臺,消費(fèi)金融公司甚至全國性銀行都在名單之列。事實(shí)上,已有持牌金融機(jī)構(gòu)因供應(yīng)商突然中止提供數(shù)據(jù)服務(wù)而暫停放款。

數(shù)據(jù)行業(yè)的隕落揭開了過去幾年新金融、新經(jīng)濟(jì)盛景的另一面:通過在灰色地帶的試探催生了繁榮,犧牲隱私交換了便捷的體驗(yàn)。而結(jié)果就是,發(fā)展越快、風(fēng)口越盛,所引發(fā)的混亂和失控也就越觸目驚心。

一切的進(jìn)步,都應(yīng)該在底線之上,否則這些進(jìn)步很可能會將我們引向更加黑暗、更加失控的未來。

標(biāo)簽: 數(shù)據(jù)行業(yè) 大數(shù)據(jù) 人工智能

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點(diǎn)!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:數(shù)據(jù)一致性檢測的應(yīng)用場景與實(shí)踐

下一篇:2020職場AI技能排行榜:TensorFlow熱度飆升,Python最火,市場部也在學(xué)