中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

大數(shù)據(jù)公司接連被查,爬蟲技術惹的禍?

2019-10-29    來源:raincent

容器云強勢上線!快速搭建集群,上萬Linux鏡像隨意使用

2019年,大數(shù)據(jù)行業(yè)迎來了“大清洗”。

今年3月以來,北京、上海、深圳、杭州等地大數(shù)據(jù)公司被查消息陸續(xù)傳出。這些地區(qū)監(jiān)管部門與警方正加大對行業(yè)亂象整治力度,十余家大數(shù)據(jù)公司或被查、暫停業(yè)務,或被警方帶走配合調查。

2019年大數(shù)據(jù)公司被查事件回顧

10月21日,“51信用卡”位于杭州西溪谷的辦公地點被警方調查。該公司于2018年香港主板上市,天眼查數(shù)據(jù)顯示,51信用卡的運營主體為杭州恩牛網絡技術有限公司,業(yè)務涵蓋個人信用管理服務、信用卡科技服務、線上信貸撮合及投資服務。

 

 

截至發(fā)稿時,警方除了通報其涉嫌尋釁滋事等犯罪外,并未透露太多被查原因,但多位業(yè)內人士猜測可能還與爬蟲程序不正當獲取用戶信息有關。這一猜測主要來源于在21日當天,一封某銀行致51信用卡公司的函件,該函件稱,該行技術監(jiān)控發(fā)現(xiàn),51信用卡通過爬蟲程序對該行用戶信息進行抓取,但51信用卡并未與銀行簽署授權書、同意書或默認其獲取用戶個人信息。

9月26日,有媒體報道知名大數(shù)據(jù)公司同盾科技有限公司爬蟲類產品“數(shù)聚魔盒”負責人被查。9月27日,同盾科技發(fā)表公開聲明回應此事,稱“為配合警方調查曾經服務的某第三方單位,杭州信川(即“杭州信川科技有限公司”)及有關人員正積極協(xié)助警方調查取證,以協(xié)助相關部門查清該第三方單位的情況。”

公開資料顯示,數(shù)聚魔盒運營主體為杭州信川科技有限公司,成立于2016年5月,同盾控股有限公司為全資控股股東。數(shù)聚魔盒以“爬取互聯(lián)網公開數(shù)據(jù)+打通同盾體系內數(shù)據(jù)+用戶授權數(shù)據(jù)采集”交叉關聯(lián)的形式,通過用戶授權,利用網頁極速抓取技術獲取各類用戶個人數(shù)據(jù),通過海量數(shù)據(jù)比對和分析,交叉驗證,最終為各類機構提供用戶的風險分析判斷。

9月11日,公信寶運營公司杭州存信數(shù)據(jù)科技有限公司辦公室被杭州市公安局西湖分局古蕩派出所查封。據(jù)了解,公信寶成立于2016年,是一家以區(qū)塊鏈為核心技術的數(shù)據(jù)科技公司。根據(jù)公信寶官網,公信寶為全球數(shù)據(jù)經濟服務,并開發(fā)了一條名為公信鏈(GXChain)的底層基礎鏈,旨在提供企業(yè)間、個人間、企業(yè)與個人之間的數(shù)據(jù)交易/交換服務。從公信寶合作方看,公信寶所售出的個人信息大規(guī)模流向網絡借貸領域,而這些信息數(shù)據(jù)來源除了頂著挖礦的名義獲取外,公信寶還通過爬蟲途徑來獲得用戶隱私數(shù)據(jù)。

9月12日上午,據(jù)業(yè)內人士爆料,中國電信控股的子公司天翼征信的總經理、副總經理以及市場人員約十人被警方帶走。據(jù)內部員工透露:“因為我們跟前面兩家被調查的爬蟲公司有合作,去主動說明情況。”

9月6日,杭州魔蝎數(shù)據(jù)科技有限公司疑似被相關執(zhí)法人員控制,與此同時,魔蝎科技為合作方提供的服務已經停止,官網也無法登陸。但到目前為止警方尚未披露相關信息。相關資料顯示,魔蝎科技成立于2016年,是國內大數(shù)據(jù)智能風控服務供應商,主要業(yè)務包括提供精準營銷模型、反欺詐、多維度用戶畫像、授信評分、貸后預警、催收智能運籌等全面風險管理服務。

 

 

同日,多方消息稱,上海新顏人工智能科技有限公司CEO黃向前被帶走,新顏科技人士表示,協(xié)助調查是因為與其合作的一家持牌網貸平臺涉及暴力催收問題,新顏科技本身的業(yè)務并未受影響。據(jù)官方網站信息顯示,新顏科技通過云計算、機器學習等技術,逐步打造了以人工智能為核心的先進技術體系,向銀行、保險、證券、基金理財、社交平臺、電商、共享平臺等多個行業(yè)進行定制化的產品設計與應用開發(fā)。

4月22日,北京海淀公安在官方微信公號上披露,招聘信息創(chuàng)業(yè)公司巧達科技(北京)有限公司王某某等36人因非法獲取計算機信息系統(tǒng)數(shù)據(jù),已被檢察機關依法批準逮捕,其中王某某曾多次被公安機關處理。公開資料顯示,巧達科技成立于2014年7月,號稱擁有中國最大的簡歷數(shù)據(jù)庫。據(jù)北京警方披露,巧達科技公司在未經授權的情況下,通過利用大量代理IP地址、偽造設備標識等技術手段,繞過某公司服務器防護策略,大量惡意竊取放在服務器上的用戶數(shù)據(jù)。在竊取過程中,由于傳輸數(shù)據(jù)量過大,還曾導致該公司的服務器數(shù)十次中斷服務,影響上千萬用戶正常訪問,給其帶來了嚴重的經濟損失。

以上只是部分公開報道的大數(shù)據(jù)被查公司事件,從中可以看出,國家以及各地相關部門對大數(shù)據(jù)行業(yè)的監(jiān)管力度在逐步加大,整頓態(tài)勢趨嚴。

 

 

公司被查,“爬蟲業(yè)務”成為導火線

隨著市場對于數(shù)據(jù)服務的需求逐漸增大,數(shù)據(jù)就成為了某些公司的主要盈利工具。但數(shù)據(jù)從何而來?

據(jù)中國互聯(lián)網絡信息中心(CNNIC)發(fā)布的第44次《中國互聯(lián)網絡發(fā)展狀況統(tǒng)計報告》顯示,截至2019年6月,我國網民規(guī)模達8.54億人,這些人無時無刻都在“生產”數(shù)據(jù),各個方面的數(shù)據(jù)不斷在匯集。正是有了這些數(shù)據(jù),讓某些“大數(shù)據(jù)公司”看到了商機。

互聯(lián)網平臺上的數(shù)據(jù)有些是公開的,也有非公開的,但只要通過網絡爬蟲技術,獲取這些數(shù)據(jù)并不難。而且,在這個競爭激烈的市場環(huán)境下,如果有人提供所需要數(shù)據(jù),不用就是“損失”。所以,供需方市場條件已經滿足的情況下,這條產業(yè)鏈逐漸形成,其中不凡有許多正規(guī)持牌金融機構、咨詢公司等也參與使用第三方數(shù)據(jù)公司通過各種渠道抓取的用戶數(shù)據(jù)。

網絡爬蟲技術成為第三方數(shù)據(jù)公司獲取網絡數(shù)據(jù)信息的基礎工具,而伴隨“爬蟲業(yè)務”而來便是數(shù)據(jù)竊取、泄露、濫用等問題。從這些被查大數(shù)據(jù)公司可以看出,大部分公司與爬蟲業(yè)務及違規(guī)抓取、販賣個人隱私數(shù)據(jù)、助力暴力催收等有關。

據(jù)了解,網絡爬蟲又稱為網頁蜘蛛或網絡機器人,是一種按照一定的規(guī)則,自動地抓取萬維網信息的程序或者腳本。網絡爬蟲技術并不難,而且爬蟲技術本身是中性的,關鍵在于是否合規(guī)使用。也正是數(shù)據(jù)獲取與使用的門檻較低,大量不具備基本從業(yè)素質、缺乏風險意識的企業(yè)參與到了這場大數(shù)據(jù)發(fā)展浪潮中,過度依賴“數(shù)據(jù)采集”進行無序競爭。

因為此次行業(yè)整頓的影響,目前部分依賴于“數(shù)據(jù)采集”的公司主動或被動地關停了爬蟲業(yè)務。而且,此番嚴查仍在繼續(xù),有些抱著僥幸心理繼續(xù)觸碰法律紅線的企業(yè),相信也不會逍遙太久。

 

 

大數(shù)據(jù)行業(yè)發(fā)展需及時“止痛”

大數(shù)據(jù)是一個新興行業(yè),具有良好的發(fā)展和應用前景,但它所存在的一些痛點問題正在阻礙其健康發(fā)展,相關部門的此番監(jiān)管行動無疑是在為大數(shù)據(jù)行業(yè)及時“止痛”。

目前,行業(yè)內除了被查的大數(shù)據(jù)公司,很多涉及數(shù)據(jù)業(yè)務的公司也存在或多或少的問題。比如,墨跡科技IPO被否,證監(jiān)會明確指出該公司關于經營資質、收益用戶數(shù)據(jù)、收入來源單一、關聯(lián)客戶等四大問題。另外,也還存在其他一些比較典型的行業(yè)痛點問題需要引起重視。

首先,技術應用的邊界問題被忽視。數(shù)據(jù)成為新的生產資料和無形資產,企業(yè)要想在大數(shù)據(jù)時代領先,需要多方合作獲取更多的數(shù)據(jù)。而部分大數(shù)據(jù)公司,尤其是創(chuàng)業(yè)公司,因為沒有原始數(shù)據(jù)的積累,也沒有可產生數(shù)據(jù)的業(yè)務或產品支撐,選擇通過購買或者運用相關技術竊取他人隱私信息,忽略技術應用邊界問題,碰觸法律紅線,甚至在各種變現(xiàn)的壓力下,不惜成為信息販子。

其次,數(shù)據(jù)歸屬權不明確,數(shù)據(jù)共享和交易工作推進受阻。數(shù)據(jù)應用過程中,涉及其所有權、隱私權等,其中所有權問題最為模糊。數(shù)據(jù)到底歸誰所有?是至今一直沒有明確答案的命題,這讓部分數(shù)據(jù)在使用過程中無法被界定是否構成侵權,容易出現(xiàn)數(shù)據(jù)濫用的情況。

數(shù)據(jù)共享可以加強企業(yè)間的聯(lián)合,可以加快數(shù)據(jù)與產業(yè)的融合,可以促進產業(yè)優(yōu)化升級。同時,如果交換數(shù)據(jù)權,數(shù)據(jù)整合會更加完善。目前,我國除了部分地區(qū)政府部門建立政府數(shù)據(jù)共享交換平臺,推動政府數(shù)據(jù)陸續(xù)得到有效應用外,各地所成立的大數(shù)據(jù)交易企業(yè)或平臺幾乎沒有太明顯的工作推進成效,其原因包括企業(yè)要保護商業(yè)機密不愿意交易自身數(shù)據(jù)、企業(yè)交易機制不健全、法律法規(guī)不完善等。

再次,數(shù)據(jù)安全保障工作意識薄弱,專業(yè)人才短缺。公民個人信息經常在網上被以白菜價格倒賣;多數(shù)企業(yè)數(shù)據(jù)中心安全防護措施薄弱,被惡意攻擊、內鬼泄露等問題大量存在。主要因為大家對個人用戶、密碼以及相關數(shù)據(jù)保護意識不足,企業(yè)對于數(shù)據(jù)安全的保障工作往往處于被動狀態(tài)。此外,我國大數(shù)據(jù)產業(yè)人才培養(yǎng)體系處于建立初期,在短期內專業(yè)人才供不應求,限制了大數(shù)據(jù)產業(yè)創(chuàng)新發(fā)展的成效。

寫在最后

解決行業(yè)發(fā)展痛點刻不容緩,但大數(shù)據(jù)行業(yè)的發(fā)展也不會因為部分公司被調查而潰不成軍。發(fā)展大數(shù)據(jù),最終目的是與各個行業(yè)深度融合,促進各行業(yè)各領域轉型升級,并建立良好的產業(yè)生態(tài)。這是一個需要慢慢探索和推進的過程,如果想要在這個風口上投機取巧,牟取暴利,最終只會害人害己。

合法合規(guī)的大數(shù)據(jù)企業(yè)一定是靠技術形成核心競爭力,隨時把握好發(fā)展契機,積極探索合規(guī)可行的商業(yè)模式,不斷成長和壯大自己。正如暢銷書《失控》作者凱文·凱利所言,大數(shù)據(jù)會締造大公司,十年、二十年之后,在全世界最大的公司就是有最多數(shù)據(jù)、最大數(shù)據(jù)的公司。將來誰在數(shù)據(jù)方面能勝出,誰有最大的數(shù)據(jù)公司,誰就是最大的勝者。(數(shù)據(jù)觀 陳近梅)

標簽: 大數(shù)據(jù)公司 大數(shù)據(jù)行業(yè)

版權申明:本站文章部分自網絡,如有侵權,請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉載文章言論不代表本站觀點!
本站所提供的圖片等素材,版權歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:AI人才稀缺:全面解讀數(shù)據(jù)科學家成長的4個階段

下一篇:80本值得一讀的最佳數(shù)據(jù)科學書籍(二)