中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

《流浪地球》票房:預(yù)測(cè)10億卻飚50億 ,大數(shù)據(jù)預(yù)測(cè)為什么這么難

2019-02-27    來源:raincent

容器云強(qiáng)勢(shì)上線!快速搭建集群,上萬Linux鏡像隨意使用

 

圖片來自網(wǎng)絡(luò)

截止到今天,中國(guó)首部重工業(yè)科幻電影《流浪地球》票房已經(jīng)突破 41 億元,很可能會(huì)最終突破 50 億票房。驚人的票房數(shù)據(jù)讓眾多票房預(yù)測(cè)機(jī)構(gòu)大跌眼鏡。根據(jù)我們的統(tǒng)計(jì),在春節(jié)檔之前,不同預(yù)測(cè)機(jī)構(gòu)給《流浪地球》的票房預(yù)測(cè)普遍在 10 億左右,與本片的實(shí)際票房差距在五倍左右。

與此同時(shí),在春節(jié)檔其它電影的票房預(yù)測(cè)上,預(yù)測(cè)機(jī)構(gòu)也普遍呈現(xiàn)了非常大的偏差,甚至在電影第一天的票房數(shù)據(jù)之后,貓眼APP 給出的《喜劇之王》的預(yù)測(cè)值仍然達(dá)到了 24.96 億,而實(shí)際上,《喜劇之王》的票房之后就大幅縮水,最終的票房很可能只停留在 6 億左右。

 

 

票房分析可以說是大數(shù)據(jù)分析一個(gè)非常典型的應(yīng)用了,具有數(shù)據(jù)來源多(歷史票房數(shù)據(jù)、社交媒體互動(dòng)、受眾反饋等)、數(shù)據(jù)量大、影響因子多(用戶評(píng)價(jià)、宣傳流量、預(yù)售量、檔期、題材、流量明星)等等特點(diǎn),可是真正到實(shí)踐之中仍然不盡如人意。那么,為什么數(shù)據(jù)預(yù)測(cè)這么難呢?怎么來提升數(shù)據(jù)預(yù)測(cè)的準(zhǔn)確性呢?

一、大數(shù)據(jù)來進(jìn)行票房預(yù)測(cè)的三種思路

Datahunter 資深數(shù)據(jù)分析師介紹稱,目前針對(duì)電影票房的預(yù)測(cè)主要有以下三種思路:

第一種思路可以形象的理解為“照貓畫虎”,其原理在于:目前市場(chǎng)上已經(jīng)上映了大量的影片,并積累了海量的票房變動(dòng)數(shù)據(jù),深度神經(jīng)網(wǎng)絡(luò)模型可以依據(jù)某一部影片的大量用戶行為數(shù)據(jù),在定檔影片上映前一個(gè)月就可以給出該片的首日票房預(yù)測(cè);同時(shí),系統(tǒng)自動(dòng)篩選出與之最相似的電影,描繪出待映電影的未來票房走勢(shì)圖,進(jìn)而預(yù)測(cè)出這部影片在上映期間的每日票房以及最終的總票房。谷歌所采用的預(yù)測(cè)模型只選取了三種維度:電影預(yù)告片的搜索量、同系列電影前幾部的票房表現(xiàn)、檔期的季節(jié)性特征,最終獲得94%的預(yù)測(cè)準(zhǔn)確率。

 

 

谷歌建立的票房預(yù)測(cè)線性回歸模型

這種方式的優(yōu)點(diǎn)在于簡(jiǎn)單直接,更接近傳統(tǒng)大數(shù)據(jù)分析“只反映趨勢(shì),不深究因果”的理念,上映時(shí)間越長(zhǎng),其預(yù)測(cè)的數(shù)據(jù)就越為精準(zhǔn),往往適用于貓眼等掌握了大量票房數(shù)據(jù)的企業(yè)。但缺點(diǎn)在于,其無法將電影上映過程中眾多的復(fù)雜因素考慮進(jìn)來,所以經(jīng)常會(huì)出現(xiàn)預(yù)測(cè)波動(dòng)大、與實(shí)際偏離值較高等缺陷。

第二種思路則較為復(fù)雜,而且會(huì)將更多的因子納入到考量因素中來。其先根據(jù)歷史票房變化預(yù)測(cè)出某一個(gè)檔期的總票房,然后根據(jù)社交媒體討論數(shù)量、不同導(dǎo)演與演員的歷史電影質(zhì)量、點(diǎn)映用戶的評(píng)價(jià)、票房情況、SEO情況等預(yù)測(cè)出各電影票房占比,之后綜合預(yù)測(cè)出各電影的實(shí)際票房。這種方式優(yōu)點(diǎn)在于更多的將“電影評(píng)價(jià)”這一個(gè)重要因子納入到考量范圍內(nèi),通過電影導(dǎo)演表現(xiàn)、上映前反饋等等因素來判斷出電影的流行趨勢(shì),因此預(yù)測(cè)精準(zhǔn)性方面有更好的效果。

第三種思路則綜合了大數(shù)據(jù)分析與人工決策,即先使用大數(shù)據(jù)分析來對(duì)于影片的票房進(jìn)行一個(gè)事先的預(yù)測(cè),并輸出可視化的數(shù)據(jù)圖表。與此同時(shí),專家會(huì)對(duì)具體的電影進(jìn)行分析,找出其潛在的爆點(diǎn)或是隱患,并評(píng)估其可能帶來的影響,并以加權(quán)的方式納入到模型之中進(jìn)行修正。這種方式在預(yù)測(cè)爆品方面有更好的表現(xiàn),也是 Datahunter 優(yōu)先推薦的方式,這種方式我們?cè)谏院髸?huì)繼續(xù)講到。

二、票房預(yù)測(cè)為什么這么難?

盡管有著大量的數(shù)據(jù)以及先進(jìn)的工具,但是票房預(yù)測(cè)仍然沒有達(dá)到讓人滿意的精準(zhǔn)率,這就要像金融行業(yè)中經(jīng)常談到的“黑天鵝”概念一樣,非常難以預(yù)測(cè)、且不尋常的事件經(jīng)常會(huì)發(fā)生,而且還會(huì)引起連鎖負(fù)面反應(yīng)甚至顛覆。體現(xiàn)在大數(shù)據(jù)分析與預(yù)測(cè)場(chǎng)景中,只要某個(gè)隱性但關(guān)鍵的因素沒有沒納入到模型中,將可能使預(yù)測(cè)與事實(shí)產(chǎn)生重大偏差。

這也是大數(shù)據(jù)分析的難點(diǎn)所在:事物變化的影響因素非常多,幾乎不可能窮盡,誰知道哪一個(gè)因素將會(huì)產(chǎn)生連鎖式的反應(yīng)?而且,由于很多大數(shù)據(jù)分析工具并不考慮因果性,只考慮相關(guān)性,經(jīng)常會(huì)帶來“虛假相關(guān)”的問題,也就是無法對(duì)于數(shù)據(jù)變化的真正原因進(jìn)行歸因。在大多數(shù)場(chǎng)景下,這樣的預(yù)測(cè)并沒有什么問題,但是在特定的場(chǎng)景下,偏離預(yù)測(cè)的情況仍有可能會(huì)發(fā)生。

更加不可控制的則是不成熟的市場(chǎng)環(huán)境,以及潛在的風(fēng)險(xiǎn)因素,比如影片檔期選擇、宣發(fā)策略的一招失誤,就可能導(dǎo)致整個(gè)影片的票房成幾倍的誤差。而某個(gè)關(guān)鍵演員的負(fù)面新聞也同樣會(huì)帶來不可預(yù)期的影響,例如吳秀波的丑聞導(dǎo)致《情圣2》的撤檔,范冰冰事件則直接導(dǎo)致《大轟炸》放棄國(guó)內(nèi)上映,賠的血本無歸。

如果將具體電影代入到預(yù)測(cè)模型中,我們將很容易發(fā)現(xiàn)預(yù)測(cè)的難度:如果使用谷歌預(yù)測(cè)模型來預(yù)測(cè)《流浪地球》,只有檔期的季節(jié)性特征是利于其票房發(fā)揮的,其不僅電影預(yù)告片的搜索量不及同檔期競(jìng)爭(zhēng)電影,而且同系列的科幻電影幾乎沒有市場(chǎng)表現(xiàn),無怪乎得到眾多預(yù)測(cè)機(jī)構(gòu)的看衰。這樣的例子并不少,其突出的特點(diǎn)就是口碑的大幅引爆,比如《瘋狂動(dòng)物城》、《白蛇傳》、《紅海行動(dòng)》乃至票房榜首《戰(zhàn)狼》都屬于這個(gè)類型。

三、數(shù)據(jù)預(yù)測(cè)準(zhǔn)確率如何改善?

盡管電影票房預(yù)測(cè)看似困難重重,但是仍舊可以通過不同的方式進(jìn)行改善。在前面我們提到了大數(shù)據(jù)分析與人工決策相結(jié)合的方式,其核心原理就是利用人工思維的主觀能動(dòng)性與創(chuàng)造性,發(fā)掘電影票房中潛在、但關(guān)鍵的影響因子,最終來得出結(jié)論。而這一影響因子是不斷發(fā)生變化的,幾年之前,這一關(guān)鍵因子往往體現(xiàn)在 IP、流量明星中,現(xiàn)在,口碑、開創(chuàng)性對(duì)于票房會(huì)帶來更大的影響。

有些人會(huì)問,電影尚未上映,口碑怎么來進(jìn)行判斷呢?其實(shí),這往往是有跡可循的,其數(shù)據(jù)可能來源于電影的提前點(diǎn)映評(píng)價(jià)、預(yù)告片、拍攝周期等等因素。例如,在上映之前,《流浪地球》的點(diǎn)映就得到了觀眾的超高評(píng)價(jià),而《愛情公寓》大電影還沒上映我們就基本可以判斷是爛片。當(dāng)然,這些都是大數(shù)據(jù)系統(tǒng)無法完全告訴我們的,需要專家進(jìn)行評(píng)判。

要評(píng)價(jià)電影對(duì)于觀眾的吸引力,還可以采取 LDA 來進(jìn)行分析,LDA 是一種非監(jiān)督機(jī)器學(xué)習(xí)技術(shù),可以用來識(shí)別大規(guī)模文檔集(document collection)或語料庫(corpus)中潛藏的主題信息。下面是不同機(jī)構(gòu)通過 LDA 對(duì)《流浪地球》進(jìn)行的詞云圖分析,可以看出《流浪地球》的科幻、特效等核心詞匯很好的切中了當(dāng)前觀眾的“痛點(diǎn)”,完全可以在預(yù)測(cè)中給出更高的評(píng)判。

 

 

 

 

四、數(shù)據(jù)分析的其它應(yīng)用場(chǎng)景

除了票房之外,其它應(yīng)用場(chǎng)景可以利用大數(shù)據(jù)分析+人工決策的方式進(jìn)行分析么,答案是肯定的。目前 Datahunter 正在搭建 Data Analytics 數(shù)據(jù)分析平臺(tái)+Data Wisdom數(shù)據(jù)智能決策的人工智能決策輔助平臺(tái),這套系統(tǒng)并沒有激進(jìn)的將所有決策任務(wù)都交給機(jī)器系統(tǒng),而是將數(shù)據(jù)挖掘結(jié)果輸出給專家,并結(jié)合專家判斷進(jìn)行調(diào)整,能夠更好的預(yù)防“黑天鵝”事件的發(fā)生。

例如,在銷售數(shù)據(jù)預(yù)測(cè)時(shí),除了可以根據(jù)歷史銷售數(shù)據(jù)、人口密度、消費(fèi)水平、消費(fèi)習(xí)慣、商圈口碑等數(shù)據(jù)進(jìn)行深度數(shù)據(jù)挖掘之外,管理者或是專家還會(huì)根據(jù)帕努單那納入其它的影響因子(例如某項(xiàng)活動(dòng)的舉行、補(bǔ)貼政策的退出等等),根據(jù)結(jié)果進(jìn)行相應(yīng)的資源調(diào)配以及銷售額調(diào)控措施,讓銷售更富精準(zhǔn)性。

標(biāo)簽: seo 大數(shù)據(jù) 大數(shù)據(jù)分析 大數(shù)據(jù)分析工具 大數(shù)據(jù)系統(tǒng) 谷歌 金融 媒體 數(shù)據(jù)分析 數(shù)據(jù)預(yù)測(cè) 搜索 網(wǎng)絡(luò)

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點(diǎn)!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請(qǐng)與原作者聯(lián)系。

上一篇:Gartner:2019年十大戰(zhàn)略技術(shù)趨勢(shì)

下一篇:我們常常意識(shí)不到問題的存在,直到有人解決了這些問題