用python“科学”预测下《哪吒》票房

2020-06-19 00:00:00 数据 电影 拟合 哪吒 票房

近几天,朋友圈和微博被《哪吒之魔童降世》刷屏了。不少看过的朋友都成为“自来水”,力荐此片。

而它的市场表现也很给力,上映首日即破亿,5天超10亿,目前已成为国产动画片高票房。

于是很多人开始猜测,终的票房会达到多少?一开始有人预测十几亿,后来普遍认为超20亿,到现在甚至有人给出了40亿的预测。

今天我尝试用“科学”一点的方法也来预测一下。如果终结果有幸言中,还望大家帮忙转发点赞支持一下。

事先说明,我还没有去看《哪吒》,所以在预测中并无个人偏好。对于纯数据分析来说,这是个好事,让我可以做一个没有感情的杀手分析师。

相关的代码、数据、原图已上传,获取方式见文末。(还有小彩蛋)

----

截至发稿时(8月2日)是《哪吒》上映第8天,实时票房15亿多,前7日票房14.68亿

一种粗糙的预测方式就是:找一找之前类似电影这个时间的票房是多少,按倍数乘一下

但这里有个问题,不同电影的票房走势是不一样的。以下是我们从猫眼票房上随手找的几部大片或类似电影,他们的票房走势:

注:零点首映场的数据被算在了首映前一天,这里我们做了个人工处理,把它合并到了首映日。并且没计算之前的电影数据。这是为了后面的预测分析做准备。

从图上可以看出,有的电影在上线后会有一小波增长,并且在之后的周末和假日都会向上波动,这通常是上映后口碑较好,吸引到更多观众并且排片增加的影片;而有的电影,则是上映即,之后一路下落,甚至没啥反弹,这其中不乏票房很高的大片,一般是阵容强大/题材吸引人/早期宣发做得好,但观影感受却低于预期的影片。

这里发现一个特别的案例:《白蛇:缘起》,它是少有的上映后票房持续呈上涨趋势的影片。然而却在春节档到来之际突然下线,票房戛然而止,实在可惜。

所以拿不同的电影来比较,结果也会差很多。比如常用来作对比的《大圣归来》,前7日票房累计为2.99亿,总票房9.56亿,按比例算一下《哪吒》票房就是近47亿;而拿《流浪地球》来作为参考,前7日票房累计为23.6亿,总票房46.55亿,结果就是28.9亿。若是再换做《白蛇》或者《爱情公寓》,那更是相去甚远。

所以我想到的方法是:通过对历史票房数据进行多项式曲线拟合,建立一个票房走势的“模型”,再把现有的票房套进模型里做计算

这里用到的是 numpypolyfitpoly1d 方法,根据已有数据,利用小二乘法得到拟合曲线的方程和系数。

np.poly1d(np.polyfit(x, y, n))

相关文章