【牛!】物理学博士教你怎样分析微博数据,怎样涨粉
作者:同人于野 (美国科罗拉多大学物理系研究员,物理学家)
微博:@guokr.com
摘自:果壳(guokr.com)
网上已经有太多关于怎么增加微博粉丝数,以及怎样让我们发的微博获得更多转发的建议了。我们并不知道这些建议是否有效,因为它们大都是建立在个人感觉上,而缺乏真正有说服力的证据。实际上微博是一个非常适合进行数据分析的东西,所以想谈微博心得,你得用数据说话。
一个普通用户的微博数据
从 2012 年 8 月 24 日开始,我像个自恋者一样,每天都看看自己的粉丝数涨了多少——不但看,而且还顺手把数字记录下来。这样坚持到写作本文的时候一共过去了 86 天。这个数据的可贵之处并不在于它是人工测量的,而在于它是独一无二的:由于不管是新浪微博还是 Twitter 都不记录,或者至少是不提供“关注”这个动作的发生时间。现有的任何微博相关数据研究也都没有精确的粉丝数随时间变化记录。如果能得到更多像这样的数据,我们完全可以写一篇像本文后面要介绍的那两篇一样重要的论文。
下面这张图就是我在这86天中粉丝的增长情况。上图是总的粉丝数,下图是每天增加的粉丝数。
我曾经设想,一个人粉丝的增加应该是指数增长的:关注你的人越多,你的影响力就越大,那么就会使得有更多人来关注你。这样的微分方程是 df/dt = cf,所以 f = ect 。然而实际上的增长却大致是线性的,df/dt=常数!除了几次突然爆发之外,我大概每天增加 10 个粉丝。图中用数字标记了 4 个突然增长事件,其中 9 月 15 日 和 10 月 22 日这两次比较大。不算突发事件,我的增长速度相当稳定:图中两段近似直线中,第一段平均每天增加粉丝 9.2 个,第二段平均每天 10.5 个,这还包括了(2)和(3)两次小跳跃。如果真有指数增长,那么或者发生在账户开通的初期,或者要等到账户已经相当有知名度之后,或者本身是个极大尺度的现象难以在这么短的时间内表现。
所以如果你认为增加粉丝的最好办法是多发好的微博,结果可能会让你失望。事实是只有出现爆发事件才能让你的粉丝数上个台阶 。在图中标记的四个爆发事件中:
(1)是我在果壳网发表了 近亲不如远邻:最关键的人脉是不熟的朋友 。我 9 月 15 日的相关微博被转发超过一千次,而更重要的是 @果壳网(粉丝 60 万)在微博对此文进行了介绍,结果是一天之内增长了 300 多个粉丝。
(2)这个小波动发生在 9 月 23 日,而我从 9 月 16 日到 24 日间一条微博都没发过。我不知道这是什么原因,很可能是(1)的一个余波。
(3)是我在博客发了《一个关于转世的流行病学研究》一文。从粉丝的增长情况来看这篇文章的影响力不大。此后在《上海书评》发表《四万年来谁著史》,仍然没有带来多少粉丝。
(4)是 @cnsns (粉丝3万多)在微博对我进行了 推荐 ,而这条推荐又被 @经纬张颖 (粉丝342万)转发,导致粉丝数在 33 分钟内增加了 321 个,两天增加了 800 多。
我在三个月内发了大概上百条微博。发微博对当天增加粉丝有一定的影响,但是在绝大多数情况下不会带来什么爆发。由此可见增加微博粉丝数的最好办根本不是发微博,发微博还不如少发几条微博写篇正经文章。当然最有效的办法也不是写文章,而是被大V推荐。这里没有记录到的是在我微博账号建立的初期也曾有过一次爆发,是媒体人土摩托(粉丝14万)和松鼠科学会成员等科学作者的推荐导致。
来自名人的大数据
没有多少人会像我一样每天记录自己的粉丝数,这使得大规模研究微博账户的成长过程非常困难。但是卡耐基梅隆大学和微软的研究人员仍然 想了一个没有办法的办法 。Twitter跟新浪微博一样,虽然不记录每个“关注动作”的发生时间,但它把你所有的粉丝按照关注你的先后顺序排列。同时,Twitter还提供每个账号的首次注册时间。这样对其中任何一个粉丝,研究人员找到他的注册时间,并且找到在他之前关注你的所有粉丝的注册时间,然后把所有这些时间中最晚的那个,就当成他这次关注发生的时间。可以想象这是一个非常不精确的估计,但只要数据量足够大,仍然是可以接受的。
这篇文章发现, 哪怕对于具有相当量级的名人来说 ,“被推荐”仍然是最重要的增长粉丝办法。下面这张图表现了技术博客 Anil Dash,娱乐界女星 Kim Kardashian 和纽约时报的 Twitter 账户被关注的时间曲线。他们粉丝的增长充满了突变,而其中最大的几次突变,正是因为 Twitter 对他们进行了系统推荐。
图中事件(1)是 Twitter 引入了一个系统推荐名单,而纽约时报在这张名单上。我们看到这个名单一出来,纽约时报每天增加的粉丝数立即提升了一个层次。到 2009 年 4 月,Kardashian也被加入到这份名单之中,于是她的粉丝数也开始暴涨。没进推荐名单之前,Dash的粉丝数每天增加 50 个,等到十月份被加进推荐名单之后,他的粉丝数每天增加 2500 个!一个有意思的现象是 Dash 进来之后纽约时报和 Kardashian 的成长开始放缓,研究者也不确定这是怎么回事。根据后面的变化推断,对纽约时报来说,很可能是因为 Twitter 在十月份扩大了推荐名单上的人数,使得它的重要性被稀释。而对 Kardashian 来说,则可能是她被从推荐名单上移除了。
事件(2)是 Twitter 改变了推荐方式,把推荐账户分类,让用户自己根据兴趣选择。这个变化对 Dash 和纽约时报带来了一个打击,二者每天增加粉丝数都显著减少。但 Kardashian 因为早已不在推荐名单上,她的成长没有受到影响,仍然逐步增加,甚至有点指数增长的意思。
事件(3)是 Twitter 再次改变推荐方式,变成根据每个用户的兴趣来定制推荐。这一次纽约时报和 Kardashian 都受益了,而 Dash 受到的影响不大,仍然每天增加200左右的粉丝。
仅从这张图而论,系统推荐的作用实在是太大了。技术博客 Dash 和纽约时报的粉丝层长几乎完全由系统决定,只有像 Kardashian 这样的女明星才能跑出一段不顾大盘的强势增长—— 据说 请她发一条广告微博的价格是一万美元。那这些明星们的增长靠的又是什么?得看下面这张图:
像 Oprah Winfrey 这样的大佬一在 Twitter 现身(事件1),马上就有了众多粉丝,但是最初的高潮之后加粉的速度却越来越放缓,变成跟 Ashton Kutcher 差不多的趋势。真正能做到加粉速度越来越快,好像指数增长一样的是 Lady Gaga 和 Justin Bieber 这样的偶像派!他们的粉丝是怎么来的?是因为他们发了高质量微博吗?当然不是。
这两人的粉丝成长,是他们在现实生活中事业成长的反应 。Justin Bieber 在2009年初还是个无名之辈,Lady Gaga 2010 年后才大红大紫。我们看 Lady Gaga 的几个关键事件,(2)是她得了 MTV 的音乐奖,(3)是她参演了艾美奖,(4)是她出了新MV“Telephone”。图中事件(5)很有意思,是明星 Soulja Boy 突然删除自己原有的Twitter账号又建了个新的,粉丝们忙着关注他的新账号,一时之间产生了大量的关注动作,以至于我们图上这几位明星的 relative popularity 都被抢了风头。
这样看来非常明显,哪怕是对名人而言,也是系统推荐的力量最强,其次则是看你在现实世界干了什么。明星们微博粉丝的变化很可能与他们发什么微博关系不大。在新浪微博姚晨的粉丝最多(现在已经是谢娜了),但姚晨却未必是中国最火的女明星,据此可以推测是新浪的推荐帮了大忙。
而对于我们普通人来说,既没机会被系统看上,也没机会在真实世界兴风作浪,想要涨粉丝也许只能靠发几条有意思的微博。我们期待这些微博能被广泛转发,因为只有这样才能被更多人看到,引来新粉丝。但是怎样获得更多转发?更重要的是,转发真有用么?
什么样的微博转发量惊人
Palo Alto Research Center 的几位研究者 专门研究 了Twitter上的转发。一条微博被转发的平均次数应该跟两个因素有关:微博本身的内容,以及发帖者的粉丝数。粉丝数容易测量,可是微博内容好坏很难测量,这项研究只能采用最简单的办法。
一个办法是看微博中是否包含网址链接(URL)。包含 URL 的微博至少言之有物,总比发条在哪吃饭的状态有可读性。这个研究总共统计了 7400 万条微博(对 Twitter 来说这叫 tweets),统计发现全部其中 21.1% 包含 URL,而那些纯转发的微博中则有 28.4% 含URL。这个结果似乎不怎么明显,但此文引用的另一项研究的两个数字则分别是 18.96% 和 56.69%。不论如何,介绍一个从别处看到的信息的确能够增加微博的转发几率。
获得更多转发的另一个办法是参与话题,也就我们经常看到的两个“# ”,这样别人只要点击这段话就能找到所有写了这段话的微博。统计表明全部 tweet 中的 10.1% 含有话题,而那些转发的tweet含话题的比例则是 20.8%。
这两个数据都平淡无奇,完全符合我们的预期。我们真正想发的是那种一出来就被迅速广为传播,乃至一层一层传出去引发爆炸式增长的微博。但正如我以前曾经在 别用“常识”理解复杂世界 中介绍过的那样,引发这种“twitter瀑布”具有极大的偶然性,就算是粉丝众多的人也未必能经常做到。
这项研究并没有明确指出,但是据我观察更为关键的一个事实是,偶尔发几条被广为转发的微博并不能给你显著增加多少粉丝。@Yaoyao521 今年四月发了一条关于出租车司机不收盲人车费的 微博 ,这条微博讲了一个很好的正能量故事,被转发次数超过一万三千,甚至还被媒体报道。作者目前为止一共发过五千多条微博,可是她的粉丝仍然只有 3608 个。像这样的例子并不罕见,很多情况下并不多——而且我一次都没有因为这个原因关注他们。换句话说,除非你能持续不断地发高质量微博,证明自己是靠能力而不是运气,粉丝才会因转发而增加。
这种人有多少?肯定非常少。下面这张图是前面提到的研究统计出来的转发数跟粉丝数的关系。二者几乎就是个线性关系!一个有 5000 粉丝的人和一个有 1000 粉丝的人,微博平均被转发次数差不多也是五倍关系。这说明平均而言,粉丝多的人发的微博质量并不比粉丝少的人更高,他们仅仅因为粉丝多而获得更多转发!这个统计还表明平均每一千粉丝带来的转发数是每条微博 1.5 次,如果你的成绩比这个好,那么你属于水平比较高的。
有人认为多发微博可以涨粉丝,有人认为微博贵精不贵多,而这项研究告诉我们的就是你的转发几率跟你发微数量根本没关系。下图是被转发几率与发微总数的关系:
如图所示,不管你已经发过 500 条还是 5000 条,你下一条微博被转发的几率,平均而言,都是差不多一次。而发微频率高的人累积的条数也多,这说明 发微薄频率完全不影响被转发几率 ,因此也就不影响通过被转发而涨粉丝。
结论
总而言之,逆天靠系统,名人靠事件,普通人没事件只能靠推荐,没人推荐则靠转发,而转发靠内容。以上获得粉丝手段的有效性是直线下降的,后面的远远不如前面。而最没用的,就是你的发微数量。这些性质说明我们之所以会关注某个人物,在大多数情况下是因为对这个人本身的关注,而绝不只是想看他发些什么。
本文只讨论了个人综合微博,以上所有分析未必适用于各种专业微博,比如专门搜集笑话的微博。也许只发某一方面内容的账号更容易获得粉丝,因为别人对你的内容有固定的期待。这种账号对读者来说虽然很重要,对写的人来说却未必有多大乐趣,相当于是微博世界里的NPC(非玩家控制角色)。
总而言之,想涨粉丝?功夫在微博之外。既然如此,索性别计较什么粉丝数了。也许我们写微博的真正乐趣不是为了吸引粉丝,而是图个说话痛快!
作者注: 本文采用的两项研究都是针对Twitter的,我并不知道这些研究是否符合中国国情。一个有意思的现象是新浪微博的数量级似乎比Twitter大得多。在Twitter有5000粉丝已经很不错了,而在新浪微博一万都未必是个体面的数字。《别用“常识”理解复杂世界》中介绍的那个研究,两个月内7400万条tweets中有几十条被转发超过千次,而转发次数达到万次以上的只有一两条 -- 在新浪微博,转发万次根本不显眼。所以再次呼吁有识之士拿国产微博多做研究。另外,我的微博账号是 @GK同人于野,欢迎关注!
数据分析, 数据挖掘
风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处。如若内容有涉嫌抄袭侵权/违法违规/事实不符,请点击 举报 进行投诉反馈!