【译】走进Two?Sigma,科学家帮你挑选股票
点击标题下「大数据文摘」可快捷关注
?欢迎熟悉外语(含各种“小语种”)的朋友,加入大数据文摘翻译志愿者团队,回复“翻译”和“志愿者”了解详情。
“金融与商业专栏”视角集中在金融及商业决策分析相关的大数据分析文摘,内容涵盖金融、信贷、风控、投资、理财、商业等领域。鼓励独家首发与观点原创,行业前沿理论分享,国外优秀文章翻译以及行业领袖采访演讲编译,力争刊出更多金融和商业领域相关精品文章。欢迎各位同行及对数据分析感兴趣的朋友加入,共同分享交流。
大数据文摘翻译作品
作者:BradleyHope
翻译:张翼
校对:刘依娜
欢迎个人转发朋友圈;其他机构或自媒体转载,务必后台留言,申请授权
在纽约SoHo区的办公室,偶尔能在走廊上碰到穿梭而过的机器人。在这里,几十个在各个领域——比如天体物理学,免疫学和语言学,拥有博士学位的科学家们,每天挤在办公室里,紧紧盯着电脑屏幕,看着几百上千亿美金在世界各地流动。
他们的目标,是帮助一个神秘的对冲基金公司,为其所管理的240亿美金找到一个好的投资项目。这些科学家们所在的Two Sigma 投资有限责任公司(Two Sigma Investments LLC),将所有机器编程,以便从各个渠道采集信息,比如新闻专线,公司收益报表,甚至天气公告和推特(Twitter)。
然后,科学家们开始编写交易算法。他们让挑选股票的过程基于收集到数据中的那些“信号”。
Two Sigma 公司是计算机化投资中的先锋之一。虽然那些科学家和工程师们没有雄厚的金融知识背景,但是他们试图利用大规模计算机处理能力,从新闻和数据中挖掘线索来预测证券价格。
“这个市场的秘密就是证券的价格是可以被预测的,”在普林斯顿大学执教的前苏联物理学家Alexander Migdal说,他写出的算法是基于大范围搜集到的数据,比如新闻。“不是100%准确,这是肯定的,但是它有别于其他算法,所预测的程度足以盈利。”
这种利用大数据来预测证券价格的算法是量化投资的一种,因为它的交易主要依赖于数学模型。但是它有别于传统的量化分析,因为传统的量化分析将电脑编程后,利用统计学关系来给证券定价,而很少触及现实生活中的信息。
Two Sigma 的科学家们旨在摒弃人工手动挑选股票,而是写出算法,用一种比人工更加快速有效的方法来获取生活中的资讯,用它来寻找模型,然后在股票,债券,期权,期货和货币购买中下达交易指令。
在 Two Sigma, 这套程序是这样的:
比如说在决定如何交易一支零售业巨头的股票时,Two Sigma 的科学家和数学家们会设计几十种有关这支股票的计算机交易模型。
一个模型将会自动跟踪分析员对于这个零售商的调研,这个过程就像是股票交易中的经纪人。另一模型将会在推特上寻找线索,比如说越来越多的消费者在推特上抱怨这个零售商,并将这一发现与另一个线索,例如数据显示越来越少的人光顾这家店面,结合在一起。
其他的模型将会做一些投资人基本都会做的分析,比如监测股价是否突破200天均线,或是公司经营长官们是否在买卖自己公司的股份。
每一个模型运行完成后都将产生交易建议,然后进入下一算法进行整合,这个算法会依据每一个模型的历史运作表现及其他影响因素进行权衡。紧接着,风险管理算法将会核对推荐的交易,以确保它不会过多得将公司曝光在股票或是板块上。最终,一个执行系统将会自动交易这支股票。
每一个模型都需要科学家们花费数周调试到完美。一旦程序编入电脑,这个模型将会在数秒甚至更短的时间里自动运行。
“绝大多数的投资经理的决策模式或多或少和他们十几年前相同:他们在用头脑来投资,”Two Sigma 联合创始人 David Siegel 说, 而他们公司建立了人工智能系统,它“代表了投资管理的未来模式。”
这个公司管理大大小小的投资项目,从几天的,数周的,到长达几个月的。
投资竞争
像Siegel这样的投资公司正时不时地和华尔街叫板,其中一些甚至是小规模的创业公司。一些传统的量化分析公司也在探索这方面的战略。据知情人透露,管理着250亿美元的对冲基金公司Renaissance Technologies LLC,和360亿美元的D.E. Shaw & Co.,都在探索类似的运作方式。两个公司都拒绝对此文发表言论。
这些公司从广泛意义上说都是属于利用“大数据”来盈利的。这是世界上充斥着关于各种事物的资讯,而这些公司所做的就是“数据挖掘”。
“以现今计算机的运算能力,加上大规模的数据得以保存,我们可以轻松完成许多以前不可能做到的事情,”纽约大学金融数学项目主任Petter Kolm说。这个项目向例如Two Sigma一样的数据挖掘公司输出了毕业生。
“如今我们可以很迅速地解决问题,” 他说,“十年前,这要花费数天到数周。”
跟随这股潮流的公司往往保持神秘,外界不清楚到底有多少公司参与或是多少金钱介入。这些公司的员工和研究他们的学者说,他们的演算法战略以及投入的人手根据交易不同而改变。
有一些人担心这样的运作方式会将投资人陷入风险之中。这些批评声中包含了 Ray Dalio, 他是世界上最大的对冲基金公司 Bridgewater Associates LP 的创始人。Bridgewater 的发言人说,虽然不是针对Two Sigma, 但Dalio认为某些算法将不实的关系列入考量,以至于开展一些有风险的交易。
来自南加州大学的教授Davis,和几个相关机构在2014年4月的一份调查报告中警告说,有这样一个趋势,一些对冲基金公司和经理“过度拟合”了一些关联性,以至于一些随机性的关联事件被错误地解读成了强烈的相关性。
伪数学(Pseudo-math)
他们总结说“伪数学” 和“金融诈骗”在华尔街肆意猖獗。而这些,他们写道“极大程度上解释了为什么那么多精于计算和系统建设的对冲基金公司没有达到管理者的预期。”
有一些从事数据挖掘的人员并没有成功地把这发展成一个行业。Flyberry CapitalLLC是波士顿一家管理着200万美金的对冲基金公司。他们试着对于新闻报道做出第一时间的反应,比如日本沿岸的地震。这家公司的创始人说,他的目的在于预测投资人如何应对突发事件,比如非农就业数据的改变,或是国家能源供给的改变。然而由于不够吸引投资人,某发言人说,这家公司在今年初关门。
在现今这个紧张,处处关联的世界上,仅靠人们自己来判断一个投资项目是不切实际的,TwoSigma 因而将他们公司的运作描述成安全的投资。“你愿意让医生仅凭着胆量来动手术吗?” Siegel问道,“至少我不愿意。我希望医生分析诊断病情,然后用科学的步骤完成治疗。这和投资管理有异曲同工之处。”
现年53岁的Siegel,和45岁的数学家John Overdeck在2001年成立了Two Sigma公司。在2014年,这个公司被数据搜索公司HedgeFund Intelligence在305个美国最大对冲基金公司中排名第22位。
去年,Two Sigma 给它的“macro”基金募集了33亿美元巨资,是金融危机之后募集到的规模最大的对冲基金之一。另一个60亿美元Compass基金,专注于投资期货和货币,在2014年的投资回报率是25% ,公司的网站上描述了他们的投资人,包括“世界上最大的企业,公共退休基金,主权基金,研究所,教育基金,医院及医疗体系,还有基金会。”
Two Sigma 所管理的资金都采用大数据预测法进行投资。他们的数据来源是新闻公告,国家气象服务报告,市场数据,推特,以及人们的手机——那些同意被研究零售趋势的公司追踪的信息。
那些写计算代码的员工往往有物理,化学,机械研究等领域的专业背景,他们都是能够熟练解析大规模数据的科学家。超过100多位员工有博士学位。
30年前,挑选投资项目是一项简单的工作,因为在当时,世界还没有像现在这样联系紧密,Siegel说。“那么问题来了:到底哪些因素影响苹果公司的股价?答案是:几乎所有的事情。每一件小事都有或多或少的影响。小到每一次销售,大到每一个震荡。”
前苏联物理学家Migdal先生,他离开学术界后创立了高频交易公司,运用计算机快速地在市场上进行交易,从几百上千次的交易中赚取微薄的利润。即便如此,他相信利润空间正在递减。他的新公司Migdal Research LLC从事与依据大数据的长期预测。
现年69岁的Migdal先生,在数据形成规模之前就对其进行研究。“很多事情都是积少成多的结果,” 他说,“在金融界,不是每天都有惊天动地的戏剧性事件发生。更普遍的情况是,每一个大事件都开始于细微之处的变化,这种变化慢慢形成了趋势,而这并不是人们在最初就能一眼看到的。”
同样的,来自纽约大学的Kolm说,计算机不是无所不知的,“对于绝大多数的金融模型来说,预测的可靠性非常非常低,” 甚至达不到气象预报的准确度。
评论家指出,其中一个风险就是可能会重演2007年的“Quant Meltdown”事件,量化模型无法正确地跟踪以及预测,很多公司损失惨重。90年代末期,Long-Term Capital Management L.P.(LTCM)公司的瓦解也是活生生的例子。这个公司的董事会名单上有两位诺贝尔获奖者。LTCM运用数学分析来寻找套利机会,1998年俄罗斯债务违约,市场动荡,LTCM陷入破产边缘,事件的影响波及整个金融界。
Bridgewater的创始人表示了担忧,说“数据挖掘”是基于研究数据,但是需要建立在“深刻地理解经济活动推动市场这一因果关系。” 换句话说,人们先有假设,然后用计算机来测试这些假设,而不是让计算机来主导整个过程。
最近,Two Sigma承受了巨大的损失。据知情人透露,今年1月,瑞士国家银行(SNB)宣布取消1:1.20的欧元/瑞郎汇率下限,致使公司投资某个基金在1月份损失了12%,这支基金在2月回升8%。然而,Two Sigma一直像投资者兜售自己稳定的投资回报率。Spectrum是公司最早成立的基金之一,自2004年成立以来,一直保持着9.49%的年回报率。
来自机器人的灵感
走入Two Sigma的办公室,会发现这个公司有别于传统的华尔街。在一间名叫“黑客实验室”的房间里,一名研究员用3D打印机打出了一个符合人体工学的键盘,另一位正在教机器人打空气曲棍球。偶尔还能看见实验室里的机器人在走廊上玩沙狐球。
Siegel拥有计算机科学博士学位,他在麻省理工大学人工智能实验室里学习(CSAIL)。他是机器人学的爱好者,他相信“黑客实验室”能够鼓励员工从不同的角度来研究投资。他称投资人为“非计算机交易员”。
为了梳理每天24小时的数据,Two Sigma有超过100万亿次浮点运算能力,也就是每秒超过100万亿次运算,以及超过11PB的储存,相当于全美学术博物馆现存数据的5倍。
Two Sigman 紧守公司战略,但在最近,公司瞄准雇佣来自Fackbook, Twitter等公司的工程师。新聘用的成员戴上虚拟现实耳机装置,声音把他们带到了狂热的时代广场,又从迪拜建筑上空飞过。“接收到很多信息,对吗”,一个男性声音响起,“购物,时尚,交通。”
假设有这么一天,这个声音继续说道,俄罗斯的堪察加半岛火山爆发登上报纸头条,会怎么样?如果灰尘导致航班延误,这对油价有什么影响?“这就是我们Two Sigma公司致力于研究的工作,” 这个声音说道,“找寻他们之间合乎情理的关联。”
虽然Two Sigma已经成长为雇佣了大约750名员工的公司,它仍在扩张,需要100名工程师的加入——Two Sigma 需要大量的脑力来面度持续不断的挑战。当物理学家在学术领域寻找亘古不变的定律时,写交易算法的科学家们试图从中数据中寻找规律,然而这些规律一旦被他人发现,算法的价值就没有了。
收获的关键更多在于这种大胆尝试的公司文化是否可以不断地创造价值,而不是去发现“财富定式,” 《华尔街物理学》作者James Weatheral说道,他长期研究Two Sigma 这样的公司。
至于风险,他说:“如果每个人都用相同的模型,你预测出来的将是不合常理的市场表现。”
——Rob Copeland对此文亦有贡献。
【译者简介】
有意联系译者,请给“大数据文摘”后台留言,附自我介绍及微信ID,谢谢!
张翼,美国本科留学第五年,SyracuseUniversity 公共关系,金融专业大四在读。对于媒体分析,金融,资产证券化等领域有兴趣。在校参与利用大数据分析媒体影响力,衡量公关活动对于社交网络上的流行语,潮流,和对品牌的态度变化。希望大家给我提供相关实习,也期待与更多对传媒和金融领域有见解的朋友一起交流。
Yina,法国ICN南锡高商研究生毕业,在上海从事奢侈品市场调查,关注大数据、自媒体,喜欢当代艺术展、话剧的非文艺青年。
数据分析, 数据挖掘
风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处。如若内容有涉嫌抄袭侵权/违法违规/事实不符,请点击 举报 进行投诉反馈!