Kensho和AlphaSense是怎样炼成的
2017/3/21 文因互联

    

     前言——工业精神

     工业革命既不是棉花时代,也不是蒸汽时代,而是进步的时代。

     18世纪60年代,工业革命首先从英国的棉纺织业开始,然后传播到采矿、冶铁、交通运输等行业。从飞梭和珍妮纺纱机到蒸汽机和内燃机,无数凝结着人类智慧的技术发明开启了这浩浩荡荡的近代五次工业革命。

     蒸汽机的发明人瓦特曾以第三人称写了一本自传,他在书中这样写道:“他的脑海中萦绕着如何制造既便宜又优良的发动机。” 除了功能和美观之外,这种对经济价值的探求代表了一千年来欧洲技术理性的发展顶峰。

     在技术急速引领着社会变革的时代,无数先锋人物被某种“诱发因素”所吸引,这一诱发因素不仅仅是技术突破,使其如此强有力的原因还在于低廉的价格。这种因经济价值而产生的“诱发因素”象征着一种新的潜力,能够点燃这群机敏而坚毅的先锋人物在技术和商业的想象力。换言之,诱发因索清楚地显示出,基于相关创新的企业将在成本上富有竞争力[1]。

     金融与技术创新

     技术革命每隔40年至60年爆发一次,它所带来的转型过程影响到社会的各个方面。而在每一次的技术革命中,金融资本都是新技术革命带来的产品和服务的最有意愿和最大胆的客户,它时刻为加快交易速度和扩大经营领域准备着,同时以一种间接但是极为重要的方式推动了每一次技术革命。

     在每一次基础设施、技术和组织的创新当中,都有一些加速了货物运输和信息传输。这些创新通常又可以接着作为变革之源服务于货币、银行和金融部门。苏伊士运河开通之后,对于蒸汽船,国际电报线路和其他有利于迅捷国际贸易的事物都在广泛地收到资本的资助。而在由美国发起的几次信息革命中,银行就是廉价邮局、全国性铁路和电报的早期客户,也是最先使用电话、打字机和计算器的机构。

     芝加哥期货交易所(The Chicago Board of Trade)建立于1848年,这正是电报线路架设到这一城市的那一年。在接下来的几年内,商人们在其他的几个主要的商业中心建立了类似的期货机构。

     1887年,时任美国最大的电报公司西联公司(Western Union)总裁格林说道,西联公司传送的电报中至少有87%与商业相关,且绝大部分商业电报都是投机买卖。这种投机电报交流的大部分都是“没有运输且常常没有商品交割”的买卖。因此格林坚信,电报从“本质上”来讲是“商业和投机买卖的附属品,需要即时通信及答复”,并不是一种大众通信手段[2]。

     当时,一位商业编辑曾评论说,在电报商用之前,商人们能够利用预先知道的远处的价格信息进行大规模的农产品投机买卖。而在电报商用之后,既然价格数据能够通过电报的方式快速传输,商人原先那种投机套利的方式就不复存在。取而代之的是,他们开始通过猜测在未来某个特定日期农产品可能的价格进行投机。这样,时间就取代空间作为最大的未知数。据这位编辑估计,之前这些农产品的种植者们每年都会因为这种投机行为损失大约4000万美元,但电报商用之后,这一损失减少到原来的二十分之一。

     金融的本质是信息的传递,是产生对行动和结果的预期。金融系统,无论是银行、一级市场、二级市场都是信息的传递网络。通过信息网络,当这种预期在其间被传递越精确、越快,财富就被创造出来。因而,每一次信息的革命:语言、书写、印刷、电报、电话、互联网、手机……都创造了金融的革命。

     而我们当下所处的时代,就是一场新的金融革命即将发生的年代。这一次的诱发因素是人工智能。人工智能将重塑金融的信息网络,把那些传统上由经验和人脉承载的信息传递和处理渠道,渐次由机器来辅助,并且做到自动化和智能化。

     要信息工业不要信息农业、矿业

     在金融信息这个领域,我们已经看到无数科技企业前仆后继地涌入,江山易主、成王败寇却也存下了大大小小的各类企业,我们且将这些企业从金融数据加工成金融信息的角度来将他们审视一遍。

     一种模式的企业我们可将其称之为“信息农业”,他们依靠人力从一些“自然资源”里刨数据,缺乏规模化扩大再生产的能力。这种“农业”,很难做数据的深加工,数据增值有限且产业链条不长,产出的信息价值也有限。

     另一种模式是“信息矿业”,他们通过一些机械工具把一些现有的结构化数据给开采出来,在某种场景下组装成一些更有价值的信息。这种比农业要好,但是缺陷在于开采品类有限,能做开采的人很多,技术壁垒还是不够高,所以增值有限。

     那什么叫做“信息工业”呢?我们都知道是福特汽车敲响了现代工业的大规模生产方式的钟声,在历史的进程中究竟是什么让大规模生产成为可能呢?让我们回到20世纪初,福特改良T型车的那段时间。

     1908年,在推出T型车的前夕,福特公司每一个装配工的平均工作周期,即开始重复同样作业之前所经历的工作时间,总计为514分钟。而到了1913年春天,福特在底特律海兰公园的新厂房里有了新的创举,就是装设了移动的总装线。工人们站在一个地方,不必走动,而总装线将汽车送到他们的面前,这一革新使工人们的工作周期从514分钟缩短为1.9分钟,汽车的生产效率以十倍、百倍的效率在增长,而这条移动总装线就是现代工厂俗称的“流水线”。

     福特之所以能进行大规模集约化生产方式的革新,是因为技术攻克了 “机械零件经过热处理会产生的翘曲变形” 的难题,这是过去零件不能标准化的祸根,总是依赖于机械师们一遍又一遍手工打磨。而一旦零件翘曲变形的间题得到了解决,就使零件的数量得以减少,而且使它们变得易于相互连接在一起

     那么,使金融信息工业成为可能,则也需要一种能够攻克各类“金融数据标准化”的技术。我们需要做数据的深度加工,把段落、句子、实体级别的分析做到极致,我们要把各种金融的文档都结构化化继而实体化,提取它们的元数据,进而产生千千万万种数据的重组合和自动化。从数据到信息,最后再建立一个深度的金融知识网络,这就是我们要的金融信息工业。

     AlphaSense——新一代金融知识引擎

     在2016年福布斯美国金融科技公司50强的榜单上,出现了一家叫做AlphaSense的上榜公司。

     数据是反应客观事物运动状态的信号,通过感觉器官或观测仪器感知,形成了文本、数字、事实或图像等形式的数据。

     信息则是对数据进行加工处理,使数据之间建立相互联系,形成了回答某个特定问题的文本,以及被解释具有某些意义的数字、事实、图像等形式的信息。

     知识不是数据和信息的简单积累,知识是可用于指导实践的信息,知识是人们在改造世界的实践中所获得知识和经验的综合。

    

     在投资研究的场景下,分析师通常都需要从新闻、财报、研报各种行业网站等获取大量数据、信息、知识形式的“素材”,然后再通过自己的逻辑和世界观将这些素材再组织成投资决策。我们依据素材的获取的难易程度,把它们从简到难分成5个等级:

     1.公司、行业、市场等新鲜的信息和数据(公司、股价、交易量等)

     2.相关指标、数据类信息(CPI、货运量、行业规模各种图表等)

     3.新鲜的论断、结论(各种看多看空的结论)

     4.新鲜证据(支撑论断的成为论断的事实依据)

     5.别人的逻辑、研究框架(全网的知识网络)

     对于那些做信息工业和矿业的金融信息公司来说,其产品无外乎金融数据终端或者信息平台。前3个层级的数据信息对于用户来说都是可得的,而他们在后两层的深度信息和知识上的处理则显得有些无力。那么AlphaSense这类公司是如何通过产品在这个层面上为机构内的分析师们或多或少解决问题的呢?

     他们产品组成由三大部分组成:高级语义搜索引擎、交互式知识管理系统、文档(知识)协作系统。投研人士通过高级语义搜索引擎获得各类“素材”;在交互式知识管理系统里可以有选择的对素材进行收集和管理;在知识协作系统里,可以对素材进行加工和再组织使用。

     当知识切片变的足够细,并可供人们搜索、管理、再组织,这就是金融信息工业化的一个萌发阶段,这就是某种程度上初步的金融知识网络。

     Kensho——挑起新一轮军事竞赛

     我们再来看另外一个大热的Fintech公司——Kensho,其创始人是哈佛大学博士生,工程团队是从谷歌、苹果等带来的顶尖工程师,并被谷歌和高盛投资。据说他们的人工智能技术让华尔街人人自危,其公司本身具有相当高的话题性。再拜各种媒体大肆的渲染所赐,我们提起它的时候总免不了带着一些敬畏,难道机器真要取代人类了吗?甚至还要取代那些站在人类智力巅峰的华尔街分析师们。

     如何快速找到“文因互联”公众号?

     点击此处,教你添加文因搜索到手机桌面

     加入智能金融交流群

     添加微信群管理员微信号 293537363,附上姓名、所属机构、部门及职位,审核后管理员会邀请您入群。

    

    

    http://weixin.100md.com
返回 文因互联 返回首页 返回百拇医药