“谷歌流感趋势”为何过高估计美国的流感病例数量?数据也“主观”
2023/2/19 11:11:00 橘蕊墨邪

     谷歌公司已经开始在理解消费者的“待办任务”这一研究领域投入大量资源。

     1、谷歌也被大数据蒙蔽过

     所有的数据都是人为制造的——数据与创造它的人有同样的意图,无论此人是有意还是无意。高层领导者都应该投入与分析数据相同的时间,来先判断哪些数据才是值得收集的。我们应该就某一事项的哪些层面搜集信息,又应该忽视哪些层面?

     【S:背景情境】

     2014年春,《科学》杂志发表了关于“谷歌流感趋势”的学术研究结果,“谷歌流感趋势”是谷歌的一款跟踪流感的服务,意在先于传统的美国疾病预防控制中心预测出将要发生的流感趋势。

     “谷歌流感趋势”的基础,是一种将5,000万搜索关键词与1,152个数据点相匹配的算法。简单来说,谷歌希望能够通过将搜索关键词(例如症状、医疗机构、治疗方法) 与相关的客观数据相互参照,预测出流感疫情的暴发。

     【C:变化/冲突】

     这篇文章的作者是来自美国东北大学、哈佛大学和休斯敦大学的学者,他们总结说,在两年多的时间里,“谷歌流感趋势”过高地估计了美国的流感病例数量。

     【Q:问题及分析】

     这篇题为“谷歌流感之启示:大数据分析陷阱”的文章表示,至少从一定程度上来说,这些错误之所以发生,是因为“谷歌流感趋势”的工程师对于该将哪些数据纳入模型中的判断有误——这些错误被这些学者称为“算法变动”和“大数据傲慢”。

     谷歌的目标值得称颂,它认为对流感趋势进行提前预警或许能够避免疾病的蔓延,并比传统方法早一步挽救生命。但是,正如谷歌的工程师所发现的那样,他们必须要选择该对哪些数据进行分析才行。不巧的是,具体的搜索关键词与谷歌算法之间的对应性关联太过复杂,且受到一系列人为因素(比如一个疑病神经症患者每个月都会搜索相同的关键词,或是谷歌的工程师不时地变换收集数据的方法等)的影响,因而无法制造出一种可靠的预测工具。

     【A:回答及解决】

     谷歌搜索中的关键词是由计算机创造出来的,而且能够通过许多新方法进行储存和分析,因此这些词语看上去很像有效的数据组。

     然而,事实并非如此。现象(在这个例子中,现象就是搜索关键词) 能够被计算和分析,并不代表这些现象有资格成为数据。现象对确定整体方向有帮助吗?答案是肯定的。那么现象是否等同于客观的事实呢?当然不是。

     2、强大的目标品牌——“谷歌一下”

     目标品牌具有惊人的清晰度,这些品牌就是任务的同义词。目标品牌这种效果并不是通过广告宣传实现的,而是通过人们雇用服务且发现服务能够完成任务逐步达成的。

     其实,谷歌、星巴克等一系列目标品牌在刚建立时的广告宣传都少之又少,但“谷歌”品牌如此强大,以至其已经变成了动词,例如“谷歌一下”,就是因为它所对应的待办任务很清晰。

     阅读更多

     1. 创新不是扔骰子的事——柠檬车案例的类比说明

     2. 用待办任务理论分析需求的背景:狄·卡门发明的两轮平衡车Segway的案例

     3. 微信、QQ与香烟的竞争——特定的背景或场景下

     排版 | 紫邪

     图片 | Unsplash

     编辑 | 《与运气竞争》

     终审 | 紫邪

     乐行人生,行乐天下!

     点击“在看”,让更多人看到

    

    

    源网页  http://weixin.100md.com
返回 橘蕊墨邪 返回首页 返回百拇医药