小心!GPS让你的隐私暴露无遗
2017/6/30 秦朔朋友圈

    

     作者:戈小羊 / 微信公众号:qspyq2015

     这是秦朔朋友圈的第1375篇原创首发文章

    

     出租车上的GPS其实是一流的狗仔

     这年头,手机里装满了你所有的秘密。但是你可知道陌生的出租车上的GPS也装满了你的秘密呢。

     纽约城市出租车和豪华轿车委员会对外公布了一份2013年全市的出租车行程,这份文件20G大,有全年超过1亿7千万次出租车GPS数据等,以及上下车时间、接送地点、车费、小费等等。当然,这些数据都是匿名的,隐去了乘车人的相关信息和出租车司机信息等等。在纽约市政府和普通老百姓眼里,这份资料已经隐去了很多关键信息,对外公布只是给有关部门制定城市交通政策起到一些参考作用,给一些研究机构提供一些大数据信息,不会侵犯个人的隐私。

     “还能从这1亿多次匿名的乘车信息里找到我么?”你肯定是这么想的。

     但事实上,这份匿名的大数据信息对于数据研究者来说,已经足够了解你的全部秘密!当时还是美国西北大学研究生的Anthony Tockar就像玩游戏一样轻松地揭开了这些秘密,甚至比你现在想象得要多得多的秘密。

     Anthony Tockar首先从明星下手。他通过google搜索带有“2013年明星坐出租车出现在曼哈顿”这些关键词的图片,结果轻而易举地通过粉丝和狗仔队上传的各类明星上下出租车的照片,然后通过照片透露的上下车地点、大致的时间,以及可能露出的出租车牌等信息,在纽约城市出租车和豪华轿车委员会对外公布的那份大数据包里,很快就锁定了明星的行踪,甚至包括他可能偷偷去跟谁会面、付没付小费等等。

     比如他分别找到布莱德利·库珀杰西卡?阿尔芭的行踪,如下图所显示。

    

    

     根据Anthony Tockar的发现,布莱德利?库珀打了一辆车应该是去一家叫Melibea的餐厅吃饭,他打车的目的是为了要避开狗仔队,结果纽约出租车委员会把他的老底全透露了。布莱德利?库珀这次车费10.5美金,但是他居然没有付小费!

     另外一位杰西卡?阿尔芭又怎么样呢?她被发现从Trump SOHO这家酒店走出来打了一辆车去了某个地方,居然也没有付小费!可能中国人对小费没有太大概念,在美国是有付小费的文化。可以说付小费是一件天经地义的事情,尽管不会有任何法律问题,但是道德上还是不好看的。公众人物在镜头前辛苦经营的光辉形象,就栽在这一点小费上,非常没有面子。

     我想是不是卓伟这样的中国第一狗仔也需要掌握一些大数据的知识。这年头光靠辛苦地在街上溜达寻找明星的蛛丝马迹,还真不如在家鼠标一点,大数据一分析,靠谱又轻松。

    

     普通人也逃不过

     当然,你可能会想,明星的行踪自然很容易暴露。我是一个普通人,丢到大街上都没有人认识,你怎么找我呢?

     Anthony Tockar自然会有办法。他搜索了从半夜12点到凌晨6点在曼哈顿著名成人俱乐部附近的全部上下车信息,包括时间地点等,如下图所示。

    

     其中黄色的点表示很多次出租车都准确地停在这个位置,然后客人下车。这很有可能是一位熟客。于是Anthony Tockar就挑选了几条GPS线路进行跟踪,通过这个数据,他顺藤摸瓜找到了这些人的全部个人信息。

     感谢google地图高清晰的画质,Anthony Tockar很轻松地锁定了这些人的家庭住址,通过搜索家庭住址,就能发现这个人的姓名和邮件等信息,当然也可以评估得出他的房屋价值、计算得出家里几口人、是否在法院或警察局有案底、开公司的相关信息、从事的行业等等。当然,顺手再搜索一下与这个地址有关的出租车路线,会发现这位主人还经常去其他的成人俱乐部等等。

     对于Anthony Tockar来说,这一切只是他从事数据研究的一些方法而已,不会暴露这些人的隐私。但是Anthony Tockar表示,如果掌握这些数据的人不是科学家,而是竞争对手、小偷、或者任何想要跟踪你的人,那么你的隐私早就被牢牢掌握在别人手里你还什么都不知道。

     不过话说回来,像纽约城市出租车和豪华轿车委员会这样的机构,他们即便是掌握了大家的数据,也不会年年公布,也不太懂数据挖掘。而更多的高科技公司,则会把我们的数据进行商业化,则要可怕很多。

    

     Uber也知道你的隐私

     Uber毫无疑问是一家数据驱动的高科技公司,共享出行就是建立在分析乘客和司机的行程路线上,然后进行配对,已达到最好的经济效果。但是Uber的数据科学家们可不仅仅只是在研究乘客和司机的配对,因为他们能获得很多第一手的数据,而且这些人还喜欢对此进行深挖。

    

     根据贝叶斯算法,Uber的大数据团队可以大致估算出你这次叫车大致会去多远的地方,以及预测你要去的地址。Uber的算法根据三个重要数据,第一是这个客人的历史用车信息,第二是其他客人的用车行为参考,第三是一些特定区域的热门指数等。

     这个客人以前经常去哪儿?这个地点是一个酒吧还是一个办公楼?这里的生意如何?是个热门的目的地吗?这些就是算法需要的一些基本信息,当然还需要结合一些合理的逻辑推理,比如上午11点叫车,这肯定不是去娱乐场所;比如距离,你以为你提前一点下车Uber就不知道你最后去的是哪里吗?

     根据美国媒体的报道,Uber被怀疑在乘客下车之后,还在搜集乘客的GPS信息。因为Uber的APP可以在苹果设备的后台运行时,还不断地搜集用户的地理位置信息等。就算是用户关掉了手机上的GPS功能,依然可以通过手机的IP地址知道这个人的所在地。Uber表示希望通过更多地获取用户的信息,来洞悉这个用户的真实想法,以便更好地提供服务。

     研究还表明,Uber可以通过获取用户的电话薄获取更多的联系人信息,进而可以帮助它更好地进行推广。这一点已经被Uber的相关负责人证实,承认了他们的确会在推广新的APP或者应用的时候获取老客户的电话薄,但他们强调这是经过了用户的允许。

     可能有人会觉得这也是正常的商业行为,顶多是处于隐私的灰色地带,那么Uber接下来做的两件事情真的会让你觉得被冒犯了:

     Uber可以通过后台的GPS数据,调取并跟踪曾经写过自己负面报道、又恰巧用过这款软件的记者,一个员工还在Uber内部公布了这个记者的相关数据,Uber内部有一个自己人才使用的程序“God View”,Uber的员工可以通过这款软件跟踪用户而不被察觉。

    

     当然这里以Uber举例并不是只有它一家会做上述事情,它也只是众多大数据驱动的高科技公司之一,有很多的公司对数据的深度挖掘、对用户的隐私研究要比Uber做得好得多。今天只是想探讨我们平时并不在意的GPS信息,就能透露如此众多的秘密,真是值得我们警惕。

    

     大家在真实的数据里提供一些噪音吧

     除了GPS,我们在生活中使用IP地址及Wi-Fi获取基于位置的服务,实现实时导航、本地天气、地理定位的功能,但在无形之中,它也泄露了我们的隐私。有想法、有技术的人,完全可以按照Anthony Tockar和Uber的方法,按图索骥,知道我们所有的秘密。

     对此,我们作为用户就只能束手无策,坐看自己的隐私被各方拿走一点办法都没有吗?Anthony Tockar还是给了一个技术建议,那就是采用Differential Privacy 差分隐私技术。当然,这个对我们这些小白用户来说,实在太高深了,简而言之就是在真实的数据里提供一些噪音,既不影响整个数据的准确性,同时又会干扰对具体个人信息的判断。

    

     以纽约城市出租车和豪华轿车委员会对外公布的这份2013年全市的出租车行程信息,它就不能只简单粗暴地隐去一些普通人看来很重要的信息,然后如实地把数据公布出去,而是应该在这份大数据包里增加一些噪音,既不影响交通部门对路况和城市的管理,同时也会很大程度上降低对个人用户数据的挖掘。这就需要更多数据人才加入到政府和很多相关部门中来,我们经常谈“智慧政府”,“智慧政务”,关于数据的保护就是一个非常重要、需要提供的方面。毕竟政府掌握的数据才是最优质的数据。

     2016年的苹果开发者大会上,苹果的相关负责人也介绍了这个Differential Privacy 差分隐私技术。希望能够借助这个技术,在更好地获取数据的同时,降低对用户隐私的暴露。但是知易行难,目前这个技术还只是停留在实验室里,如何大规模商业应用尚无案例可循。所以,我们的隐私依然在裸奔。唯一能做的事情,就是在打开APP的时候,尽量减少不必要的功能。如果还想再多做一点的话,就是祷告这些大数据公司底线能高一点吧。

    

     「 本文仅代表作者个人观点,未经允许不得转载 」

    

    

     秦朔朋友圈微信公众号:qspyq2015

     商务合作|请联系微信号:qspyqswhz

    http://weixin.100md.com
返回 秦朔朋友圈 返回首页 返回百拇医药