您的位置: 楚雄信息港 > 体育

凯迪拉克车主大宝剑高德数据报告背后究

发布时间:2019-06-06 20:09:16
月经过多贫血吃什么好
月经总是提前乳房胀痛
胸部胀痛有硬块怎么办

“从昨天上午开始,公司里的同事就开始和我开玩笑,一个接一个问我,晚上是不是又要去桑拿房。后来回了家,老婆半开玩笑地问我这两个月回家这么晚,是不是去了别的什么地方。我后来才知道,老婆单位里那些嚼舌根的女同事无事生非地告诫她要看好我。我老婆和我之间的信任感是有的,老婆也知道我工作很忙,但是一个接一个地这么开玩笑,我确实感到有些烦了……”赵先生在里和我这样说。赵先生家住虹口足球场旁边,家境还算殷实,不过这些都不是重点,重点在于赵先生是凯迪拉克ATS车主。

1月10日,高德地图联合交通运输部科学研究院发布了《2016年度中国主要城市交通分析报告》,报告中令民感兴趣的就是下面这张图,而图中的焦点则是关于凯迪拉克车主的“大数据画像”。

凯迪拉克车主“爱干净”、“喜欢洗澡”的戏谑充斥朋友圈以及各大论坛,引发了凯迪拉克车主的怒火。一开始我对此的看法是凯迪拉克车主大可不必发火,这只是大数据,无关个人隐私,你一个凯迪拉克车主从来不去洗浴推拿场所,不代表其它的凯迪拉克车主也不去洗浴推拿场所。

但是对于这样的解释,赵先生有不同的看法——“难道凯迪拉克车主就是靠去这种地方过日子?难道凯迪拉克车主的社会行为就如此简单?凯迪拉克车主的生活难道就是‘住所——洗浴推拿场所’这样的两点一线?”,他说了一句话,“中国什么都有假的,为何大数据就不能作假?”

毫无疑问,一个“假”字打动了我。我从初对凯迪拉克车主的戏谑,开始转向另一个问题——关于凯迪拉克车主画像的大数据,到底靠不靠谱?

1

安吉星前雇员:疑点太多

要回答高德数据报告靠不靠谱,首先要了解其调查方式和数据来源。

鉴于高德地图是通用安吉星中国大陆地区的车载导航地图供应商,因此我首先想到向上汽通用相关人士进行咨询。通用相关人士的回答很简单——不予置评,但强调称安吉星后台服务器的静默数据不可能提供给高德地图。,这位人士还补了一句:“他们连凯迪拉克的Logo都用错了……”

这是一个相当重要的信息。经过多方联系,我辗转找到一位曾经在安吉星就职的魏先生,并对其进行了采访。

对于凯迪拉克车主画像的这件事,魏先生的句话就是“商业玩笑”。按照魏先生的说法,安吉星目前的导航地图供货商是高德地图,高德关于交通拥堵的大数据是完全可信的,高德有能力获取拥堵大数据;但是高德根本不可能从安吉星车机端获得凯迪拉克的车主行为轨迹。

魏先生表示,安吉星会给任何一家合作方都绑定底层协议,目的就是为了保证静默数据不会被技术合作方获取。以高德为例,其服务器可以收集每个高德用户的行车轨迹数据,但是在高德的服务器上,只能看到这80万用户是上汽通用车主,至于具体是哪一款车,高德是不可能知道的。在目前活跃的80万个安吉星用户中,别克和雪佛兰车主占据差不多90%以上的比例,剩下的才是凯迪拉克车主,那么,高德是如何在不知道具体车型的前提下从80万用户中甄别出凯迪拉克车主?

2

“安吉星后台静默数据绝不会向高德开放”

魏先生介绍说,从2009年12月20日个中国大陆安吉星用户成功注册开始,目前通用安吉星有200万中国大陆用户,但缴费的活跃用户在80万左右。这80万用户在很多人眼中等同于商机,其实安吉星完全可以和大众点评之类的商业机构进行合作,例如安吉星用户到某某饭店吃饭可以打折等等,但是安吉星从来没有这么做。

这其实是美国人定下来的规矩,美国本土早在1994年就推出了安吉星服务,这么多年下来累积的用户群是相当可观的,但是美国人从没想过在这些用户身上打主意。对于后台静默数据,安吉星一直都秉承不公开、不销售、不利用的“三不原则”。

魏先生称,安吉星对于静默数据的保护相当严格,例如客服人员接通安吉星语音之后,系统会自动录音,挂断180秒内,系统还会继续记录客服人员的操作行为。有权限访问后台服务器静默数据的工作人员不多,但是系统会记录静默数据访问者的账号、访问时间以及访问路径,以确保内部的工作人员不会有违规的操作行为。

只在一种情况下静默数据才会被出示给第三方,那就是“警方协查机制”。

魏先生表示,自己就是当年这套机制的制定者,并详细解释了流程——警方因为查案需要,希望调取某车主的行车轨迹,首先要出示警官证和公安机关介绍信,并简单介绍案情,工作人员会拨打相关公安机关的,以核实警官身份以及来意,接下来工作人员会根据涉案时间段提取涉案车主的行车轨迹交予警方,而不是把涉案车主所有的行车轨迹交给警方。从以上文字中其实不难得出结论,安吉星对于后台静默数据的保护措施是相当严格的。

“安吉星和高德合作,自己不利用这些后台静默数据,而且守得这么死,然后却允许这些数据都传到高德服务器上,你觉得安吉星会蠢到这一步吗?”魏先生如此反问道。

魏先生还提出了自己的质疑,那就是高德发布的这份报告还涉及到了车主的“年度野蛮驾驶Top 10”。魏先生指出,排名第7的Jeep配备Uconnect车联系统,其在华的地图供应商是四维图新而非高德,那么问题就来了,高德如何得到Jeep车主驾驶风格的大数据?

3

导航能不能搜集车型数据?

如果高德不能通过安吉星获取车主行为轨迹,那这份报告的数据来源究竟是哪儿呢?有没有可能是通过端的高德地图搜集数据?

我们发现,这种可能性也几乎不存在。首先,端高德地图不需要输入车牌号、车架号等信息即可以使用。其次,因为北京、上海和杭州有外地牌照限行的政策,高德地图推出了“限行偏好”的功能。该功能允许用户输入车牌号,以避开限行路段。我在这一栏随便输入了“苏B11111”就能在上海规避限行路段,高德并没有对车牌信息实施进一步的验证,所收集的车牌数据真实性无法保障。

更何况这个数据还具有极强的地域属性,因为只有那些外牌限行城市及其周边局部地区的车主,才会使用到高德地图上的限行规避功能。因此,即便高德地图可以通过“限行偏好”获得一部分车主的真实车牌信息,但也不具备广域性特征,不能作为大数据报告的基础。

既然从安吉星的底层获取数据不可能,从端获取的数据又不可靠,那么高德还有没有可能从其它途径获取凯迪拉克车主的大数据呢?

一位不愿具名的某大数据公司高管表示,这样的可能性完全存在,因为高德找了个“阿里爸爸”。例如用户绑定自己的号、车牌号、车型、身份证等等就能增加自己的络金融信用等级,这些数据完全可能被阿里掌握,从而间接被高德获取——别忘了,阿里是一家大数据公司。

4

作为一份报告,高德到底严不严谨?

高德的数据报告发布后,在业内受到了较多的质疑。凯迪拉克车主普遍感到受伤害。前杭州数云联合创始人兼首席技术官段勇先生对《买车大师》表示,从这份报告的结果看,其数据运算模型“有可能”存在缺陷。

段先生指出一个细节,即高德发布的这份报告中,不同豪华品牌车主喜欢去的地方,均没有重复性。其实从购买力和生活方式来说,所有的豪华品牌车主去购物、餐饮、机场的频率都不低,那么为何去机场的只是奔驰车主,“购物”的画像却算在宝马车主头上?段先生从自己理解的技术层面进行猜测,认为是数据运算模型导致了这种结果。

对此,段先生举了一个例子——假设每个品牌车主都有1万个数据样本,7000个宝马车主经常跑购物中心,而奔驰、奥迪、凯迪拉克车主分别只有6000个、5000个和4000个喜欢跑购物中心,那么数据运算模型就依据“”原则将喜欢跑购物中心的车主画像算在宝马车主头上。相对而言,奔驰车主在去机场、火锅店、别墅区和高级酒店这四项上,因此这四个画像元素就算在奔驰车主头上。

如果凯迪拉克车主在其它画像元素上的排名都是第二,但是1万个样本中,有两个样本去了洗浴推拉场所,其余品牌只有一个,虽然只是万分之二,但也足以让凯迪拉克车主在这一单项车主画像中。如此就能解释不同品牌车主之间的画像元素为何没有重复性。

如果段先生的猜测属实,如果高德是以这种方式进行运算统计,那么其结果一定会背离真实、主流的车主画像。从这一点上看,我们认为高德的大数据报告或许缺乏应有的严谨性。

写在

采访完安吉星的前任雇员魏先生之后,我曾经致电高德服务400 810 0080,并按照客服人员要求发送了提问邮件,不过截止到发稿时间为止,高德公司依然没有对相关问题进行任何形式的回应。

——END——

欢迎大家在后台提问,但更建议加入到‘以车会友’群,详细描述买车的需求,大师才能更好地解答您的提问。关注号autoconsumers,后台留言“我要入群”,我们会将您加入群中。

汪峰前女友-他们一定会分
Ella曝性幻想对象是元斌-差点对不起老公
邛崃男子持刀追砍村干部后暴力抗警 砍破民警头盔(组图)
猜你会喜欢的
猜你会喜欢的