- 帖子
- 2259
- 威望
- 0
- 金钱
- 4506
- 注册时间
- 2013-6-8
- 最后登录
- 2020-2-16
|
华信智原《职话大数据》:数据安全和用户隐私的边界
华信智原联合凤凰网安徽频道打造了国内首档大数据对话网络栏目《职话大数据》,参与栏目的大咖均为国内外翘楚企业和权威机构:爱奇艺、中国工程院、春雨医生、阿里巴巴、滴滴出行、微软中国、教育部mooc研究中心、科大讯飞、赛仕软件、智联招聘、汇智协同、墨迹天气、乐视、腾讯云等。系统性阐述了大数据的内涵、应用中遇到的问题、大数据应用人才培养、大数据发展前景等问题。其中数据安全、用户隐私问题备受关注。
2010年Science上刊文指出,能够根据个体之前的行为轨迹预测他/她未来行踪的可能性,即93%的人类行为可预测。大数定理告诉我们,在试验不变的条件下,重复试验多次,随机事件的频率近似于它的概率。“有规律的随机事件”在大量重复出现的条件下,往往呈现几乎必然的统计特性。从“数据”到“大数据”,不仅仅是数量上的差别,更是数据质量上的提升,即从量变到质变。现实的问题是数据安全和用户隐私的边界到底在哪里?我们在被大数据分析时是否会一丝不挂?
阿里巴巴技术安全部技术副总裁杜跃进
我本人现在最重要的工作之一就是保障数据安全。数据安全如果做不好就意味着消费者会对你没有信心,所以,从数据进来,到数据处理,在数据处理的每一个过程、每一次产品的设计全部要经过严格审核,审核的目的是在整个过程中不能够侵犯到任何的隐私,每个员工不能使用任何其他人的个人数据,否则,将受到最严厉的处罚,而这个仅仅是规则上的。一整套的数据安全的能力,只靠规则是不行的,所以,阿里巴巴在国际上已经立下了标准,在国际标准、国家标准和行业标准,我们都在“数据安全成熟度模型”,它是用来衡量一整套的方法,包括技术、人员、规章制度、组织结构的设计等,把这些能力加在一起来衡量一个机构,对数据的保护够不够好,这个是我们最关心的事情。
春雨医生联席CEO刘成平
对于任何一个行业来讲,用户隐私的安全都是一个问题,医疗行业、电子商务行业,甚至包括游戏领域,都存在用户隐私。我们都有相应的技术手段和制度来严格约束,以保护用户隐私。同时,现在整个医疗大数据也面临一个非常重要的问题,在传统医疗领域,每一个医院都有很多患者的信息,我们称之为电子病历或是医疗健康数据,这些数据在在每个医院都是封闭的,每个医院都有自己的核心系统,每个人都有自己的数据格式,甚至存储的方法都是不一样的。而对于互联网来讲,每一个移动医疗互联网公司,他们的数据其实也是孤立的,我们当然希望通过大数据的开放式共享,能够去对我们的用户有一个更准确的画像,当我们能够了解一个用户更多的健康数据时,诊疗或医生给出的意见、治疗方案,也会更加的科学和准确。希望整个行业、甚至包括医院,能够一起来共享健康数据,这是我们很好的一个愿景。
滴滴出行大数据高级分析师李丽凯
滴滴对于数据保持安全第一、体验第二的原则,保护用户数据,在匿名化处理数据的前提下,再进行一些基于数据的应用。滴滴内部对于数据的处理一直遵循用户安全第一体验第二的原则。针对数据本身物理存储的安全问题,滴滴会提高数据安全级别,使用离线存储;滴滴内部还将提升数据管理者的安全级别;此外,滴滴使用匿名化的数据,这是一个不可追踪、不可回溯整个过程,所有参与数据的人员,能看到的是一串代码或是一个数字,但是他们并不能把这些数字反向的追溯到个人,进而从内部和外部同时保证用户的数据安全。
科大讯飞大数据研究院副院长谭昶
谈到大数据和个人隐私,很多人会觉得大数据把个人隐私公开暴露在闪光灯下,好像每个人已经无所遁形一样。但实际上大数据和个人隐私之间并不是绝对的非此即彼的关系。对大数据的处理和分析的过程中,我们使用的是海量数据,假设说我们要分析人的兴趣爱好,我们同时分析的可能是一千万人的兴趣爱好,得到的结论是其中有百分之九十的人,比如说喜欢购物。那么这种信息基本上已经不涉及到个人隐私的层面。另外一方面,适当的个人隐私的暴露,或者说无关大雅的涉及个人隐私的暴露,它实际上是有利于我们享受到更加个性化的服务的,比如购物平台的个性化推荐,猜你喜欢买什么东西并做相应推荐,它会让你觉得购物体验非常好,而没有意识到实际上这也是一种个人隐私的暴露,而这种过程,实际上每个人都贡献了他的行为,最终的结论是每个人的服务体验都得到了提升。这个过程实际上存在一个交换,你适当暴露一些隐私或者个人行为,你会得到更好的服务。
最后,是真正意义上的、精确的个人隐私的暴露,比如身份证号码、手机号等,直接就泄密了,这种情况在一些公司里也发生过,尤其是一些IT公司,闹得沸沸扬扬。科大讯飞很少收集此类非常隐秘的个人隐私,我们秉承一个原则,只收集对我们的产品改进、用户体验有帮助的这些用户的数据,不会收集真正意义上的个人私密数据。国家或行业也有法律规定和相应规范,它会要求大家去遵循一个行业的标准,来进行数据的采集和使用,它会从物理安全、数据安全和接触到数据的人的安全性方面,来保证真正的隐私数据不会被轻易地泄露出去。一旦泄露,也会有相应的追责。 |
|