且不谈人肉搜索...仅仅是通过搜索引擎我们又能知道些什么,这些信息都是我们多年来在浩瀚的网络世界中留下的痕迹,不管愿意或不愿意,信息已经在那里,“不离不弃...”。如果说人肉搜索,是借助“网络大众”,在未经当事人允许的情况下,将个人的线下信息搬到线上进行曝光。而且,如若不慎,还会侵犯当事人的隐私权。那么,这种仅仅利用搜索引擎,以及社交媒体对某些个人的历史资料进行信息搜集和分析的过程,又应该引发我们进行哪些更深层的思考呢?
笔者首先应该承认的是,我自从在学校课程中接触到搜索引擎开始,就对这浩瀚的信息产生了浓厚的兴趣。不对,应该说,自从知道在地址栏中可以输入汉字获取想要得到的信息(那时应该是3721吧)时开始。当然,笔者那时还是个少年,对所有的事物和信息,都怀着无限的好奇心,只知索取和接受,而不知道信息是需要甄别的。而后,在自己检索信息的过程中,渐渐培养起可以说是一种“不良嗜好”的,——“检索癖”。过往中,笔者曾多次执着于使用网络来获取自己感兴趣的历史记录,这本身可能是不道德的。但消息就在那里,我只是进行一些组织,以此来满足自己获取信息的欲望而已。今天不从道德层面来展开,只是想通过结合自己最近的几次经历,从以下两个方面来阐述一下。
一,搜索引擎能获取我们的哪些信息
为了更形象的表述,笔者将结合两个实例进行分析,由于事先未经得两位朋友的同意,笔者将全部信息进行了匿名化处理,但整个获取信息的过程没有变。稍后,待完成此文,自己会首先发给两位朋友审阅,最终怎样展示,以及该文是否发布还要征求他们的意见。
两位朋友都是自己通过网络结识,A已经成为了笔者的好朋友,B还没有进行过多沟通,但我已经获取了他的大部分信息,甚至可以写出一份简历。在第一次和A谈起我知道他的信息时,他感觉非常惊讶。我知道他不喜欢如此,因为他曾说,他如果想了解一个人绝对不会借助第三方去获取那个人的信息,而是,通过交往慢慢去了解和沟通。估计B稍后看到此文,也会因为自己在网络上的”赤裸裸“而惊叹。先说句抱歉...
回到主题,我在想应该以怎样的顺序来表达会更明了。我罗列了以下的小标题,下面依次来说吧。
1.如何将网络上的信息串联起来
我们知道,虽然我们在网络中留下各种痕迹,但是,这些散布的信息其实是非常凌乱的存在于各种媒介中,无论是最早的bbs,贴吧,还是后来的blog,以及现在的社交网络,我们并没有说依照什么规律去累积这些信息。可是,我们作为一个自然人的固有属性,会自觉不自觉的被我们带到网络上,加之,我们为了方便记忆等各种原因会给自己贴上几个比较稳定的标签。常用ID(nick),email,qq,mobile...这些就成了将我们的信息串联起来的线索,也成了像笔者这样的“不法分子”获取我们相关资料的突破口。实例如下:
A:
笔者初到帝都时,亟待建立自己的社交圈,当然要通过各种渠道交友。夹逢当时想要同师兄开发一个社交应用,就了解了一下社交应用的业界动态,当然首选国外优秀产品。因此注册了某dating交友网站,在其中遇到了A(至今遇到的最睿智MM)。同A通过message的形式沟通了几句,在未互留联系方式之前,我就对其展开了一番信息检索。过程是这样的,我首先通过其id检索到了A的百度账户,不过A在百度的账户中,只是用id在知道中问了一个问题。问题内容不透漏了。该条线路检索内容到此结束。
这里既然提到了百度账户,就说一下百度账户能够了解到一个人的什么信息吧。以本人百度账号为例。本要截图呢,但还是是用文字吧。大家知道百度的产品线其实非常之长,除了搜索之外,涉及知道(问答)、百科(wiki)贴吧(论坛)、百度空间(blog,虽然自称不是)以及Hi(IM)等。作为一个互联网产品提供商,为了牢牢抓住用户,当然都会选择将旗下所有产品进行整合。对百度而言就是其用户中心,天杀的是,这用户中心默认是公开的,任何人可以通过百度产品中的用户名链接访问任意用户的个人中心。目前的状态是能够查看用户的“贴吧,空间,知道”的信息,这就相当于可以通过分析用户在贴吧发言,知道的问答以及空间的日志和照片来分析该用户的喜恶,甚至用户的过往经历。因为用户资料里会有出生地一项,而且大部分用户都会在其家乡的贴吧、所在学校的贴吧、居住城市的贴吧发言...而知道就更可怕,一定程度上会暴露用户的心路变迁,因为没苦恼谁去知道发问啊。
如果大家想要知道百度都可以展现哪些我们的个人信息,完全可以访问百度,点击贴吧或知道,随便找一个用户的链接点进去...一目了然。当然,在当前这些用户信息显得毫无价值,稍后笔者还会对该问题进行详细的展开。
B:
对B信息的检索,是引发笔者进行这些思考和梳理的最直接的动因。昨日睡前,在手机QQ中的周边的人中看到B拿着手机的照片,感觉手机非常面熟,就发了条消息,接着寒暄了几句。B那空空如也的资料,又激发起了笔者想要了解一下的兴趣。虽然,周边的人你只能通过“名片”查看对方信息,并且选项卡中只有“查看空间,查看微博,详细资料”三个选项卡。但可气的是,虽然咱们可以对空间设置权限,但微博是没有权限设定的,而且获取详细资料的时候,腾讯的码农们将QQ号作为了参数之一(我不明白为什么不加密处理)。那么这里,这里B同学就算是“被暴露”了前面提到的几个标签之一,QQ。可是QQ是个庞大的产品帝国,当前网民哪个没和这个企鹅有着千丝万缕的联系呢?
至此,我们知道,由于我们每个人都有自己常用ID等标签,那么,其实散布的历史信息是可以通过这些标签互相串联起来的。
2.图片搜索
如果说,09年10月时Google推出“相似图片搜索”功能,开启了搜索引擎对多媒体搜索的新纪元的话,那么11年6月时,Goole正式推出图片搜索服务,应该算是多媒体搜索真正进入应用和普及时代。每一次技术的进步,都可能会带给人们对隐私会受到侵犯的担忧。当然,图片搜索只是根据图片的环境特征,如地标性建筑进行最大限度的识别,而人像的识别不在匹配范围之列。但是,在对个人信息进行检索时这是不可或缺的重要参考信息。笔者曾为朋友搜索过其提供的一张图片,当时问我是我当时所在城市的哪所学校,由于记忆中没有类似的建筑,笔者就选择了图片搜索来进行。结果搜到了那张图片是我们小时候一所非常有名气的贵族式私立学校的校园。朋友没说了解我目的,我也没问,他只说了句,“那个校园的孩子家庭条件应都不错吧?”其他不表...
也就是说,我们完全可以依据某人相册中的具有标志性建筑的图片,去确定一个人的活动区域,或者曾经到过某个地方。
3.第三方登录带来的信息聚合
自从facebook有了开放平台,国内业界也有了这样的呼声,一些坐拥大量用户的社交平台逐渐开始开放。更有甚者,discuz并入tencet帝国,那咱们随便在个小站的bbs中的发言,都有可能和我们的QQ产生联系。微博、人人、淘宝等也有同样的功效。因为这些账号之间可能使用的都是同样的id。
4.社交媒体对个人真实经历的曝光
大家使用社交媒体(又称社交网络)的原因可能会有很多,我曾经在一次头脑风暴中进行过简单的梳理,大致的结论是:虽然动因不同,但社交媒体给我们带来的无非是心灵的安慰并填补线下社交的空缺。虽然没有采取网络实名制,但我们使用社交媒体的出发点,大都是进行封闭式,最多也只是半封闭式社交。进而,我们会将自己的真实经历尽数公布在所使用的社交网络上,无论是blog,sns(豆瓣也属于sns),或者是微博,都建议我们补全资料,以找到自己人生中的“过客”。这就带来了一个问题,信息检索者,就可以通过访问被检索者的社交媒体,来获取和分析想要得到的信息。笔者认为无论今后社交媒体朝着怎样的方向发展,私密社交的份额不会减少。那么我们会不断的公布我们的信息,当然,社交产品对权限的控制可能会越来越好。人们也可能会渐渐的熟悉利用产品提供的规则,来保护自己的隐私。实例如下:
A:
前面说,A同学在百度的账户上没有多少信息。但后来,我们彼此交换了QQ之后,笔者通过QQ访问到了A同学的朋友网,那么,SNS上的资料可以说是比较全的了,进而,笔者在搜索引擎中通过已知信息得到了A同学的一份简历,这是相当可怕的,因为很多网站不注意保证用户的隐私,这也是我们用户的悲哀。稍后笔者会讲到如何保护好自己的隐私。简历中自然就获得了A同学的联系方式,其中包括email和mobile,接着以email为关键字,链接到了A同学以为是秘密的blog,笔者对内容并不感兴趣,但是醉心于信息获取的过程。作为一个从业者,我一直知道网络上无秘密可言,而我这A同学,得知被窥探了自己的过往之后,倒没有暴跳如雷,但还是被他认为不该看到该信息的人给看到了,后来做了加密处理,但实际上,在搜索引擎的cache中还是会有内容存在的。
B:
通过B同学的QQ,链接到了他在贴吧的一次发言,是留下mail让网友给其发资料,由此得到B同学的常用ID,进而,weibo,豆瓣等等...交替使用各种标签作为keyword,并对得到的信息分析整理,可以构建B同学整个的性格轮廓,甚至喜欢的美食等等。
其实,对我们信息展现最多的,还是社交媒体,国内类似LinkIn的网站还没有崛起(如,大街等),所以工作经历方面还算是比较安全。这里说到社交网络,不得不说一个业界极富争议的产品,QQ圈子。刚刚推出时,有同仁抛出其会重塑一代人隐私观的言论,笔者不置评。如果单从一个码农的角度来说,这个产品,可以说是将个性化算法和历史数据分析运用到了一个新的高度,研发团队的确是下了功夫的。但是,这个产品会让用户有这么一个感觉:“它怎么啥都知道”。记得当时有朋友如是说到:“在社交媒体上,我有权选择认识谁,更有权选择不被谁认识。”关于QQ圈子,大家可以自行检索资料进行了解。
4.购物网站社交化,所暴露的信息
在这个社交网络的时代,哪家都想借风上位,这不,电商方面也挺热闹。就像google+和facebook,一个是想用社交改变网络,一个是想通过网络改变社交,国内涌现了以淘宝为代表的网商平台社交化,和以蘑菇街为代表的购物分享网站。其实,大家殊途同归,利用用户之间的社交黏性,扩展购物信息传播渠道。
还有一类,就是B2C们,他们当然也想通过吸引用户产生信息来丰富商品的属性。可以说是借鉴的淘宝的购物评价,或者大众点评的点评购物的方式。以当当为例,其采用发表商品评论可以获取积分并兑换购物礼券的激励方式,其他网站大同小异。当当做的比较好的是,其并没有向搜索引擎开放这一部分评论,而360buy就不同,也就是说,通过搜索引擎是可以检索到相应id对应的用户的评论历史的。例如:A同学在360buy购置过墨镜、鞋子等等,B同学在360buy购置过换装品、鼠标等等,通过分析评论,以及所购置物品的品类和频率,甚至能推算出用户的生活习惯。
5.如何保护自己的隐私信息
无论我们情愿不情愿,自己已经在网络上产生了大量的历史信息。有些信息可能是无关紧要的,但有些信息的确有的涉及到了我们的隐私。有的朋友可能认为无所谓,反正自己不会被人肉搜索,而有的朋友可能会非常恼火,认为自己不应该被别人“发现”如此多的信息。笔者认为,无论关注不关注,其实都应该对自己的隐私进行很好的保护,因为,通过网络而影响到自己真实生活的案例比比皆是,一旦出现问题再去补救,那就为时已晚了。
实际上,从源头上讲,就算你很好的进行保护,在网络上几乎没有什么秘密可言,但我们为了防范于未然,还是应该采取一些必要的措施的。挺朋友说,有人为了自己不留下网络痕迹,从不填写任何表单性质的页面,不使用社交媒体。其实,这也大可不必。之前笔者读到过一些保护个人隐私的文字,写的基本都比较到位,这里笔者就不继续罗列内容了,附上链接大家自己去查看吧。
网络时代如何保护自己的隐私 http://www.williamlong.info/archives/1042.html
用搜索引擎时如何保护自己的隐私 http://www.chinaz.com/news/2007/0731/13078.shtml
保护您在互联网上的隐私 http://www.microsoft.com/zh-cn/security/online-privacy/prevent.aspx
网络时代如何保护隐私 http://cn.wsj.com/gb/20110628/atc140512.asp
用搜索引擎时如何保护自己的隐私 http://www.chinaz.com/news/2007/0731/13078.shtml
保护您在互联网上的隐私 http://www.microsoft.com/zh-cn/security/online-privacy/prevent.aspx
网络时代如何保护隐私 http://cn.wsj.com/gb/20110628/atc140512.asp
更多内容,请使用搜索引擎
搜索引擎本身也提供了防止个人信息出现的方法
阻止个人信息在搜索引擎中出现 http://zhanzhang.baidu.com/wiki/24
阻止个人信息出现在Google上 https://support.google.com/webmasters/bin/answer.py?hl=zh-Hans&answer=164133
阻止个人信息出现在Google上 https://support.google.com/webmasters/bin/answer.py?hl=zh-Hans&answer=164133
其实,如何保护隐私这个问题是老生长谈,但还是重新梳理了一下。本来还想说下实名制,真心感觉无意义。只能沦为统治阶级愚弄我等“贱民”的工具。养成保护自己隐私的好习惯,还有一个好处就是防止网络诈骗的出现,大家都清楚网络上利用社交工具进行诈骗,尤其是使用用户的账号对其朋友进行欺诈。虽然我们的防范意识越来越强,但骗子的骗术也越来越高明。真有种“道高一尺魔高一丈”的感觉,一朋友说,“真不知道中国人这么缺钱”。其实不是中国人缺不缺钱的问题,历史和时代的原因太多,不表。
二、结合机器学习,提供更精准的服务
这算是一个引申吧,不是说“大数据”时代要来了么。其实,我们在使用互联网产品时,一定程度的分析我们的历史信息和用户特征,的确能是产品能更好的为我们服务。典型的比如,输入法、购物网站的个性化推荐等。甚至,广告也会根据我们的喜好来投放。业界做的比价好的,就是淘宝的广告,无论你在哪家网站浏览,只要你所使用的设备上登录过自己的账号,那么淘宝就会根据你的购买历史,搜索历史以及用户标签,进行个性化的商品推荐。笔者所在的团队,也在研究广告的精准投放。我们遗留下的这些材料,是所谓“大数据”的组成部分,但希望它们给我们带来的是更多的便利,而不是困扰。就算未来来我们的隐私观真的可能会改变,但当下,在参与社交的同时,也要注意保护好自己。