“什么”成为敏感词了,求解原因
icarian
1楼 大 中 小 发表于 2009-9-17 19:24 只看该作者
“什么”成为敏感词了,求解原因
【按】这是今早在车上看到的一个帖子,转发在了GFW
Blog上的。一看到“什么”二字我就想起了焦点访谈刚播不久的《六个为什么》,让人意想不到的是,在Google.com上搜索“什么”二字居然会撞墙了,这封锁也太没有逻辑了吧。
更正:将“什么”封锁的原因与《六个为什么》相联系,这纯粹是鄙人一个想当然的臆断,因为鄙人没有搜索到更多的信息加以了解,所以以至于凭借一篇技术文章就确定封锁原因,这是辨别真伪下判断时,相当不好的习惯性思维,据组员yangzhe1990介绍,“什么”二字早在9月初就被阅后即焚、google连坐时封锁了,恩,这里无知了,道歉,声明,但转帖并不是有什么邪恶意图,这里做分享与讨论的由头,按语不删,以作警示。
来源:www.mitbbs.com/article/ChinaNews/31986535_0.html
是的,你没看错,现代汉语中最常用的词语之一”什么”已经成为了新晋GFW关键字。
具体的形式是以”.google.com(*)什么”的形式按URL关键字过滤的。为了打消某些同学对技术的顾虑,我们不妨做如下几个试验:
1.
打开http://www.google.com。请注意一下你的浏览器有没有自动重定向到www.google.cn:因为阉割版的google.cn被视作国内网站,不经过GFW的URL屏蔽的。如果确实被重定向了,请使用http://www.google.com/ncr。好,现在我们已经进入Google主页了。试着随便搜索一个什么东西,比如”test”,你应该能得到正常的搜索结果以确定网络工作正常。接下来我们试着在搜索框中键入神奇的咒语”什么”,点击搜索:这是返回得便不再是正常的搜索结果,而是
“到服务器的连接被重置”之类的。接下来你会发现你甚至无法访问刚才的google.com主页:这就是GFW著名的撞墙后强制眼保健操。别担心,一分半钟后就会恢复的。如果你有听包工具的话,还可以看到大量的伪造RST包向你发来,这就是GFW所为。
我们都是受过正统科学训练的人,为了排除Google本身故障的原因,我们再做如下对照实验。
2.
打开http://www.gnu.org。这是著名的开源组织GNU的首页,教育网的同学注意连接国际网。现在我们试着在网址后面随便敲一些东西,比如http://www.gnu.org/dskjfslkd,这是应该会看到正常的404页面:这里说的正常的404页面是指www.gnu.org本身的404页面,上面有网站自定的信息和管理员联系方式。为了说明GFW的工作方式,我们试着访问http://www.gnu.org/www.facebook.com。因为”www.facebook.com”是GFW的的URL关键字(就是说所有包含www.facebook.com的网址都会被屏蔽,这就是为什么我们上不了facebook的原因之一,也可以用刚才的Google方法来测试),所以连接会被GFW所RST,这是将看不到正常的404页面(取代的是浏览器的错误页面),并且www.gnu.org的主页将会无法访问一分钟,同时可以监听到GFW伪造的RST包。稍等一会,我们等待gnu主页恢复正常试着访问http://www.gnu.org/.google.com什么,你会发现和刚才的症状一模一样:.google.com(*)什么确实是一个GFW的URL关键词。
有好奇的同学会问,你说的关键字中间为什么有一个(*)呢?情况是这样的:原本的GFW的URL屏蔽仅仅屏蔽关键字本身,就是只要包含关键字的网址就会被屏蔽,类似的例子除了上面举的”www.facebook.com”,
“www.twitter.com”还有诸如”www.googlevideo.com”之类的,这些都可以用上面的方法逐一验证。可是通过访问http://www.gnu.org/什么我们可以发现,”什么”这个词本身并不是一个GFW关键字。”什么”仅仅当它和”.google.com”组合在一起的时候才会成为关键词,也就是上面所描述的通配符(*):”.google.com”和”什么”之间有任何东西都会被过滤,也就是不能在google.com中搜索诸如”xx是什么”这样的东西。
这种wildcard matching是GFW的新技术,根据昨晚到现在的观察应该还在技术试验阶段,时而生效时而不生效。下面我们来说说这个新技术为什么可怕。
除了不知道GFW的是什么的同学之外,很多人都对GFW持轻蔑态度,原因是他们认为GFW本身没什么,”我会翻墙,轻松着呢”。但是他们恰恰忘记了,GFW
从来就不是为少数人设计的。只要让大多数不会翻墙或者懒得翻墙或者害怕翻墙的人远离高墙不想让他们看到内容,GFW就成功了。反过来,GFW通过一种不确定、无规章的方式(没有法律条文支持GFW,没有公开国家机关承认GFW,没有公开的关键词列表),让大家生活在一种恐慌之中,慢慢的让每个人习惯于自我审查,在心中构建自己的墙。
而这里的问题在于,如果墙的封锁太过分以至于影响的人们的正常工作学习生活,那么大家不但都会知道墙的存在,还会去试图翻墙,这样GFW就彻底失败了:这样就和拔网线或者变朝鲜没有区别了。绿坝显然是逾越了这一底线,所以大家反映激烈。而最近对
youtube/facebook/twitter等主流国外网站的封锁虽然让大家很难受,但是显然还没有超过阈值。通过之前的事情,我们和他们都发现了由于Gmail、Google
Docs和Google搜索本身在大家生活中的地位,虽然他们无比痛恨Google(因为其自由传播特性和https加密令GFW的全文报文过滤没有用武之地),他们还是不敢冒着民意沸腾的风险全面封锁google.com。而如果有了wildcard
matching这样强大的工具,GFW就可以做到定点清除:仅仅不让你在Google中搜索某些特定关键字,而又不影响Google.com的相对正常使用:比如这个”什么”可能是个测试,将来可能会封禁”.google.com(*)什么 GFW”类似的东西,禁止大家通过Google来了解什么是
GFW。再好比Wikipedia上要好多真理部不喜闻不乐见的条目,而若是断然封禁.wikipeida.org(就像几年前那样),很多通过Wiki
来学术的人(比如刘雨晨)一定会疯掉并且对GFW痛恨至极。而如果有了现在的工具,就可以定点清除wiki中的某些条目(这个工作现在是通过TCP报文全文分析做的,很耗费资源)而不引起过大的民愤了。
总之现在的大众网民就像是被慢慢加热的水煮熟的青蛙一样,慢慢的麻木,慢慢的被控制。
最后,想了解GFW科普基础知识的同学,看这里。https://docs.google.com/fileview?
id=0B_NtN78fpHEtMTNkNzExNTctY2U1ZS00OGI5LTllNzktYjljODZmZmQ2YjEz&hl=zh_CN
--
[ 本帖最后由 icarian 于 2009-10-6 13:40 编辑 ]
Terminusbot 整理,讨论请前往 2049bbs.xyz
a625446312
他为了他的未来,选择了死亡
2楼 大 中 小 发表于 2009-10-5 20:54 只看该作者
学习了
yangzhe1990
3楼 大 中 小 发表于 2009-10-6 00:04 只看该作者
楼主火星得厉害。这跟六个为什么有几毛钱的关系?封什么的时候是在9月初,离你转的时间都过了半个月了。
别把什么都跟政治扯起来,还有你那个贴里面有人名的,我想你也不希望那个人出什么事情吧?
[ 本帖最后由 yangzhe1990 于 2009-10-6 00:06 编辑 ]
马尼超
4楼 大 中 小 发表于 2009-10-6 00:18 只看该作者
那我想问一下
到底为什么封“什么”这个词
Key
FuckBinxing
5楼 大 中 小 发表于 2009-10-6 11:03 只看该作者
为什么 icarian 发表于 2009-9-17 19:24 ,这快二十天了才有个回复。。
言重了,想了很久,根本没有心墙那东西。
icarian
6楼 大 中 小 发表于 2009-10-6 13:23 只看该作者
回复 3楼 yangzhe1990 的话题
我这也是转帖,9月中旬在Greadr看到的一张帖子。那时候正好“六个为什么”,出来了,我也是无意间用google.com搜索“为什么”,出现的结果和这张帖子里说的是一样的情况,那我怎么解释呢?
在搜索引擎上搜索一个词组,会出现触墙的反应,是gfw过度敏感了,还是我过度敏感了。另外,baidu.com上根本不会出现这样的情况,这是不是就说明了百度已经做好了人工干预了。
icarian
7楼 大 中 小 发表于 2009-10-6 13:26 只看该作者
回复 6楼 yangzhe1990 的话题
这词组与一篇文章那个和一个搜索引擎能扯上关系?
小白求解
yangzhe1990
8楼 大 中 小 发表于 2009-10-6 13:27 只看该作者
百度在国内不会被墙
icarian
9楼 大 中 小 发表于 2009-10-6 13:28 只看该作者
回复 5楼 Key 的话题
心墙就在于无论你在什么时候,什么地方发表言论,你都要想一想我的话会不会被别有用心的人拿去利用,或博客会不会遭封。经过这么一道“自我审查”,心墙就建立起来了。
yangzhe1990
10楼 大 中 小 发表于 2009-10-6 13:29 只看该作者
其实你转的贴是我一个同学写的。
但是那个标题以及【按】很不好。
[ 本帖最后由 yangzhe1990 于 2009-10-6 13:31 编辑 ]
icarian
11楼 大 中 小 发表于 2009-10-6 13:29 只看该作者
回复 8楼 yangzhe1990 的话题
人工干预做得好,当然不劳烦gfw动手了。换句哈说,自阉的快,无需旁人动手。
icarian
12楼 大 中 小 发表于 2009-10-6 13:32 只看该作者
回复 10楼 yangzhe1990 的话题
噢。原来如此,那是我下判断太快了,行,我改。不过,“恶毒”二字作何理解呢,意思是我栽赃陷害,别有用心?
yangzhe1990
13楼 大 中 小 发表于 2009-10-6 13:34 只看该作者
我修改了。。。主要是担心同学安全一时之间有点情绪。
yangzhe1990
14楼 大 中 小 发表于 2009-10-6 13:40 只看该作者
回复 9楼 icarian 的话题
心墙这东西要怎么说呢.
说话的目的不是比谁胆大. 不是要被教会烧死. 好汉不吃眼前亏.
icarian
15楼 大 中 小 发表于 2009-10-6 14:04 只看该作者
回复 14楼 yangzhe1990 的话题
恩,你说的对,说话的目的不是比胆大,可现在说出常识一般的话却被封锁的博客不再少数吧,我的意思是每个人不是都要做慷慨激昂状痛斥社会的不公不义,保持一种理性、常识、富于良知的说话状态也不为过吧,现实是,看看何三畏与新浪管理员斗法,我就觉得难过。
gfw的构建确实给受众在浏览信息时,有了一种心理影响,可能用心墙表述这个意思还有点偏,用“把关人”来替代或许会好一些。在那篇“阅后即焚”中,作者隐约间谈到作为“把关人”变异体的gfw,它将意识形态与国家信息安全网络技术范式两者封装得完美无绝,这样毫无重心(我说的是依据何种法律)的封锁就导致了就如同我一般,对于“什么”成为敏感词后,个人感受到的错愕与不解,继而会将一篇技术文章错认为解释它被封锁的原因。我这样的表现应该是一个受害者吧
智商六十
有点傻,待启蒙
16楼 大 中 小 发表于 2009-10-6 20:07 只看该作者
回复 1楼 icarian 的话题
主帖最后的网址不可上,被墙
sixapostle
闷骚男 我们不要一个被科学游戏污染的天空 我们不要一个被现实生活超越的时空 我们不要一个越来越远模糊的水平线 我们不要一个越来越近沉默的春天
我们不要被你们发明变成电脑儿童 我们不要被你们忘怀变成钥匙儿童
17楼 大 中 小 发表于 2009-10-7 11:05 只看该作者
引用:
原帖由 智商六十 于 2009-10-6 20:07 发表
主帖最后的网址不可上,被墙
得全部复制下来粘贴到地址栏,链接没有显示全
skyking0752
18楼 大 中 小 发表于 2009-10-7 12:44 只看该作者
可以看,不过有点慢
Aresius
寂寞组。
19楼 大 中 小 发表于 2009-10-7 22:03 只看该作者
恩 同问
楼下是坏人
20楼 大 中 小 发表于 2009-10-9 16:54 只看该作者
说得好,草泥马们不断的转帖,发帖,被和谐,就是为了让心墙这东西建不起来
蛋美
西北草泥马一只
21楼 大 中 小 发表于 2009-10-10 09:21 只看该作者
纳尼???
引心公子
方鸿渐二世
22楼 大 中 小 发表于 2009-10-14 21:52 只看该作者
边沁的监狱
tangooricha
23楼 大 中 小 发表于 2009-10-26 22:25 只看该作者
文末连接的这篇文章没有能够作为小论文发表在正式的地方吧?