在中国的互联网检查的一个小书房

写于2009年1月14日,日 Julen Madariaga

最后一个星期日,我做了我在各种不同的想法混合的互联网在中国的审查后,我恐怕最终的结果对搜索引擎检查没有来清除,因为我本来。 我认为这是一个重要的课题,所以这里有完整的结果:

我们将在Google.cn,Google.com和Baidu.com,我们会尽力在他们每3个不同类型的搜索字词。

Chrter 08:在其所有的组合,这是08宪章零八宪章
B超政治方面:天安门事件(天安门六四事件),FLG。
C -粗俗的话:性别。 我将采用“工作博客”和“鸡栏”。

据了解,在所有情况下的搜索字词简体中文。 浏览器是Firefox 3.0.5。 连接是由中国电信一个正常的家庭DSL。 可能的结果是:

  • 免费搜索 -结果一致的和现实的,像在西方获得的。
  • 重置连接(RC) -这只能被看作中国内地。 结果是像下面的一个搜索引擎无法打开了一段时间了(我估计30秒)的形象。 RC是不能直接通过搜索引擎。 维基百科内部搜索也给了乙条款的RCS。
  • 故宫消息(FM) -这是被禁止的消息,有轻微的变化,是相同的,如下所示。 它的行说的话:“有些结果是不显示根据当地的法律,法规和政策”。
  • 操纵的结果(MR) -这是的结果显然是操纵的情况下, 例如在天安门六四事件(天安门事件)在百度,所有的结果是官方报纸,如人民日报等有时搜索也可以进行页面调频。

Google.com
一个免费搜索。 (但是点击一些个别的结果给出的RC)。
B超重置连接
C型操纵的结果。

Google.cn
一个禁留言(*)操纵的结果有时
B超重置连接。
C - 紫禁城消息。 当使用了“操纵结果。

Baidu.com
A -操纵的结果。 当使用了“给故宫消息。
B - FM和操纵的结果。
C - FM和操纵的结果。

结论

1 - 结果都有点飘忽不定,很难看到一个模式:这一切看起来像一系列的补丁比一个系统的实现,而在对方之上。 此外,在时间变化的东西,如*,在那里我看到周日操纵的结果不能被视为了。

2 - 百度有不同的系统:从谷歌,它没有复位连接。 这对百度是非常有利的,我明白这是不公平的竞争,作为一个RC是最糟糕的经验,而冲浪。

: the involvement of the Search Engines in the RC is unclear no direct involvement (even Wikipedia has RCs!) whereas Manipulated Results obviously requires their action, and can more easily attract attention from Advocacy Groups. 3 -这可能由于谷歌的自己的喜好 服务器的位置 :在RC的搜索引擎的参与 不清不直接参与,而操纵的结果(甚至维基百科有乡事!)显然需要他们的行动,并可以更容易吸引从倡导关注组。 当然,在性条款(C)的情况下,这是不是操纵的结果只能说是所谓的“安全搜索”的问题。

4 - Chrter 08有不同的待遇比其他政治方面,但它也可能只是因为它被取缔了紧急和突然,所以它是速战速决添加到现有的结构。 它不会引发任何情况下,RC。 它看起来像他们决定独自离开它在Google.com,以避免西方倡导团体的关注,但在谷歌交换了放弃Google.cn,并适用于臭名昭著的“色情块”,它是由东南积极审查。 为什么FM和非RC? 谁知道,我猜也许RC是更复杂的实施。

5 -在任何情况下,但是负面的,我理解它始终是更好的FM比操纵结果显示,因为前者是公开承认的审查,而后者则是一个谎言和对事实的歪曲故宫消息,但不增加透明度没有理由参与政治审查 从这个角度来看,谷歌比百度更接近真理。 百度似乎确实是一个更积极的参与者,在政府的信息控制计划和百度中国用户显然是最容易受到搜索引擎洗脑。

更新: 由国际专家更正如下: 纳尔特维伦纽夫之后,我已经介绍了我自己的一些变化(蓝色) 在任何情况下,这个职位只是一个很基本的SE检查系统从一个普通用户的角度来看审查。 如果你真的想了解桂枝茯苓丸是如何工作的,你应该阅读,如适当的研究这一个文件,或者这一个。

图片:

1 - 禁止消息(调频)

2 - 重置连接(RC)

注意:如果有人对此感兴趣,或有一些更多的信息共享,请在评论。 不幸的是,我的时间是非常有限的,所以我只跑了2个或3个方面为每个类A,B和C以上。 有可能是我忽略了,我将不胜感激,如果你能点出来的东西。


共享是免费的,支持我的工作

  • Twitter
  • Facebook
  • email
  • Google Bookmarks
  • Digg
  • del.icio.us
  • Haohao
  • StumbleUpon
  • Technorati
  • LinkedIn
  • Netvibes
  • Reddit
  • Posterous
  • Live
  • QQ书签
  • MSN Reporter
  • 豆瓣
  • Yahoo! Buzz
  • MySpace
  • FriendFeed
  • Print



至今评论↓

  1. 一月
    15
    9:26
    下午
    为什么

    你忘了一件事:

    “操纵的结果,我看到周日无法看到了。”

    基于他们的新的颗粒过滤系统,思科感谢您的搜索实际上是建立数据库。 该系统是基于一个Web爬行的方法,也是一个基于用户的查询基础上。

    这是最好的组合,它比上仅依靠网络抓取的快速。

    [ 回复此评论 ]

  2. 一月
    15
    9:44
    下午
    为什么

    我要补充:VPN的监视或篡改。 Witopia对我来说是无法在奥运的日子里。

    该公司拒绝进行深入的讨论关于,但他们清楚地告诉我:中国可能会与VPN的篡改,但他们无法解码(谁知道)... ...

    [ 回复此评论 ]

  3. 一月
    15
    11点29分
    下午
    ULN

    颗粒系统? MHH。 我不知道我理解的概念。 你的意思是从搜索获悉,寻找“宪章”,并找到一个人民日报的结果,因为人们通常不会一下就可以了,然后机器认为无关紧要,它消除了未来搜索?

    [ 回复此评论 ]

  4. 一月
    16
    12时32分
    上午
    fishtanker

    也许PPL有足够的审查将开始使用Freenet的,网页代理,洋葱路由和多P2P程序是一个简单的艰巨的任务,跟踪一切。
    recipy?
    浪费网络+叽叽喳喳+闲聊+ Drupal的/ CMS服务器 - 客户端+电子邮件/即时通讯/ VOIP +洪流stream-server/client +新的DNS表=新的互联网骨干网?

    [ 回复此评论 ]

  5. 一月
    18
    4时50
    下午
    为什么

    @ ULN

    对不起,我的意见是不够清晰。 它基本上意味着数以百万计的人作出的搜索,被封锁的内容数据库。

    我有感觉,他们的系统是基于以下双管齐下的办法:爬行机器人(类似于谷歌)的网站,以拦截攻击性的内容提前+阻断新的内容对他们的“进攻性的条款和文字数据库”为基础,当人们寻找新的链接,他们在北京获得处理。 基本上,任何进入和退出中国的是在北京的服务器上的镜像,然后进行分析(当然automotically在第一和人工操作的潜在广泛,如果需要采取进一步措施)。

    在过去,他们将阻止整个域,但现在他们是能选择性地阻断子域名和一个网站内即使具体环节。 这加强普遍的概念,它“可能只是”一个技术性问题,因为我可以访问其他网站。

    YouTube是一个很好的例子,这种行为。

    [ 回复此评论 ]

  6. 一月
    18
    5:42
    下午
    ULN

    毫米。 有趣,我去观看机器人怪异的访问我的网站上看到,如果我能找到的,这是国务院之一。 如果我知道我的中国共产党好,应​​该很容易识别,这可能是所谓的“GreatWallbot”或“LiberationBot” :)

    回到您的评论:有当局审查内容的许多方面,如你所说,他们有时可以只检查员在博客中的一个职位(这是今天的情况时,我发现其中一个线程在FM的RC块):它是在这里

    但还有一个原因,为什么我没有考虑过这些东西,在我的帖子。 以上的小“学”是只集中于“搜索引擎审查”和这些搜索引擎在何种程度上与检查员合作。 像YouTube和FM的例子,我们在这里给不同的方面,不能被这些网站的所有者或控制的搜索引擎。

    [ 回复此评论 ]

  7. 一月
    19
    1:36
    上午
    为什么

    “但是,为什么我没有考虑过这些东西,在我的文章的一个原因。”

    我的意见是不是评论家,你做了什么有趣的是的。 我只是想扩大它的乐趣的主题有点... ;)

    [ 回复此评论 ]

  8. 一月
    19
    1:45
    上午
    为什么

    当然,所有这些信息是在优秀的文章詹姆斯法洛斯覆盖前一阵子写它。

    [ 回复此评论 ]

  9. 一月
    19
    2:02
    上午
    ULN

    哎呀。 当然,我想我忘了说声谢谢 :)

    是的,我知道,法洛斯文章,它是辉煌的,我已经链接到它最近在另一篇文章。

    [ 回复此评论 ]

  10. 二月
    1
    10:50
    上午
    纳尔特

    你可能会在一份文件中,我写的搜索引擎过滤感兴趣。
    http://ssrn.com/abstract=1157373

    “百度从谷歌不同的系统:它没有复位连接。

    这是因为你没有经过过滤系统(GFW)连接到百度。 如果从中国境外连接到百度,我可以触发的RC。 这也是为什么你的RC连接到Google时。

    区局你是由于过滤(GFW),而不是谷歌(COM)。 Google.cn在中国境内的服务器,但你也可以连接到google.cn在中国境外的服务器。 我觉得最好手动指定IP,这样你知道什么/你在哪里连接到。

    另外,还有一些在搜索引擎结果差异的各种原因,其中之一是抓取的位置 - 如果他们是从中国境内的索引,然后封锁的网站(GFW)没有索引,不需要被审查搜索引擎。

    [ 回复此评论 ]

  11. 二月
    1
    12时57分
    下午
    ULN

    您好,感谢了很多。 我下载你的文件,我觉得非常有帮助。

    我很惊讶这部分虽然您的评论:“这是因为你没有经过过滤系统(GFW)连接到百度。 如果你从中国境外连接到百度,我可以触发的RC。“

    1 - 基本上你说的话是在两个方向上的桂枝茯苓丸?? 因此,它不仅阻止传入的内容,而且还从中国到外的内容。 如果这是真的,钢筋混凝土块,是在中国境内的服务器托管在内容只能被视为从中国境外,反之亦然。 我觉得这是不足为奇的,因为它违背了中国的审查目的:他们想阻止内容显示在中国境内,同时给予外(相对)开放的形象。 你确定这桂枝茯苓丸的双向性?

    2 - 此外,一个相关的问题,你肯定桂枝茯苓丸只适用于过中国大陆边境的内容,所以它只是一个“边境管制”,也封锁内容在中国ciculating,反对。 我怀疑这是真的,是exlplained例如,在著名的
    法洛斯的文章。 但我没有任何证据。

    3 - 由于信息上的爬虫太。 但是我的方法是不同的。 我期待在最终用户端的检查,和我的问题是:什么是谷歌/百度显示用户执行搜索时他们吗? 无论是爬虫/服务器或其他技术原因,谷歌当然知道如何理解和解决的重要的是要找出:搜索引擎是consiously给最终用户操作的信息,“是”或“不。

    在这个意义上说,我发现非常有用的点,在您的关于透明度的纸张,再次感谢您的链接。

    检查还审查其他更全面的后,我写了(下面的链接)。

    [ 回复此评论 ]

你的留言




按钮

8引用/ Pingbacks

  1. 全球之声»中国:互联网审查研究
  2. Chrter 08:找到一个打开链接! | CHINAYOUREN
  3. 中国互联网检查说明| CHINAYOUREN
  4. 中国旅游趋势深远的中国旅游市场网络»博客存档»中国互联网检查说明
  5. 谷歌无视中国检查员| CHINAYOUREN
  6. 中国互联网检查说明| CHINAYOUREN
  7. 谷歌和中国(3):有些更新| CHINAYOUREN
  8. 谷歌的错误离开中国| CHINAYOUREN