中国のインターネット検閲の小さな研究
2009年1月14日にレンマダリアガによって書かれた先週の日曜日、私はさまざまなアイデアで、私は混合中国のインターネット検閲上のポストをしたと私は思っていたとして、検索エンジンの検閲についての最終的な結果が明確に出てきませんでした残念。 私はそれが重要な課題だと思うので、ここで完全な結果は次のとおりです。
私たちはGoogle.cn、Google.comとBaidu.com見され、我々は彼らのそれぞれの検索語の3つの異なる種類にしようとします。
-Chrter 08:08宪章と零八宪章あり、そのすべての組み合わせにおいて、
B-政治用語:天安門事件(天安门六四事件)、FLG。
C-俗単語:セックス。 私は "ブログの仕事"と "チキンバー"を採用します。
それはすべての場合に検索用語を中国語(簡体字)であることを理解されています。 ブラウザはFirefox 3.0.5です。 との接続は中国電信による通常の家庭のDSLです。 可能な結果は次のとおりです。
- 無料の検索 -結果は、西で得られたものと同じように、一貫して現実的に見える。
- これは唯一の中国本土で見ることができます-接続(RC)をリセットします 。 結果は以下のようなイメージであり、検索エンジン(私は30秒を予測するには)しばらくの間はもう開くことはできません。 RCは、直接検索エンジンによって行われていません。 ウィキペディア内部の検索は、B規約のRCSを提供します。
- 禁断のメッセージ(FM) -これは、以下に示すように、わずかな変化で、同じですが、禁じられたメッセージです。 これは、行で何かを言う: "一部の結果が現地の法律、規制、ポリシーに従って表示されません"。
- 操作の結果(MR) -これは天安门六四事件(天安門事件)の検索の例の結果は明らかに操作される場合であり、 すべての結果など人民日報などの公式新聞である百度、等の場合によっては、また、FMページの上に運ぶことができます。
Google.com
フリー検索します。 (しかし、いくつかの個々の結果をクリックしてRCを与える)。
B-接続をリセットする
の結果をC-操作できます。
Google.cn
·紫のメッセージと( 時々 *)を操作の結果
接続B-リセットします。
C-禁断のメッセージ。 使用する場合は ""操ら結果が得られます。
Baidu.com
結果、操作できます。 使用する場合は ""禁じられたメッセージを与える。
B-FM、結果を操作できます。
C-FMと結果を操作した。
結論
- 1の結果はやや不安定であり、それは、パターンを確認することは困難である:それはすべての体系的な実装ではなく、互いの上に一連のパッチのように見えます。 また、物事はどこが日曜日はもう見ることはできません見て操ら結果、*のように、時間に変更します。
2 - BaiduはGoogleから別のシステムがあります:それはリセットの接続がありません。 RCはサーフィンしながら最悪の経験の一つであるように、これは、Baiduのために非常に有利であると私はそれが不公平な競争であることを理解。
: the involvement of the Search Engines in the RC is unclear no direct involvement (even Wikipedia has RCs!) whereas Manipulated Results obviously requires their action, and can more easily attract attention from Advocacy Groups. 3 -これは、Googleの独自のプリファレンス· サーバーの場所が原因であるかもしれません:RCの検索エンジンへの関与は、操作の結果に対し、 直接的な関与が (!でもWikipediaはRCを持っています)、明らかにそれらのアクションを必要とせず、より簡単にアドボカシーからの注目を引き付けることができるかは不明であるグループ。 もちろん、性的な用語の場合には(C)、これは、操作結果は、単に "セーフサーチ"と呼ばれることができるので問題ではありません。
4 - Chrter 08他の政治用語とは異なる治療法を持っていますが、それは緊急に、突然、禁止されたので、それだけかもしれないので、既存の構造に追加された唯一の迅速な修正プログラムです。 それはどのような場合にRCを引き起こすことはありません。 それは西洋の権利擁護団体からの注目を避けるために、Google.com上で単独でそれを残すことにしましたように見えますが、交換するGoogleでSEによる積極的な検閲である Google.cnを放棄し、それに悪名高い"ポルノブロック"を適用しなければならなかった。 なぜ、FMやRCませんか? 知っている人、私は、RCは、実装がより複雑であるかもしれない推測しています。
5 -いずれにせよ、としかし、否定的な、私は前者が公然と検閲を認めるされているため、後者は嘘と現実の歪みであるのに対し、それは、操作の結果よりFM表示するために常により良いであることを理解禁断のメッセージが増加透明をして、まだありません 。 政治的検閲への関与を正当化するものではない 。 このような観点からは、Googleは、Baiduより真実に近い。 Baiduは確かに政府の情報管理方式で、より積極的に参加しているようで、Baiduの中国のユーザーは明らかにほとんどのサーチエンジンの洗脳にさらされています。
UPDATE: 国際的な専門家による修正は、次のNARTビルヌーブ以下:私は(青)私自身のいくつかの変更を導入しています。 いずれにせよ、この記事では、普通のユーザーの観点から、SEの検閲システムの非常に基本的なレビューである。 あなたが本当にGFWの仕組みを理解したい場合は、次のような適切な研究論文を読む必要があり、このいずれか、またはこのいずれか。
。
IMAGES:
1 - FORBIDDENメッセージ(FM)
2 - 接続をリセット(RC)
注:誰かがこのことに興味やコメントに入れてください。共有するいくつかのより詳細な情報を持っている場合。 私はクラスA、Bと、上記のCのそれぞれについて、2つまたは3つの条件を実行したので、残念ながら私の時間は非常に限られている。 そこに私が見落としものかもしれないし、それらを指摘することができます私は感謝するだろう。


















15
PM
あなたは一つのことを忘れてしまった。
"ここで私は日曜日に見た操ら結果はもう見ることはできません。"
彼らの新しい粒状のフィルタリングシステムに基づいて、Ciscoのおかげで、あなたの検索では、実際にデータベースを構築しています。 システムはユーザー·ベースの照会ベースでも、Webクロールのアプローチとに基づいています。
これは最高の組み合わせであり、それだけのWebクロールに依存する上でより高速です。
[ このコメントに返信 ]
15
PM
私は追加する必要があります:VPNのは、監視または改ざんされています。 私にとってWitopiaはオリンピックの時代には使用できなく隣にいた。
会社はそれについて深い議論に従事することを拒否したが、彼らははっきりと私に言った:中国は、VPNの改ざんされるかもしれないが、彼らはそれをデコードすることはできません(誰が知っている)...
[ このコメントに返信 ]
15
PM
粒状のシステム? MHH。 私は概念を理解することを確認していない。 それは検索から学習を意味し、人憲章を検索し、人民日報の結果を見つけることは、通常、それをクリックしていないので、そのマシンは、それが無関係と判断し、次の検索からそれを排除する?
[ このコメントに返信 ]
16
午前
多分十分な検閲でPPLは、Freenetのように、Psiphon、オニオンルーティングと、より多くのP2Pプログラムを使用して開始され、すべてを追跡するだけで骨の折れる作業です。
recipy?
廃棄物のネットワーキング+ツイッター+ジャバー+ Drupalは/ CMSサーバ - クライアント+電子メール/ IM / VOIP +急流+ stream-server/client新しいDNSテーブル=新しいインターネットのバックボーン?
[ このコメントに返信 ]
18
PM
@ ULN
申し訳ありませんが、私のコメントが十分に明確ではありませんでした。 それは基本的に人々が行う検索の百万、ブロックされたコンテンツのデータベースに貢献していることを意味します。
時々、事前に不快な内容を傍受するために、ボット(グーグルに似ている)を使用してWebをクロール+彼らの "不快な用語や単語のデータベース"に基づいて、ブロッキングの新しいコンテンツ:私は、彼らのシステムが次の二重のアプローチに基づいているという感覚を持っている新しいリンクを見つけ、彼らは北京で処理される。 基本的には、中国の内と外に出るものは北京のサーバーにミラーリングされ、その後(automoticallyもちろん、人間のオペレータによる最初の、潜在的に広範囲でのさらなる措置が取られる必要がある場合)を分析。
過去に、彼らはドメイン全体をブロックするだろうが、今、彼らはサブドメインもサイト内の特定のリンクを選択的にブロックすることができます。 これは私がウェブサイトの残りの部分にアクセスすることができますので、技術的な問題 "だけかもしれない"という広範な概念を強化する。
YouTubeはこの動作の非常に良い例です。
[ このコメントに返信 ]
18
PM
mmである。 興味深い、私は国務院の一つである見つけることができますかどうかを確認するために奇妙なもののため私のウェブサイトを訪問するボットを監視するつもりです。 私はよく私のCPCを知っていれば、それは簡単に識別できなければなりません、それはおそらく "GreatWallbot"または "LiberationBot"と呼ばれています
先頭へ戻るあなたのコメントに:そこに当局が内容を検閲することは多くの方法があり、あなたが言うように、彼らは時々だけ(私はFMでのスレッドのうちの1つを見つけたとき、これが今日のケースだったRCブロックを持っていたブログの中で1つのポストを検閲することができ):それはここで 。
しかし、私は私のポストにこれらの事を考慮していない理由があります。 少し上 "研究は"のみ "検索エンジンの検閲"とこれらの検索エンジンが検閲と協力する程度に焦点を当てています。 YoutubeやFMのように我々がここで与えている例では、さまざまな側面であり、これらのサイトの所有者または検索エンジンによって制御することはできません。
[ このコメントに返信 ]
19
午前
"しかし、私はポストにこれらの事を考慮していない理由があります。"
私のコメントは評論家、何をやったことは興味深いではありませんでした。 私はちょうどそれの楽しみのためにテーマにビットを拡大したかった...
[ このコメントに返信 ]
19
午前
そしてもちろん、このすべての情報は、ジェームズ·ファローズはそれについてしばらく前に書いた優れた記事でカバーされています。
[ このコメントに返信 ]
19
午前
おっと。 もちろん、私は感謝を言うのを忘れて推測
はい、私はそのファローズの記事を知っていて、それは素晴らしいですが、私は別の記事で、最近それにリンクされています。
[ このコメントに返信 ]
1
午前
私は検索エンジンのフィルタリングに書いた論文に興味があるかもしれません。
http://ssrn.com/abstract=1157373
"BaiduはGoogleから別のシステムがあります:それはリセットの接続がありません。 "
あなたはフィルタリングシステム(GFW)を通過せずBaidu〔百度〕に接続されているためです。 あなたは中国の外からはBaiduに接続されている場合、私はRCを引き起こすことができます。 Googleに接続するときにRCを得る理由でもあります。
RCのあなたが得るには、フィルタリング(GFW)、Googleではなく(。com)によるものである。 Google.cnは、中国内のサーバを持っていますが、あなたはまた、中国の外にあるサーバーをGoogle.cnのように接続することができます。 私はそれが最高の手動で/あなたがに接続されている場所知っているそのように、IPアドレスを指定するために見つける。
また、クローラの場所です。そのうちの一つの理由の様々な検索エンジンの検索結果の違いは、あります - 彼らは中国の中からインデックスを作成している場合は、[サイト(GFW)ブロックは、索引付けされていないとして検閲する必要はありません検索エンジン。
[ このコメントに返信 ]
1
PM
こんにちは、たくさん感謝します。 私はあなたの論文をダウンロードし、私はそれが非常に役に立つ。
私は非常にかかわらず、あなたのコメントのこの部分に驚いています: "あなたはフィルタリングシステム(GFW)を通過せずBaidu〔百度〕に接続しているためです。 あなたは中国の外からはBaiduに接続されている場合、私はRCを引き起こすことができます。 "
1 - 基本的に何を言っているGFWが両方向で動作することです? だからもないブロックのみを受信したコンテンツが、中国から外に行く内容。 これがtrueの場合、中国内のサーバーでホストされているコンテンツのRCブロックは、中国とviceversa外から見ることができます。 それは中国の検閲の目的が損なわので、私は、これは驚くべき発見:彼らは外に(相対的)開放性のイメージを与えながら、中国の内部表示からコンテンツをブロックしたいと思います。 あなたはGFWのこの双方向性を確信しているんですか?
2 - あなたも、1つの関連質問は、必ずGFWは、中国本土の国境を越えてコンテンツに適用されているので、また、中国内でciculatingコンテンツをブロックするのではなく、それが、唯一の "国境警備"です。 私はこれが本当である疑いがあるとして、有名な例のためにexlplainedです。
ファローズの記事。 しかし、私はすべての証拠を持っていません。
3 - あまりにクローラに関する情報ありがとうございます。 私のアプローチは、しかし異なっています。 私は最終的なユーザーの側からの検閲を見て、私の質問は、次のとおりです。彼らが検索を実行するときにはGoogle / Baiduのユーザーは表示されていますか? それはクローラ/サーバーまたは他の技術的な理由 - Googleは確かにノウハウを理解しなければならないためであるかどうかを解決するために必須では見つけることです:検索エンジンはconsiouslyはいかにかかわらず、最終的なユーザ操作情報を提供しています。
この意味で、私は透明性についての論文で非常に有用な点を発見し、リンクのおかげで再び。
また、私が書いた検閲(下記リンク)上の他のより包括的なポストを確認してください。
[ このコメントに返信 ]