Une petite étude de la censure de l'Internet en Chine
Julen Madariaga Écrit par le 14 Janvier, 2009Dimanche dernier, j'ai fait un post sur la censure Internet en Chine où j'ai mélangé dans diverses idées différentes et je crains que le résultat final en ce qui concerne la censure moteur de recherche ne sont pas sortis aussi clair que j'aurais aimé. Je pense que c'est un sujet important, alors voici les résultats complets:
Nous allons examiner Google.cn, Google.com et Baidu.com, et nous allons essayer dans chacun d'eux 3 types de termes de recherche.
Un Chrter-08: Dans toutes ses combinaisons, qui sont 08宪章et零八宪章
B-politique: les incidents de Tiananmen (天安门六四事件), FLG.
C-vulgaires mots: le sexe. Je vais employer le "job blog" et la "barre de poulet".
Il est entendu que dans tous les cas, les termes de recherche sont en chinois simplifié. Le navigateur est Firefox 3.0.5. et la connexion est une normale à domicile DSL par China Telecom. Les résultats possibles sont les suivantes:
- Free Search - Résultats chercher cohérente et réaliste, comme ceux obtenus dans l'Ouest.
- Réinitialiser la connexion (RC) - Ce ne peut être vu en Chine continentale. Le résultat est une image comme celle ci-dessous et le moteur de recherche ne peut pas ouvrir plus pendant un certain temps (j'estime 30 secondes). RC n'est pas directement fait par le moteur de recherche. Wikipedia recherche interne donne aussi CR pour B Conditions.
- Message de Forbidden (FM) - C'est le message interdit que, avec de légères variations, est la même que celle indiquée ci-dessous. Il dit quelque chose dans les lignes de: "Certains résultats ne sont pas affichés en fonction des lois locales, règlements et politiques".
- Résultats manipulées (MR) - ceci est le cas où les résultats sont évidemment manipulé, par exemple dans la recherche de 天安门六四事件(Tiananmen incident) sur Baidu, où tous les résultats sont les journaux officiels tels que Le Quotidien du Peuple, etc Parfois, il peut aussi effectuer le haut de la page un FM.
Google.com
A-gratuit Recherche. (Mais cliquer sur quelques résultats individuels donne RC).
B-réinitialisation de la connexion
C-Résultats Manipulé.
Google.cn
Un message Interdite et (parfois *) Résultats manipulés
B-réinitialisation de la connexion.
C-Interdite message. Lorsqu'il est utilisé "" donne des résultats manipulés.
Baidu.com
A-Manipulé Résultats. Lorsqu'il est utilisé "" donne un message Interdite.
B-FM et manipulé les résultats.
C-FM et manipulé les résultats.
Conclusions
1 - Les résultats sont quelque peu erratique et il est difficile de voir un modèle: tout se passe comme une série de patchs sur le dessus les uns des autres plutôt que d'une mise en œuvre systématique. En outre, les choses changent dans le temps, comme dans *, où le résultat Manipulé j'ai vu dimanche ne peut pas être plus visibles.
2 - Baidu a un système différent de Google: il n'a pas de connexions Réinitialiser. Ceci est très avantageux pour Baidu et je comprends qu'il s'agit de concurrence déloyale, en tant que RC est l'un des pires expériences tout en surfant.
: the involvement of the Search Engines in the RC is unclear no direct involvement (even Wikipedia has RCs!) whereas Manipulated Results obviously requires their action, and can more easily attract attention from Advocacy Groups. 3 - Cela peut être dû à Google emplacement de préférence propre serveur: la participation des moteurs de recherche dans le RC n'est pas clair sans la participation directe (même Wikipedia possède CR!) Alors que les résultats manipulés nécessite évidemment leur action, et peuvent plus facilement attirer l'attention de la défense Groupes. Bien sûr, dans le cas de termes sexuels (C), ce n'est pas un problème tant que les résultats manipulés peuvent être simplement appelé "Safe Search".
4 - Le Chrter 08 a un traitement différent de celui d'autres termes politiques, mais c'est peut-être parce qu'il était interdit de toute urgence et tout à coup, il est donc une solution rapide ajoutée à la structure existante. Il ne provoque pas de RC, en tout cas. On dirait qu'ils ont décidé de le laisser seul sur Google.com afin d'éviter l'attention des groupes de défense occidentaux, mais en échange, Google a dû renoncer à Google.cn et d'appliquer le "bloc porno" infâme qui sont de la censure active par SE . Pourquoi la FM et non RC? Qui sait, je suis peut-être deviner RC est plus compliquée à mettre en œuvre.
5 - Dans tous les cas, et cependant négative, je comprends, il est toujours préférable de montrer que les résultats manipulés FM, parce que le premier est en admettant ouvertement la censure, tandis que le second est un mensonge et une distorsion de la réalité des messages Interdite fait d'accroître la transparence, pour le moment. ne justifie pas la participation à la censure politique. Dans cette perspective, Google est plus proche de la vérité que Baidu. Baidu semble en effet un participant plus actif dans les régimes du gouvernement en matière de contrôle de l'information, et les utilisateurs chinois de Baidu sont clairement les plus exposés à la recherche de lavage de cerveau moteur.
MISE À JOUR: Après corrections par un expert international Nart Villeneuve ci-dessous: J'ai introduit quelques changements de ma propre (en bleu). En tout cas, ce post est juste un examen très basique du système de censure SE du point de vue d'un utilisateur normal. Si vous voulez vraiment comprendre comment fonctionne le GFW, vous devriez lire les documents de recherche appropriés, comme ce une, ou cette personne.
.
IMAGES:
1 - MESSAGE INTERDIT (FM)
2 - CONNEXION RESET (RC)
REMARQUE: Si quelqu'un est intéressé par tel ou possède des informations un peu plus s'il vous plaît de partager le mettre dans les commentaires. Malheureusement, mon temps est très limité et je ne courir que 2 ou 3 termes pour chacune des classes A, B et C ci-dessus. Il pourrait y avoir des choses que je vis à vis et je vous serais reconnaissant si vous pouvez les signaler.


















15
PM
Vous avez oublié une chose:
"Lorsque le résultat Manipulé j'ai vu dimanche ne peut pas être plus visibles."
Sur la base de leur nouveau système de filtrage granulaire, grâce à Cisco, vos recherches sont en train de construire la base de données. Le système est basé sur une approche web ramper et aussi sur une base d'enquête basée sur l'utilisateur.
Il s'agit de la meilleure combinaison et il est plus rapide que sur se fondant uniquement sur exploration du Web.
[ Répondre à ce commentaire ]
15
PM
Je dois ajouter: VPN sont également contrôlées ou altéré. Witopia pour moi était à côté de inutilisable dans les jours qui suivent les Jeux olympiques.
La société a refusé de s'engager dans une discussion approfondie à ce sujet, mais ils m'ont dit clairement: la Chine pourrait être d'interférer avec le VPN, mais ils ne peuvent le décoder (qui sait) ...
[ Répondre à ce commentaire ]
15
PM
Système granulaire? Hmm. Je ne suis pas sûr de bien comprendre le concept. Vous voulez dire qu'il apprend à partir des recherches, et puisque les gens à la recherche de la Charte et de trouver un résultat Quotidien du Peuple ne sont généralement pas cliquer dessus, puis la machine juge qu'il n'est pas pertinent et il élimine de la recherche suivante?
[ Répondre à ce commentaire ]
16
AM
peut-être avec la censure assez ppl va commencer à utiliser Freenet, Psiphon, le routage en oignon et de nombreux programmes plus p2p à faire est une tâche ardue pour suivre tout simplement tout.
recipy?
mise en réseau des déchets + twitter + jabber + Drupal / CMS client-serveur + e-mail / IM / VoIP + torrent + stream-server/client nouvelle DNS table = nouvelle dorsale Internet?
[ Répondre à ce commentaire ]
18
PM
@ ULN
Désolé, mon commentaire n'a pas été assez clair. Cela signifie essentiellement que les millions de recherches que les gens font, contribuent à la base de données de contenu bloqué.
J'ai le sentiment que leur système est basé sur l'approche suivante est double: Crawling le web avec des bots (similaire à Google) afin d'intercepter le contenu offensant à l'avance + blocage de nouveaux contenus en fonction de leurs "termes injurieux et bases de données les mots« lorsque les gens trouver de nouveaux liens et ils se traitées à Beijing. Fondamentalement, tout ce qui entre et sort de la Chine est en miroir sur les serveurs de Pékin, puis analysés (automotically bien sûr dans un premier temps et potentiellement beaucoup par un opérateur humain si des mesures supplémentaires doivent être prises).
Dans le passé, ils bloquent des domaines entiers, mais maintenant ils sont en mesure de bloquer sélectivement les sous-domaines et même des liens spécifiques à l'intérieur d'un site Web. Cette renforcer la notion omniprésente qu'il "pourrait bien être" un problème technique puisque je ne peux accéder au reste du site.
Youtube est un très bon exemple de ce comportement.
[ Répondre à ce commentaire ]
18
PM
Mm. Intéressant, je vais regarder les robots qui visitent mon site web pour ceux bizarres pour voir si je peux trouver qui est le du Conseil d'Etat. Si je sais que mon CPC bien, il devrait être facile à identifier, il est probablement appelé "GreatWallbot" ou "LiberationBot"
Retour à votre commentaire: il existe de nombreuses façons que les autorités censurent le contenu, et comme vous le dites, ils ne peuvent parfois censurer un poste dans un blog (ce fut le cas aujourd'hui lorsque j'ai découvert l'un des fils du FM avait le bloc RC ): il est ici .
Mais il ya une raison pourquoi je n'ai pas pensé à ces choses dans mon post. Le peu au-dessus "étude" est uniquement axé sur "la censure moteur de recherche" et la mesure dans laquelle ces moteurs de recherche collaborent avec les censeurs. Les exemples que nous donnons ici comme Youtube et FM sont un aspect différent, et ne peut pas être contrôlé par les propriétaires de ces sites ou par les moteurs de recherche.
[ Répondre à ce commentaire ]
19
AM
"Mais il ya une raison pourquoi je n'ai pas pensé à ces choses dans mon post."
Mon commentaire n'était pas une critique, ce que vous avez fait est intéressant. Je voulais juste développer un peu sur le sujet pour le plaisir ...
[ Répondre à ce commentaire ]
19
AM
Et bien sûr, toute cette information est couverte dans les jachères d'excellents James article écrit il ya quelque temps à ce sujet.
[ Répondre à ce commentaire ]
19
AM
Oups. Bien sûr, je suppose que j'ai oublié de dire merci
Oui, je sais que l'article Fallows et c'est génial, je l'ai lié à celui récemment dans un autre post.
[ Répondre à ce commentaire ]
1
AM
Vous pourriez être intéressé par un article que j'ai écrit sur le filtrage des moteurs de recherche.
http://ssrn.com/abstract=1157373
"Baidu a un système différent de Google: il n'a pas de connexions Réinitialiser. "
C'est parce que vous vous connectez à Baidu, sans passer par le système de filtrage (GFW). Si vous êtes connecté à Baidu de l'extérieur de la Chine que je peux déclencher la RC. C'est aussi pourquoi vous obtenez RC lors de la connexion à Google.
Le RC de vous sont dus au filtrage (GFW), pas de Google (. Com). Google.cn a des serveurs à l'intérieur de la Chine, mais vous pouvez également vous connecter à Google.cn serveur à l'extérieur de la Chine. je trouve ça mieux de spécifier manuellement l'adresse IP, de cette façon vous savez ce que / où vous vous connectez.
En outre, il existe des différences dans les résultats des moteurs de recherche pour une variété de raisons, dont l'un est le lieu des chenilles - si elles sont l'indexation de l'intérieur de la Chine, puis des sites bloqués (GFW) ne sont pas indexés et n'ont pas besoin d'être censuré par les moteurs de recherche.
[ Répondre à ce commentaire ]
1
PM
Salut, merci beaucoup. J'ai téléchargé votre papier et je trouve cela très utile.
Je suis très surpris par cette partie de votre commentaire si: "C'est parce que vous vous connectez à Baidu, sans passer par le système de filtrage (GFW). Si vous êtes connecté à Baidu de l'extérieur de la Chine que je peux déclencher la RC. "
1 - Fondamentalement, ce que vous dites, c'est que le GFW travaille dans les deux sens? Donc, il ne sont pas seuls les blocs de contenu entrant, mais aussi de contenu allant de la Chine vers l'extérieur. Si cela est vrai, des blocs de RC sur le contenu qui est hébergé dans un serveur au sein de la Chine ne peut être vu de l'extérieur de la Chine, et vice-versa. Je trouve cela étonnant, car elle est contraire au but de la censure chinoise: ils veulent bloquer le contenu de montrer l'intérieur de la Chine, tout en donnant une image de (relative) ouverture vers l'extérieur. Etes-vous sûr de cette bi-directionnalité de GFW?
2 - En outre, une question connexe, êtes-vous sûr GFW est appliqué uniquement au contenu franchissement de la frontière de la Chine continentale, de sorte qu'il est seulement un «contrôle des frontières", par opposition au contenu aussi de bloquer ciculating intérieur de la Chine. Je suppose que c'est vrai, c'est que exlplained par exemple dans le célèbre
Fallows article. Mais je n'ai pas la moindre preuve.
3 - Merci pour l'info sur les chenilles aussi. Mon approche est cependant différente. Je regarde la censure du côté de l'utilisateur final, et ma question est: Qu'est-ce que google / baidu montrant les utilisateurs lorsqu'ils effectuent une recherche? Que ce soit pour les robots ou des serveurs ou d'autres raisons techniques, qui Google a certainement le savoir-faire pour comprendre et résoudre-l'essentiel est de savoir: moteurs de recherche sont consiously donnant l'information finale utilisateur manipulé, oui ou non.
En ce sens, j'ai trouvé très utiles les points dans votre journal au sujet de la transparence, encore merci pour le lien.
Vérifiez également l'autre poste plus complète sur la censure que j'ai écrit (lien ci-dessous).
[ Répondre à ce commentaire ]