Un pequeño estudio de la censura de Internet en China
Escrito por Julen Madariaga el 14 de enero 2009El domingo pasado hice un post sobre la censura de Internet en China, donde mezclé en varias ideas diferentes y me temo que el resultado final con respecto a la censura del Search Engine no salió tan claro como me hubiera gustado. Creo que es un tema importante, así que aquí están los resultados completos:
Vamos a estar buscando en Google.cn, Google.com y Baidu.com, y vamos a tratar en cada una de ellas 3 tipos diferentes de términos de búsqueda.
Un Chrter-08: En todas sus combinaciones, que son 08宪章y零八宪章
B-políticos Condiciones: incidentes de Tiananmen (天安门六四事件), FLG.
C-vulgares palabras: el sexo. Voy a emplear el "trabajo de blog" y la "barra de pollo".
Se entiende que en todos los casos los términos de búsqueda están en chino simplificado. El navegador es Firefox 3.0.5. y la conexión DSL es normal en casa por parte de China Telecom. Los resultados posibles son:
- Búsqueda libre - Resultados de un aspecto coherente y realista, al igual que los obtenidos en el Oeste.
- Restablecer la conexión (RC) - Esto sólo se puede ver en la China continental. El resultado es una imagen como la de abajo y el motor de búsqueda no puede abrir más de un tiempo (calculo que 30 segundos). RC no se realiza directamente por el motor de búsqueda. Wikipedia búsqueda interna también da a los coordinadores residentes de Términos B.
- Prohibida mensaje (FM) - Este es el mensaje de prohibido que, con ligeras variaciones, es el mismo que se muestra a continuación. Dice algo en las líneas de: "Algunos resultados no se muestran de acuerdo con las leyes locales, reglamentos y políticas".
- Los resultados manipulados (MR) - Este es el caso de que los resultados son, obviamente, manipulado, por ejemplo en la búsqueda de 天安门六四事件(incidente de Tiananmen) en Baidu, donde todos los resultados son los periódicos oficiales, tales como Diario del Pueblo, etc A veces También puede llevar en la parte superior de la página de una FM.
Google.com
Un libre de Búsqueda. (Sin embargo, haga clic en algunos de los resultados individuales da RC).
B-Restablecer la conexión
C-manipulado los resultados.
Google.cn
Un Prohibida-Mensaje y (a veces *) Los resultados manipulados
B-Restablecer la conexión.
C-Prohibida mensaje. Cuando se usa "," da resultados manipulados.
Baidu.com
Un Manipulados por los resultados. Cuando se usa "" da un mensaje de prohibido.
B-FM y manipulada resultados.
C-FM y manipulado los resultados.
Conclusiones
1 - Los resultados son un tanto errática y es difícil ver un patrón: todo se ve como una serie de parches en la parte superior de uno al otro en lugar de una aplicación sistemática. Además, las cosas cambian en el tiempo, como en *, donde el resultado manipulado vi el domingo no puede ser visto nunca más.
2 - Baidu tiene un sistema diferente de Google: no tiene conexiones Reset. Esto es muy ventajoso para Baidu y entiendo que es la competencia desleal, como un RC es una de las peores experiencias, mientras que el surf.
: the involvement of the Search Engines in the RC is unclear no direct involvement (even Wikipedia has RCs!) whereas Manipulated Results obviously requires their action, and can more easily attract attention from Advocacy Groups. 3 - Esto puede ser debido a la propia Google, la ubicación del servidor preferencia: la participación de los motores de búsqueda en la RC no es clara ni la participación directa (aunque Wikipedia tiene CR!), Mientras que los resultados manipulados, obviamente, requiere de su acción, y es más fácil atraer la atención de Defensa Grupos. Por supuesto, en el caso de términos sexuales (C), este no es un problema ya que los resultados manipulados sólo puede ser llamada "búsqueda segura".
4 - El Chrter 08 tiene un tratamiento diferente a otros términos políticos, pero podría ser debido a que fue prohibida con carácter urgente y de repente, por lo que sólo es una solución rápida añadida a la estructura existente. No provoca RC en cualquier caso. Parece que han decidido dejarlo solo en Google.com para evitar la atención de los grupos de defensa occidentales, pero a cambio de que Google ha tenido que renunciar a Google.cn y aplicar el famoso "bloque de la pornografía" a la misma que la censura activa de SE . ¿Por qué la FM y la RC no? Quién sabe, estoy adivinando quizá RC es más complicada de implementar.
5 - En cualquier caso, y negativos sin embargo, entiendo que es siempre mejor para mostrar que la FM resultados manipulados, porque el primero es admitir abiertamente la censura, mientras que el segundo es una mentira y una distorsión de la realidad del mensaje Forbidden hace aumentar la transparencia, sin embargo. no justifica la participación en la censura política. Desde esta perspectiva, Google se acerca más a la verdad que Baidu. Baidu parece realmente un participante más activo en los planes del gobierno de controlar la información, y los usuarios chinos de Baidu son claramente los más expuestos a la búsqueda del motor lavado de cerebro.
ACTUALIZACIÓN: Tras las correcciones de expertos internacionales Nart Villeneuve a continuación: He introducido algunos cambios de mi cuenta (en azul). En cualquier caso, este post es sólo una revisión muy básica del sistema de censura SE desde la perspectiva de un usuario normal. Si realmente quieres entender cómo el GFW trabaja, usted debe leer los documentos adecuados de investigación como este uno, o el uno.
.
IMÁGENES:
1 - PROHIBIDA MENSAJE (FM)
2 - CONEXIÓN RESET (RC)
NOTA: Si alguien está interesado en esto o tiene algo más de información a compartir por favor ponga en los comentarios. Desafortunadamente, mi tiempo es muy limitado por lo que sólo corrió 2 o 3 términos para cada una de las clases A, B y C por encima. Puede haber cosas que me pasan por alto y le agradecería si usted puede señalar.


















15
PM
Se te olvidó una cosa:
"Cuando el resultado manipulado vi el domingo no puede ser visto nunca más."
Sobre la base de su nuevo sistema de filtrado granular, gracias a Cisco, las búsquedas son en realidad la construcción de la base de datos. El sistema se basa en un enfoque de red rastreo y también sobre una base de usuarios investigación basada.
Esta es la mejor combinación y es más rápida que en confiar sólo en búsquedas por Internet.
[ Responder a este comentario ]
15
PM
Debo añadir: VPN también son monitoreados o manipulado. WiTopia para mí era casi inutilizable en los días de los Juegos Olímpicos.
La empresa se negó a participar en un debate profundo al respecto, pero es evidente que me dijo: China podría ser la manipulación de la VPN, pero no puede decodificar (quién sabe) ...
[ Responder a este comentario ]
15
PM
Sistema granular? MHH. No estoy seguro si he entendido el concepto. ¿Quieres decir que aprende de las búsquedas, y ya que las personas en busca de la Carta y la búsqueda de un resultado del Diario del Pueblo no suelen hacer clic en él, la máquina lo considera irrelevante y lo elimina de la búsqueda que viene?
[ Responder a este comentario ]
16
AM
tal vez con la censura lo suficientemente PPL comenzará a usar Freenet, Psiphon, onion routing y muchos más programas p2p para hacer una tarea de enormes proporciones, simplemente para hacer un seguimiento de todo.
recipy?
la creación de redes de residuos + Twitter + jabber + Drupal / CMS servidor-cliente + correo electrónico / IM / VoIP + torrent + stream-server/client nueva tabla de DNS = nueva red troncal de Internet?
[ Responder a este comentario ]
18
PM
@ LSN
Lo siento, mi comentario no fue lo suficientemente claro. Básicamente significa que los millones de búsquedas que las personas hacen, están contribuyendo a la base de datos de contenido bloqueado.
Tengo la sensación de que su sistema se basa en el enfoque dual de lo siguiente: el rastreo de la web con los robots (similar a Google) con el fin de interceptar el contenido ofensivo de antemano + bloqueo de contenido nuevo basado en sus "términos ofensivos y base de datos de palabras" cuando la gente buscar nuevos enlaces y se procesan en Beijing. Básicamente, cualquier cosa que entra y sale de China se refleja en los servidores de Pekín y luego se analiza (automotically, por supuesto, en un primer momento y, potencialmente, ampliamente por un operador humano, si otras medidas es necesario tomar).
En el pasado, que podría bloquear dominios enteros, mientras que ahora son capaces de bloquear de forma selectiva los sub-dominios e incluso enlaces específicos dentro de una web. Esta reforzar la noción generalizada de que "podría ser" un problema técnico, ya que se puede acceder al resto de la página web.
Youtube es un muy buen ejemplo de este comportamiento.
[ Responder a este comentario ]
18
PM
Mm. Interesante, voy a ver a los robots que visitan mi sitio web para los más extraños para ver si puedo averiguar que es el del Consejo de Estado. Si sé que mi CPC así, debería ser fácil de identificar, es probable que llama "GreatWallbot" o "LiberationBot"
Volver a tu comentario: hay muchas maneras de que las autoridades de censurar el contenido, y como usted dice, a veces sólo puede censurar a un puesto dentro de un blog (este fue el caso hoy en día cuando me enteré que uno de los hilos en FM tenía el bloque RC ): es aquí .
Pero hay una razón por la que no han considerado estas cosas en mi puesto. El poco por encima de "estudio" se centra únicamente en la "censura motor de búsqueda" y la medida en que estos motores de búsqueda colaborar con la censura. Los ejemplos que se dan aquí como Youtube y FM son un aspecto diferente, y no puede ser controlada por los propietarios de estos sitios o de los motores de búsqueda.
[ Responder a este comentario ]
19
AM
"Pero hay una razón por la que no han considerado estas cosas en mi puesto."
Mi comentario no era un crítico, lo que ha hecho es interesante. Yo sólo quería ampliar un poco sobre el tema para el gusto de hacerlo ...
[ Responder a este comentario ]
19
AM
Y, por supuesto, toda esta información está cubierta en el excelente artículo de James Fallows escribió hace un tiempo sobre él.
[ Responder a este comentario ]
19
AM
Lo sentimos. Por supuesto, supongo que me olvidé de decir gracias
Sí, ya sé que en el artículo Fallows y es genial, me he vinculado a él recientemente en otro post.
[ Responder a este comentario ]
1
AM
Usted podría estar interesado en un artículo que escribí sobre el filtrado de los motores de búsqueda.
http://ssrn.com/abstract=1157373
"Baidu tiene un sistema diferente de Google: no tiene conexiones Reset. "
Esto se debe a que se está conectando a Baidu sin pasar por el sistema de filtrado (GFW). Si ha conectado a Baidu de fuera de China, que pueden desencadenar la RC. Esto también es por eso que te RC cuando se conecta a Google.
La RC de llegar se deben a la filtración (GFW), no Google (. Com). Google.cn cuenta con servidores dentro de China, pero también se puede conectar al servidor de Google.cn fuera de China. lo encuentro mejor manera de especificar manualmente la IP, de esa manera usted sabe lo que / en el que se está conectando.
Además, existen diferencias en los resultados del motor de búsqueda para una variedad de razones, una de ellas es la ubicación de las orugas - si se la indexación desde el interior de China, a continuación, los sitios bloqueados (GFW) no se indexan y no deben ser censurados por los motores de búsqueda.
[ Responder a este comentario ]
1
PM
Hola, muchas gracias. He descargado el papel y me parece muy útil.
Estoy bastante sorprendido por esta parte de tu comentario sin embargo: "Esto se debe a que se está conectando a Baidu sin pasar por el sistema de filtrado (GFW). Si ha conectado a Baidu de fuera de China, que pueden desencadenar la RC. "
1 - Básicamente lo que está diciendo es que el GFW trabaja en ambas direcciones? Por lo tanto, no sólo impida el contenido entrante, sino también el contenido va desde China hacia el exterior. Si esto es cierto, los bloques RC sobre el contenido que se aloja en un servidor dentro de China sólo puede ser visto desde fuera de China, y viceversa. Me parece sorprendente, ya que contradice el objetivo de la censura china: quieren bloquear el contenido de la muestra dentro de China, mientras que da una imagen de (relativa) apertura hacia el exterior. ¿Está seguro de esta bidireccionalidad de GFW?
2 - Por otra parte, una cuestión relacionada, ¿está usted seguro de GFW SÓLO es aplicable al contenido de cruzar la frontera de la China continental, por lo que es más que un "control fronterizo", en contraposición a los contenidos también el bloqueo de ciculating dentro de China. Sospecho que esto es cierto, como es exlplained por ejemplo, en el famoso
Fallows artículo. Pero no tengo ninguna prueba.
3 - Gracias por la información sobre los rastreadores también. Mi estrategia, sin embargo es diferente. Miro a la censura desde el lado del usuario final, y mi pregunta es: ¿Qué es Google / Baidu mostrando a los usuarios cuando realizan una búsqueda? Ya sea para los rastreadores y los servidores u otras razones técnicas, que Google tiene sin duda el know-how para entender y resolver-lo esencial es descubrir: los motores de búsqueda se consiously dar la información de los usuarios finales manipulado, sí o no.
En este sentido, me ha parecido muy útiles los puntos de su trabajo sobre la transparencia, gracias de nuevo por el enlace.
Compruebe también el otro post más completo sobre la censura que escribí (enlace más abajo).
[ Responder a este comentario ]