现在...按标签浏览

语言星期四:解析中国1.0

2010年5月7日,星期五,

canadagoose_300_tcm9139738_thumb3444

我飞回重庆最近,当我阅读中国非常令人沮丧的问题提醒。 有一个机舱电视上的电影,它有一个特殊性:它进行字幕的中文和英文并行,两线相若的字体在屏幕的底部,。

当我看到我一直强迫我的眼睛中文字幕坚持以行使我的阅读(声音),但它是毫无意义的。 之前,我已经读完了中国每一次,我已经知道该行的含义反正。 英语的话,似乎传递自己的意思, 即使我不看他们。

阅读中国

我们已经谈到,去年有关的问题, 读“中国功能。 它是先进的中国学生非常重要,因为超过一定程度的进展,在很大程度上取决于这种能力。 许多外国人都能够读取缓慢,甚至做光标字典的帮助下,与中国文字的翻译。 读取功能, 在我的定义 ,是一个完全不同的事情。 这意味着能够阅读各种快速和可靠的平均本地一般文本。 点击继续»

卖抠和天涯论坛的经验

星期一,5月3日,2010

SP32-20100503-124440 下面是分析我们的朋友在天涯BBS迈克尔的命运后,我答应。 迈克尔(卖抠)是我写了上周的中国小故事中的主角。 不是我写的故事,特别是为这一目的,但一旦它在那里,我认为这将是一个好主意, 它转贴到中国的BBS论坛。 这里我的大多数读者是不是中国的扬声器,和我很好奇,看看它是如何在当地人的表现。

我们中的许多人参观像天涯或拖把的论坛,读最热门的话题,是中国互联网趋势的感觉。 然而,我们通常不采取积极的作用,至少我从未尝试过发布之前。 这与迈克尔的经验告诉我一些事情,这些论坛的工作,并在特定的一个最大的,天涯。 我知道有许多人有兴趣在此,所以这里是我注意到您的信息点: 点击继续»

语言周四:上海写作

2010年4月30日,星期五,

canadagoose_300_tcm9139738_thumb3444

这个星期,我很少有时间做语言后,部分原因是因为我一直忙着写一个简短的故事 ,一方面是因为我已经讨论了有关在其他博客的语言很好的协议。 我利用这一点,跟我在上海最后的意见后,我们上了长时间的讨论后, 吴博客

讨论开始对语言学习网站无关的评论。 但真的让我热起来是痛苦地意识到,许多上海扬声器 - 或者更确切地说吴扬声器 - 不仅不保护自己的美丽的语言,但它们实际上是积极纯粹的无知摧毁其深厚的文化底蕴。

如果你已经阅读我一会儿,你可能知道,我觉得很强烈的有关语言,特别是关于消失的。 也许部分原因是,我从一个文化的地方,我们花了相当数量的资源,以促进少数民族语言,这么小的和无用的,它有大约1%的上海扬声器。 也许是愚蠢的,但它是我们的语言。 点击继续»

译不达意:语言戏剧2行为

2010年4月29日,星期四,

这是我第一次在中国的短篇小说。 标题是“迷失东京”,它说明了糟糕的普通话发音的潜在后果。 如果你不读中国,我在评论中留下一个小的总结,或者用G翻译得到增强的体验[ 1 ]。

UPDATE:我转贴在天涯给它一些中国读者之间的空气的时间。 后,现在已经稳定在3000左右的读取和50个意见,我不认为它会走得更远。 这是一个很好的实验,在中国BBS传播,我会尽快分析结果。

译不达意

帮助迷失于中文中的老外找回爱之路

还说他一个人。无友可靠!

我马上回邮请他来上海我家住几天,看看能不能帮助他。

继续»


注意事项:
  1. 也就是说,您将失去在翻译迷失东京[ ]

语言星期四:标点符号地狱

2010年4月23日,星期五,

canadagoose_300_tcm9139738_thumb344 今天我只想评论中文标点符号的神秘世界。 这是迷人的领域,在这些时候,大家指责的中国歧视外国符号。 事实上,有一个外国符号,在现代中国几乎每一句话:“点,逗号,其余所有的标点符号标志。

在任何语言是很自然的,当中国决定采取这些迹象,以澄清自己的脚本,他们为使用他们自己的规则。 有标点符号的例子很多,显然是在中国和西方语言相同,但实际上有不同的含义和用途。 这是不是该职位的主要点,但我会稍微停止,我觉得很有趣的例子之一。

叹息大关

出于某种原因,感叹号了对中国翻译成叹号,就是叹标志,在西方被称为()。 此叹字符最常用的今天在叹气表达,其含义是惊呼叹息喝彩 ​​。 我的理论是,这是谁写的每第二句“!”标志的中国网民的背后,怪癖的原因。 继续»

周末的照片:星级考试

2010年4月20日,星期二,

星期六有一些惊人的运动在路上。 开始清晨群众集中的路口附近的不明身份的人士,部分阻断了交通。 他们明显紧张,但他们的表现是坚定的,明确他们为了稳住了阵脚。 他们一直有近2个小时,当我到达相机。

IMG_2477-1

当我走近时,我看到他们的父母,等待他们的孩子。 这是“ 上海城市公共英语儿童星级水平考试 ”,在小学的儿童(6-11岁)的官方认证的英语水平。 从我的理解,它是由一些局的许多私营公司之一的上海城举办。 在恒星水平:一星级,二星级,三星级,考试强调口语交际。 点击继续»

语言星期四:语言保护主义

周四,4月8日,2010

canadagoose_300_tcm9139738_thumb34 在本周的语言后,我想谈谈语言保护主义。 我不知道这是我要找的字,但如果你已经按照过去几周的博客,你可能知道我的意思。 这一切都始于上个月,这项建议禁止从媒体的英语单词,以维护“中国语言的纯洁性”。 现在看起来,当局已采取认真,昨天的电视频道正式通知新的语言政策。

我, 语言学家网站的博客,其中包括一些受人尊敬的意见,取得了大量的噪音,没有理由的。 或者说,原因有两个:一个是中国搞乱了他们的PR(“纯洁”字是在文化方面,特别是不错的选择)的老问题。 另一种是中国博客现场绝大多数是美国,这是美国人很难理解的语言殖民化的问题。

我是一个大的开放性和灵活性的英语崇拜者。 喜欢阅读博客的语言登录我学到了,欣赏descriptivist语言学的方法(学习一门语言如何,而不是妄图支配应该如何),我相信这种放任的态度,有助于使英国最富有的语言世界。 点击继续»

语言星期四:神圣的分数

2010年3月25日,星期四,

canada-goose_300_tcm9-139738

这是在我的博客的新功能。 它是后续的初始语言和文化的职位,去年,我从现在承诺继续系列,每星期四,我觉得它。 这个想法是张贴有关这些语言的好奇心,我在我的普通话学习中遇到和我抄下,直接在我的书桌。

专业人士喜欢你找到语言日志中要标记之间的语言学家和通晓数种语言的差异,我完全同意。 虽然我是一个语言学,尤其是那些描述类的风扇,我从来没有学过认真的纪律,我不能告诉介词从palmiped。 我只是一个奇怪的语言学习者,我会坚持我所知道的。

阻碍这一思想,我一会儿从语言编写的,考虑了丰富的选择语言学家 博客已经可用。 但转念一想,有一定程度的权利之间的人类学和语言学,空间开阔非专家猜测,生活在语文学习是正规培训的重要。

我指的是语言和文化如何相互影响的观察,和一定的性格和对世界的看法如何进入印的语言,遥远的过去形成化石的过程正在进行即使在今天 这是点的语言和文化系列,其中包括以上问题的答案。 下面是一个例子: 点击继续»

中国破坏哥本哈根协议?

2009年12月29日(星期二)

哥本哈根峰会激发了一些媒体的激烈辩论,大部分更相关,而不是气候变化的国际政治。 其次是像一些壮观的作品马克·莱纳斯的 “卫报”上已较为温和的意见,像那些出现在单位“由内而外 ,试图了解中国和美国在这件事情的角色。

但是我就这个问题,最好的信息,周围仍是要在发现上海废钢博客的 他提醒我们,气候变化是不是也不可能是为政府和中国人民今天的首要任务。 这是一个“小区”的关注,完全是外国那些仍然令人担忧,是否他们的饮用水中含有的铅,或是否他们将需要一个防毒面具,呼吸北京的空气明天。

但回到这个问题:中国是否真的破坏哥本哈根协议? 换句话说,是真的有准备签署一项协议,中国出人意料地拒绝了,破坏西方世界的奥巴马总统领导的英勇努力?

到底发生了什么在哥本哈根

你有没有注意到,当有一些非常重要的股权,政府组织首脑会议尽可能小,以得到一个有意义的协议,他们只能勉强接受在G组的新的参与者? 气候首脑会议则正好相反,每个人都被邀请,碳足迹,越多越好。 已成为世界多边今天...尤其是当多边主义是在我们自己的利益。

气候变化,始终是一个伟大的政治课题,因为在谈判中的成功或失败所产生的问题将不会被认为在政治生活中的主角。 这是一个真正成功的唯一措施是国内公众的看法,会议结束后立即对这些科目。 和聪明的政治家,不要让机会通过编造一个好故事。

对奥巴马政府的谈判目标可以概括为:确保签署的协议是毫无意义的,足以造成工业大堂的小问题,足够强大的气候变化爱好者满意。 因为这显然是不可能的,有是一个B计划:确保无论发生任何事,这是别人的错。 这是在中国做一个优秀的合作伙伴。

部分为给在上海废钢职位的原因,部分是因为它不是一个民主国家,它可以控制内部的信息流通,中国是哥本哈根游戏比奥巴马少得多担心。 免费的内部压力,面临着非常温和的国际压力,中国领导人将在逻辑上拒绝任何协议,涉及到他们的国家牺牲。 他们也将忽视在国际媒体的语言给一个连贯的解释,提供了后哥本哈根指责的宏伟目标。

现在,我知道奥巴马的大使是不是在中国不是一个专家 ,但我不能相信他是如此无能无视上述事实。 奥巴马本人在一个月前,在中国,它是不可能的,他不知道明显的,中国永远不会签署一项协议,迫使她接受访问几乎每一个战略性产业的国际核查,并与电力暴露在世界和中国公众所有的中国的制度弱点。

我不会去说,中国和美国的立场是奥巴马和胡锦涛之间的预先安排,但我认为美国代表团到中国访问,期间和之后已经比大多数观察家所想象的更聪明。

自从“京都时代,美国是在头邪恶的碳排放。 奥巴马与他的前任不同,此刻他已经创造了一个奇迹:美国不作出任何重大让步的情况下,现在已成为气候变化政策的世界冠军。

与此同时,欧盟国家中,只有采取这种气候变化的东西,认真,再次被推到背景,因为他们缺乏可信的领导和奥巴马,聪明的美国人,已经为自己和最他的国家。

在此期间,气候正在发生变化......

我已经在媒体上读到的哥本哈根首脑会议后的最有趣的指责之一是,中国已经签署了一项协议,限制自己的排放量,防止发达国家。 这是愚蠢的,它可以使其成中国每日头条。 中国怎样才能防止美国/欧盟/日本从它们之间签署的一项协议,以减少自己的排放量?

,认真,如果我们要采取行动对付气候变化,我会建议:发达国家之间达成一项协议,就像我们做了这么多以前的事情,并付诸实践,即使没有中国呢?

是的,我知道,使有效减碳,所有国家都应该参与。 但同样可以说,关贸总协定/世贸组织和许多其他交易时,这并没有阻止我们从签约,并推入中国要晚得多。 一旦发达的世界是统一的,它总是要容易得多游说方面的一些标准,或不符合国家实施制裁。

但为什么做这一切时,很容易用更少的公共内容?

中国和互联网的世界地图

2009年12月4日,星期五,

我昨晚摆弄一些统计数据,考虑到中国互联网心胸狭窄 ,我们一直在讨论最近的奇怪的想法。 表达本身就是奇怪,因为“互联网”和“与世隔绝”,形成一个矛盾,但你很难注意到这些东西,当你住在这里。 它是土地在社会主义市场经济的正常程序。

不管我们作出的短语,事实是,它每次,无论是讲语言传媒政治 ,一切似乎都指向这个方向。 下面的图片是我尝试画一个互联网的世界地图来说明这个岛国,从网站上使用互联网世界统计数据。

这里是我:我与所有国家的统计,超过10万互联网用户,这使得在总共32从中国到摩洛哥的第一个想法。 然后我做了一个Excel图表,每个气泡的面积比例到该国的互联网用户,关键的是,我充满了矩阵码的​​气泡。 结果:世界地图的矩阵:

SP32-20091204-143947

互联网矩阵的世界地图

在上面的地图中的一个有趣的事情是,亚洲已经是世界上最大的互联网领域。 惊人的,但不是真的,毕竟,它拥有迄今为止世界上人口最多。 这是没有什么比什么来:互联网与中国和印度的增长将是在未来几年亚洲联合。 没有他们,没有命中,将真正全球净。 到现在为止,在网络上的大多数人都从现在大多数发达国家,将来自发展中国家。 我们的社会之间的密切联系,将有在线和离线的重要后果。 也就是说,假如我们真的管理连接。

但是,当我们谈到互联网,它并不太大的意义来看待政治的界限。 有没有这样的边境控制线上,真正团结或分裂人民是文化的东西。 最重要的参数是一个特别的语言:不管你的国籍,作为一个用户定义你的语言你上网,这是为什么我的浏览习惯,更喜欢这个看起来Blogger的不是像有人在我的国家的原因: ESWN,我有完全不同的背景,但我们有共同的冲浪语言。

所以我抬起头来的统计,在互联网上最常用的语言,从英语到韩国10。 这一次,我彩色的气泡与标志,我把他们大约在他们的发言者的社会重心的中心。 结果是地图冲浪语言:

SP32-20091204-151433

冲浪语言的世界地图

尽管如此,地图不是很大。 许多扬声器在庞大的英语泡沫实际上是印度人,西班牙应该是在美国和欧洲,和澳大利亚是完全出来的照片。 物理距离有没有净的意思,甚至比政治界限。 它变得清晰,地理是我的目的没有多大用处,所以我们不妨转储GMaps实现和坚持气泡。

我的新图看起来像这样,在所有主要的互联网社区的代表一起在云。 我们都是相互关联的,只有坚实的区别是语言。 两个人共享一个爱好,喜欢足球,但他们不走相同的网站,如果他们在不同的语言上网。 媒体和互联网上的资源大部分都没有翻译成其他语言,而是重新编写和重新诠释,由当地部落客/记者,社区之间的边界控制功能。

image022

改进互联网的云世界地图:

我们在云中看到的事情之一是,所有的社区都互相接触。 但我恐怕这不是一个非常精确的图片。 通常俄罗斯不翻译日本的内容,也没有葡萄牙语翻译阿拉伯语。 英语有今天在互联网上的重要作用,因为在大多数情况下,它是通过英语,其余的语言沟通:大多数内容是英语翻译第一,并从那里向其他社区。 英语的泡沫,包括来自世界各地的用户,是互联网的中心。

云的另一个问题是,它显示了所有同样互联社区,这是不太现实的。 谁讲欧洲语言的用户更容易阅读英文。 西班牙社会,例如,包括许多美国人许多他们自己的语言上网的英文网站。 其实,大部分的语言泡沫的与英文泡沫像素的重要组成部分,所以我们可以维恩图的排序为代表的地图:

SP32-20091204-184148

第二次迭代:维恩图地图

我们看到从上一个新的地图是非常不同的。 现在有一个共享的内容很多西方语言与英语,更多的语言,分享了一下,俄语和阿拉伯语,然后三种语言,形成了今日亚洲互联网的核心集群:中国,韩国和日本。 和你可能已经注意到,我得出中国在其余的距离。

由于种种原因,我们将看到,中国人不使用Facebook或Twitter的,或YouTube或MySpace,或eBay。 他们不读Boing Boing“ 赫芬邮报“ ,他们在自己的QQ聊天室聊天。 他们很少收到,我们收到的病毒邮件,反而得到一个和别人一样。 他们所有的事情,我们有一些,但他们建立了他们对互联网的独立包裹并行。

而基于以上的气泡的大小是由一个受人尊敬的收集定量数据 ,位置才决定由半知情的感觉。 任何读者可能会说,中国不应该是迄今为止对。 有香港,华裔美国人,甚至中国大陆做英语冲浪。 ,我将被迫承认的维恩图是有缺陷的,因为它未能证明了这一点。

但是,在这样一个像互联网世界瞬息万变,位置真的没什么意思。 今天举行的明天可能会有所不同。 什么是真正重要的是动态的方向是中国,以及如何将在10年的上网查查? 大家都同意,中国互联网社区发展非常迅速,这是自然的。 令人担忧的部分是,它也可能被移动从休息。

image3

第三次迭代:动态地图

因为在西方国家的互联网普及率已经非常高,印度仍然处于滞后状态,在未来10年中国互联网将成为大几乎所有的休息起来。 如果继续偏离,它可能会成长为一个平行的网络,像月亮黑暗的一面,一个巨大的,自给自足的岛屿,政府可以随时切出,里面大多数人甚至没有注意到其中的差别。 这违背了整个构思的www。

不管问题的真实规模,这是大多数观察家认为是中国和互联网的其余部分之间的断开连接 ,并有强大的力量,拉他们远一点。 幸运的是,也有力量平衡,并在未来数年的结果将在很大程度上取决于这些因素如何发挥互相对抗。 这里是我的新的地图现在看起来如何: image4

互联网的力量

正如我们所看到的这个博客之前,一些主要因素,使从中国独立的世界有以下几种,在图表中红色所示:

  • 语言 ,因为我们在此看到 ,我们证明了中国的语言是美丽和独特的,在许多方面,但它使中国人与外国人连接,它很难。
  • 文化 ,在广义上的字,这意味着社区有不同的看法和价值观,他们无法理解彼此。 这包括与媒体的问题。
  • 政治 ,多种形式,包括保姆,中国长城防火墙(GFW),直接抓人,中共的蓄意行动,因为我们看到这里

在绿色的主要因素,在向相反的方向去。 在这里,他们在细节上,乐观欢喜​​:

  • 越来越多的桥梁, 博客和其他互联网使用,连接两个社区的工作。 这些措施包括不仅英语Chinablogs,但主要是中国人的翻译对中国互联网的外国媒体和其他内容。 从这个不起眼的博客,我也做了我对桂枝茯苓丸位
  • 后的90年代和80年代的一代,已经占主导地位的中国互联网。 他们的个人品味艺术,音乐或电影可能会更加国际化,并推动他们与世界接轨。 这一点是辩论的对象,不过,一些西方人是非常怀疑的80后。
  • 业务是连结中国走向世界的最重要因素之一。 由于欧盟的建设,这是没有任何秘密,电子商务可以实现世界和平的最雄心勃勃的目标,所以不管你的起飞是对那些经营头脑的中国人 ,他 ​​们很可能是主力仍保持连接中国的岛屿和控股万维网一起。

你觉得呢? 你有什么想法?

你觉得我夸张? 或者是问题甚至比这更糟的吗? 任何因素,我错过了在互联网地图? 上网的朋友:你是彩色气泡内的像素,你对这个世界知道,因为它是你的家:评论和帮助我提高我的地图!

中国最困难的...(3)

2009年11月24日,星期二,

在本系列的前两个 员额 ,我们看到,中国是世界的语言保持了一套完整独立的词汇根和非代表他们的语音脚本,我们可以称之为一个单独的词系统。 出于这个原因,我认为,中国可能是最困难的语言得到充分的流畅性,无论对学生的语言背景。

但也有比单纯的语言的困难,特别是文化和政治的,更有趣的问题。 因为拒绝使用贷款和语音脚本是有意识的决策结果。 的确,有没有在语言本身,禁止进口的外来词或一个字母使用,有目前使用中的直接贷款,写拉丁字母,如DVDKTV已经有一些例外。

中国有来自世界各地不同的并行的Word系统,以及政府在维护本系统有积极的作用。 然而,这项政策是不会单方面强加以上。 它肯定是鼓励教育系统,但中国的扬声器似乎遵循自然,往往喜欢的中国根,即使没有监督。 这是在与系统的尝试,以保护当地的条件,才发现,人们还是喜欢“电子邮件”,“快递ELECTRONIQUE”在许多国家的情况相反。

人居住在中国有着悠久的足够认识到作为一个不同的文明,如何知道中国是其悠久的历史和自己的状态。 这种话语是对西方人的刺激性,因为它提醒太多极端民族主义的信条回家。 但它有一个与那些信仰的本质区别:在中国的情况,这是事实。 正如我们之前所说的 ,中国是有道理的,看到自己作为一个文明的摇篮,它是从世界的主流,直到近代几乎独立生存,只有这样的文化。 这种文化意识的主要原因是为保存语言,因为我们知道,幸存的不同的制度,甚至混乱的时期。

当我们研究中国,我们不只是学习另一种语言,我们是一个平行世界的话,词汇的最后一个独立的系统学习和写作,人类仍然有。 这是最类似地球上的另一个星球的语言学习经验。 如果中国确实是这样努力地学习,这应提供足够的动力,任何人尝试它。

政治上的考虑

普通话本身并不是一个非常困难的语言,是什么使得它很难是其复杂的Word系统,这是没有必要的大部分(即语言可能仍然存在贷款和一个字母)。 该系统使得它很难外国人和中国沟通,这是中国教育的一个严重障碍。 在上个世纪的发展,一直是中国的主要优先事项,以恢复她昔日的辉煌,已拆除低效的文物,无闪烁,就像北京的城墙,。 中国的词和字符,最后以保持这些阻塞的纪念碑,是迄今为止最古老的所有。 这是一个奇迹,他们已经存活直到今天。

字符的未来似乎更安全方便的方法,在键盘上输入字符的发明,但他们的持久性是没有保证的手段。 许多著名的语言学家认为拼音作为主要书面语言和消除人物的日常生活,而不是鲁迅,或已故的约翰·弗朗西斯至少使用。 虽然我很佩服这些人,他们的工作,我完全反对他们的位置作为一个原则问题。 我不认为任何人都不会相信我在这个年龄的经济学家,甚至在新中国哲学 ,但我必须这样说的:效率是不是最高值。 事实上,它甚至不是在本身的价值,但只是一种手段。 和悲伤的手段将是恢复中国的伟大,如果有留下什么恢复。

我认为这是明确的大多数中国人的今天,他们的话语系统是太珍贵了,为了提高效率,放弃它。 然而,一些合理的让步,可这可能确保系统的长期生存。 In particular, the acceptance of foreign loans for new technical words might facilitate the access of Chinese to foreign research and the incorporation of foreign talents when the real Chinese brain-drain starts in earnest. The complete acceptance of latin script to represent phonetically foreign Proper Nouns (which is already used informally) would also be a step towards efficiency without sacrificing the heart of the system, and would be of great help for all the Chinese trying to learn English.

Apart from the practical issues considered, no less important is the mentality underlying the Chinese Word System. The growing common vocabulary in all the languages in the World represents the recognition by most cultures that there is a large part of common human culture, and that, since this part is only going to become larger with the progress of technology, the sensible solution is to adopt a common language to communicate it. By deciding to stay apart from this system, the linguistic choice of China represents a stance opposed to the rest of the World, and in a certain way it perpetuates the traditional isolation of the Middle Kingdom even in the age of Global interconnection. The insularity of the Chinese internet community and the misunderstandings between cultures that have arisen from it are, to some extent, a consequence of this choice.

The part played by the language in China's relations with the World is probably not of the first importance. But even today this part is not negligible, and with the advances in communications, nobody knows how vital it will become in the future. Ultimately, it is only up to the Chinese to decide what language they want for themselves. We can only wait and see, and hope that they find a way to stay connected with us, while preserving their unique heritage of Words.

Chinese most Difficult Language in the World (2)

Monday, November 23rd, 2009

Last Friday I wrote a very long post where I ended up including too many ideas. The main point got a bit obscured as a result, but it was simply this: that vocabulary plays an essential role in learning a language, and that because of this Chinese is not only extremely difficult at an advanced level, but also growing more difficult with time.

I don't suppose this is groundbreaking research, but it is interesting because most people are not aware of it, and also for its implications in the limit betwen language and politics, two fields we like to cultivate in this blog. Here is the argument in full with conclusions, for examples and details see the previous post and its comments:

  • To learn a new language the main knowledge required is in three areas: grammar, phonetics and vocabulary. Grammar and phonetics differ essentially from vocabulary in that the first two are rules applicable to infinite cases, whereas the latter is raw data. We can call them the Code and the Data elements of the language. The Code elements are finite and not growing. The Data element is practically infinite and growing, to the point that it is not completely mastered even by native speakers.
  • When studying a language, the Code elements play an essential role in the basic and intermediate levels , but at advanced level the real obstacle for communication—and therefore for progress—is Data. For example, in German advanced students may sometimes use the wrong declension, and in Spanish they may fail to differentiate “rr/r”sounds. These things tend to not hamper communication because human languages are highly redundant. I would never understand “pero” (but) when a speaker says “perro”(dog). Ultimately, imperfections in the Code elements amount to the same as having an accent: most of the times they are only relevant as metadata.
  • But while Code above a certain level is highly redundant, Data remains essential at every level. Borrowing from this great article : The phrase “Jacuzzi is found effective in treating Phlebitis”is meaningless when either or both of the nouns are unknown. A single missing word can often obscure the meaning of a whole paragraph or article.
  • The number of words used passively in real life far exceeds the typical standard lists of language levels. This is because semi-specialized words—such as ionic , j acuzzi or matrix— are not included in vocabulary lists as they are considered too rare. Certainly each of these words is rarely used, but there are so many of them that as a whole they are actually very often used. This Data element is so large that it cannot be memorized in a classroom, and the only way to acquire it is through many years of immersion.
  • The reason why most language learners never realize this problem is because they are “cheating”. In most languages in the World, this high level vocabulary is practically identical and it doesn't need to be learned. There is a certain limit level for each language above which most modern words are international and the Data is no more specific of the language .
  • This limit level of vocabulary convergence is different for every language, but it doesn't so much depend on the language family or geographical origin, rather it depends on the size and the development of the community of speakers. That is the reason why even non indo-European languages like Basque are extremely easy above the intermediate level: the community is not big enough to support complex terms, and all higher Data is adopted from International words. Most people tend to misunderstand and attach too much importance to the concept of language families, and they come up with absurd lists like this one .
  • The internationalization of vocabulary is growing with the advances in telecoms and globalization, especially since English has become the only language of scientific research. There is little point in inventing new Swedish terms in science, for example, when all the scientific community are reading/writing their papers in English. Often, in spite of political efforts to promote a local vocabulary, the economics of language revert the higher Data back to Internationalese.
  • There is only one language in the World that for historical, political and demographic reasons has remained an exception to this trend: that language is Chinese (Mandarin, Cantonese or others, the difference is irrelevant here). It constitutes a parallel system of high level Data that has very few words in common with the rest of the Word. Japanese and Korean are partial exceptions in that they draw from both the Chinese and the International System, but modern words are increasingly International and these languages are converging with the rest.
  • In addition to this, Chinese has a ridiculously difficult writing system unique for its lack of a functional phonetic script. This compounds the vocabulary problem: not only there are more words to learn than in any other language, but each word contains much more information as it needs to be associated with its corresponding characters.
  • Moreover, since there is no standardized way to transcribe foreign Proper Nouns, even names of places and persons tend to be “translated” into Chinese, sometimes completely departing the original phonetics and becoming Chinese Names in their own right. This adds to the already massive Data element in the Chinese language.

All this takes us to the conclusion: Chinese is the most difficult language to learn at a high level, regardless of the origin of the student.

This is particularly interesting because up to now the right answer to this question was only: “depends on your own mother tongue”. With the possible exception of Japanese/Korean students, this post justifies that Chinese is actually the hardest for everyone else. Inversely, it is also very difficult for Chinese to learn other languages, although this is mitigated by the fact that other languages do have functional phonetic scripts.

Another interesting conclusion: Chinese is not only difficult, it is actually growing in difficulty.

As the World grows more interconnected and technology occupies a more important part of our lives, new semi-specialized vocabulary takes an increasing part in everyday language. Expressions that refer to international concepts such as “spam”or “plasma TV” increasingly take the place of expressions referring to local cultural heritage. In this sense, we can say that all languages in the World are converging, while Chinese is an island diverging from all the rest.

Then there are the political conclusions that we can draw from this, but I am committed to writing shorter posts, so we will leave that for the next day. Comments and corrections are welcome to my arguments above.