语言星期四:解析中国1.0

2010年5月7日,书面Julen马达里亚加

canadagoose_300_tcm9139738_thumb3444

我飞回重庆最近,当我阅读中国非常令人沮丧的问题提醒。 有一个机舱电视上的电影,它有一个特殊性:它进行字幕的中文和英文并行,两线相若的字体在屏幕的底部,。

当我看到我一直强迫我的眼睛中文字幕坚持以行使我的阅读(声音),但它是毫无意义的。 之前,我已经读完了中国每一次,我已经知道该行的含义反正。 英语的话,似乎传递自己的意思, 即使我不看他们。

阅读中国

我们已经谈到,去年有关的问题, 读“中国功能。 它是先进的中国学生非常重要,因为超过一定程度的进展,在很大程度上取决于这种能力。 许多外国人都能够读取缓慢,甚至做光标字典的帮助下,与中国文字的翻译。 读取功能, 在我的定义 ,是一个完全不同的事情。 这意味着能够阅读一般文本的种种作为快速和可靠的平均本土。

我观察,这种阅读流畅,是极其困难的,谁没有在中国受过教育的读者达到。 从个人的经验,我知道这是不是一个学习外语的共同问题;与实践,阅读流畅平行字母脚本语言发言。 这个问题是中国文字的独特,我有印象,它已在很大程度上忽略教育工作者。

阅读测试

我想得很清楚区分从收购的新词汇/字符阅读技巧。 显然,当您需要寻找在字典中的字,阅读速度较慢,但​​是这不是我们想要测量。 我们可以定义一个测试来衡量的阅读速度

该指数是你把阅读的时间除以时间采取类似的读文本在您的母语(在同一本书,在未来500字符节)500字符文本的前提下,你所熟悉的所有事先字符/字/在文本中的表达式,并没有准备阅读之前是不允许的。 测试是很容易进行双语书,虽然它需要一些试验和错误,直到找到一个部分,那里有没有未知数。

由于没有词汇或丢失字符问题,索引速度差异主要是由于在解析的消息,我所说的纯粹的阅读技巧的难度。

解析中国

我开始怀疑,该指数降低,甚至长时间每天阅读,是非常困难的。 我拿下约3在测试的最后一年,差不多一年后(待仔细测试)恐怕我没有从我在那里远远的。 其实,我可能会被欺骗轻微,因为我用的是奥巴马的书,我已经读前。

让我们看看为什么它是如此难以解析的消息时,我们知道它里面的所有元素的所有可能的原因。 至于我能想到的,有3个主要的复杂的过程,我们做当我们读到:1 - 认识到的字符2 - 解析成字3 - 解析成句的话。

第1步-认识到的字符

据了解,我们读英语的时候,我们通常不读信的信,使声音,而是我们认识到整个单词,甚至大块,其中,一目了然。 这使我们能够读取速度非常快,我相信同一种现象发生当中国人读了他们的语言。 他们看到1中央政治局常务委员会的眼睛在一个节拍。

我在这里看到我们的阅读的第一大障碍。 我们还没有开发的技能,使这些复杂的形状自动,我们被迫要自觉地认识到每一个字符,在我们继续之前。 即使在前款规定的基本特征,我仍然不能采取它作为我立即采取“政治局常委”。

你觉得呢? 这是第1步。

第2步-解析的字

有一件事是一眼认出一大块的字符,但不同的事情是确定的话,他们形成。 这一步是在西方语言非常容易,因为清楚的话是用空格分隔,和专有名词的大写字母。 但写中国不提供这种帮助,所以在搞清楚哪里是你的单位的意义有一个增值的分析步骤。

例如表达发展中国家,我可以告诉你在任何时候,它意味着“发展中国家”。 但现在检查出随机的部分,我刚刚从互联网上复制这个文本:

前四个会议分别讨论了现有生物技术在发展中国家粮食和农业领域中的作物

它在发展 - 中国 - 家粮食或者是它在 - 发展中国家 - 粮食? 显然,这是第二个,但如果我们读字符,并按照经济统计方法,我们先暂定解析将是第一个。 本地人的读者看到整个5个字符块一次检测这个词,但由于字符的困难,大多数外国读者看到一小块一小块的2个字符,这迫使他们的试验和错误的过程中。

事实上,在上面给出的例子是非常初级的,但考虑引进文字较长的单词,固定词组,这样一个外国名字:圣文森特和格林纳丁斯(陪审团特别奖谁得到的外国人)。 这是很容易看到,中国加入了解析的整个步骤,实际上是在我们的语言不存在。

在情况下,你对此持怀疑态度,这是很容易做了什么,添加的步骤将意味着,如果我们有英语逼真的模拟。 刚刚看到多久,你读了这篇课文,从本文

karunanidhiwaslividthatdayanidhiandbrotherkalanidhihadbecometooambitious holdingpopularitycontestsagainstalagiriintheirnewspaper whoseofficewas burntdown.rajadidnottakechargeofthetelecomministryalone.kanimozhiwas toremainhis“指南”。hewasfocused.hisallegedundersellingofthe2Gspectrum(designatedpartoftheairwavesforusebymobilephoneoperators),whichcaused alossofRs22,466croreaspertheCBI'sestimate,浮出水面。

祝你好运! 这几乎是很难相信,中国的实际看他们的语言,在正常的速度(相信我,他们这样做)。

当然,有没有一个确切的等价,因为中国文字从英文字母/字不同的方式结合。 但它给了这个棘手的分析步骤,是中国特有的良好的手感。 本地人心目中从小就在瞬间完成,但是这一步涉及到一些过程,从我们的训练是相当不同的。 是有可能获得这种能力吗? 这是我的第2步的意思。

第3步-解析成句的话

我们在西方语言做的是整体类似的句子解析,一旦我们有话。 事实上,汉语语法是不是所有的英语语法句子结构的水平不同。 这些棘手的长句通常有一个类似的命令,和条文的标记用逗号(, 坐落在以类似的方式来英语)。 这一步是很容易,在我的经验,比解析在凝集语言像巴斯克人,其中相当一部分的语法信息只有在年底的句子中的动词词尾变化形式给予的长句。

结论

这仅仅是一个1.0的问题和进一步职位将得到改善/完成。 我想分享这些点和我继续之前,得到一些反馈意见和想法。

这个主题是很重要的,因为它可以帮助我们理解中文阅读过程的工作如何,也许还发展出一种方法,以帮助那些停留在先进的(但不是学生所有功能 )级。 随着越来越多的人决定要认真学习中国,这个块绊脚石的学生人数将增加 - 这是已经很大,即使在今天。

就目前而言,它似乎很清楚,这些步骤1和步骤2,我在上面描述的是一口流利的阅读的主要障碍,但我想找到更多的途径来量化这个。 特别是,我有以下的想法,我们可以尝试这样做,如果有人感兴趣:

  • 阅读速度做了较大规模的测试。
  • 测试的原住民在他们自己的语言和英语的阅读速度。
  • (字间隔字符阅读速度比较正常的阅读速度类似的文本)做测试,以量化的步骤2
  • 回答这个问题:它实际上是可以改善步骤1和2,或者是你作为一个孩子需要学习一些自动化的过程。
  • 认为可能的演习,以改善步骤1和2。

这点上任何想法会受到欢迎,以及任何链接,以及以往的研究。 我在这里说什么写在石头上,我将非常感谢其他建议。

共享是免费的,支持我的工作

  • Twitter
  • Facebook
  • email
  • Google Bookmarks
  • Digg
  • del.icio.us
  • Haohao
  • StumbleUpon
  • Technorati
  • LinkedIn
  • Netvibes
  • Reddit
  • Posterous
  • Live
  • QQ书签
  • MSN Reporter
  • 豆瓣
  • Yahoo! Buzz
  • MySpace
  • FriendFeed
  • Print



评论到目前为止↓

  1. 五月
    7
    2:09
    上午
    布拉德

    圣文森特和格林纳丁斯...我的中国地图研究,终于派上了用场!

    [ 回复此评论 ]

    julen马达里亚加回复:

    主席先生,这是非常可观的。

    我期待着到一个新的圣文森和格林纳丁斯解析机,从布拉德实验室 :)

    [ 回复此评论 ]

  2. 五月
    7
    4:45
    上午
    safarinew

    非常有趣的(当然,反之亦然)indeed.Similar案件发生在我身上,当我看盗版的英语讲英语的movies.Then局势变得少identifiable.I不知道这导致我在这头first.Although的情况下(关闭声音),ihaven't经历。 我打赌仍然是汉字击败提前英文字母,即使我读英语几乎一样快。 我相信这是一个在英国的学生很常见的场景:没关系你如何善于在读英语,你的的本地ideograpic位总是流dowm fasters位。

    我还知道有人用不同的故事。 与你好运! 顺便说一句,你读了这本书,我前几天提到的吗?

    [ 回复此评论 ]

    julen马达里亚加回复:

    @ safarinew,我想你是指这个权利吗? 我检查出来,但我决定不得到它,因为我已经太忙,担心外国人学习中国去担心中国英语学习... :)

    一个相关的文字,我建议大家看看一个。 我发现其母的hilarous

    [ 回复此评论 ]

  3. 五月
    7
    6:10
    上午
    SYZ

    神奇后,Julen。 直观地根据我自己的经验,我同意,有可能是一个巨大的差距。 我不怀疑他们是第二语言学习者在原始速度的读取,但我认为他们之间。 我肯定不是其中之一,我不远程,在你们的话来说,“功能。”

    也许我没有足够仔细阅读,但我认为你不明确表示你似乎暗示:你期望Julen指数(季)以非母语的中国比,说,中国人学习英语学习更高作为非母语,即使在这两个群体在可比的教育和母语水平。

    是这样吗? 痛苦只是要清楚,我的姬可能是中国,而我的中国同行(背景相似)倒不如说,3季。

    我不完全相信它会变成这样。 例如我的北京人的妻子,谁做了两个研究生学位和10多年在美国工作,还是多读英语比我慢。 不过,我认为的差距是完全剖析原因,你所描述的可能存在。

    [ 回复此评论 ]

    julen马达里亚加回复:

    你期望的Julen指数(JI)是较高的非母语学习中文比说,作为非母语的中国人学习英语,即使在这两个群体在可比的教育和母语水平的扬声器。

    我不说,因为文章已经包含了足够数量的未经证实的断言。 但是,是的,我认为这是真的。 不仅因为信件是26日和字符数千(我相信克服这个困难可以通过专门研究中国),但也因为字母文字的解析过程中减少了一步。

    谁做了两个研究生学位,并在美国工作10年以上,但仍多读英语比我慢

    是的,但有一点是比较她读英语,你读中国。 这在美国的经验,我敢打赌我的衬衫,如果她有她击败你。

    [ 回复此评论 ]

  4. 五月
    7
    6:17
    上午
    baoru

    我觉得是在中期也有差异。 因为我觉得它更容易阅读在电影的字幕,而不是从书本上读取。

    [ 回复此评论 ]

  5. 五月
    7
    7:09
    上午
    凯茜

    啊,现在我知道你为什么抱怨中文标点符号 :-) 我猜它是母语阅读,因为没有标点符号的情况下,当我看到了中国的字符串,我发现自己其实沿途标点。 也许中国使用无形内置一个标点符号系统。

    另外,我怀疑的人使用大脑的不同部位,读英语和汉语。 也许是一样的口音,一旦你达到了一定的年龄,这是更难训练大脑,读流利吗? 不过,我知道很多中国人,谁不以英语为母语,英语为母语的人一样快速阅读英文,有时他们的英语甚至比英语为母语的人更好! 不过,在美国的公立教育系统有点吸。

    [ 回复此评论 ]

  6. 五月
    7
    11:30
    上午
    julen马达里亚加

    也许中国使用无形内置一个标点符号系统。

    是的,你可以这么说。 这是我解析步骤2的意思,他们似乎有一个内置系统检测之间unspaced线的话。 他们“无形的标点符号”如果你想这样称呼它在空间的形式,。

    也许是一样的口音,一旦你达到了一定的年龄,这是更难训练大脑,读起来朗朗上口

    而这正是我害怕。 因为如果这是真的,就意味着它是非常困难的,以达到阅读流畅。 它不仅需要成千上万极其困难的字符和单词学习(一个方面,在这里,但我忽略了处理, 在以前的帖子 ),但它也需要一些心理能力训练,我们的大脑并没有准备。

    这是一个可能在这里,当然是大的。 但它是一个结论,我担心越来越多,我继续读中国从来没有接近的流畅点,我在以前的语言实验。

    [ 回复此评论 ]

    凯茜回复:

    AWW,不要气馁。 中国人是很辛苦。 但是,只要你下定决心学习和苦练,我相信你一定会实现流畅。 人类大脑常常被设置的方式,但是当我们把我们的心的东西,它也能够令人难以置信的壮举。

    [ 回复此评论 ]

  7. 五月
    7
    11:33
    上午
    julen马达里亚加

    聚苯乙烯。 任何人在此还应该检查出的讨论会在上Sinoglot

    他们有一个有趣的链接,有一块的研究表明,中国的确不读得更快,当他们得到单词之间的空格。

    它看起来确实像他们的大脑已经补充说:“这些场所”,因为凯茜说,他们获​​得什么作家从他们这样做的。

    [ 回复此评论 ]

  8. 五月
    7
    12:46
    布拉德

    我差点忘了提我最喜欢的短语之一来解析不正确:保持共产党员先进性教育活动。 共产党人的先进性别教育活动?

    [ 回复此评论 ]

  9. 五月
    8
    7:51
    Wukailong

    我仍然保留我做了一次一本书(160页,我觉得)重读部分昨日拼音转录。 有趣的是,它感到更加繁琐的读取比它一直到类似的没有音迹象读取文本。 我提的,这是因为我相信它不只是一个中文字符的事情,但多少额外的信息进行处理,比通常的26个字母的问题。

    有趣的测试,顺便说一句。 我爱测试 - 今晚将尝试它! 我在书架上有一些双语书籍,所以应该不会太难。

    [ 回复此评论 ]

  10. 五月
    9
    1:30
    上午
    陈埃里克

    伟大的博客文章。
    作为一个中国的母语,我记得我弟弟玩一个游戏,当我们感到无聊。 我们一直盯着我们拿起随机,直到它看上去陌生,怪异,甚至面目全非的中文字符。 它需要一个平均约2-3分钟为我们有这样的感觉。 但我没有相同的经历与英文字母。 我猜测这可能是由于中文字符比英文字母复杂得多建设。

    我认为,你为什么还没有发展到功能的能力水平,原因是你没有得到的点,在那里你可以立即检测到两个汉字的组合,如果是正确的。 瘾,你有没有住在中国足够长的时间,以充分把握中国的微妙背景。

    这是事实,中国的一些可以阅读英语像外国人一样快,因为我们没有认识到这是我们长期以来一直在我们的拼音系统使用英文字符。

    保持共产党员先进性教育活动,是可以理解这种方式。 其实,我们经常开玩笑说,在中国政治中所使用的一些短语。 顺便说一句,你知道它的翻译?有这么多的含义,突然出现在我的脑海里,我不知道我应该选择哪一个。

    我可以读取高达每分钟600至800个字符,但速度不同课程的内容而定。

    一个更有趣的事情,如果你是中国的电视剧,我想你是不是一个大风扇,你将惊讶地发现,他们中的很多有中文字幕,而美国的不。 你可能想知道到底是什么时,你可以倾听和理解所有的中国人交谈字幕。 但事实是,它很容易,我看比听他们的中国字幕。

    [ 回复此评论 ]

    贾森回复:

    (后非常有趣!看起来像我有点晚讨论)
    @陈埃里克
    “我们一直盯着我们拿起随机,直到它看上去陌生,怪异,甚至面目全非的中文字符。 它需要一个平均约2-3分钟为我们有这样的感觉。 但我没有相同的经历与英文字母。 我猜测这可能是由于中文字符比英文字母复杂得多建设。“
    有趣! 我是个以英语为母语,作为孩子,我起到了类似的游戏。 (我认为许多其他的孩子有太多),但是,会一个字,直到它变得面目全非,“奇怪”。
    你认为你可以做一个汉语口语字相同? 我也很好奇,如果我可以做一个书面的英语单词...

    [ 回复此评论 ]

  11. 五月
    9
    3:40
    上午
  12. 五月
    9
    7:51
    julen马达里亚加

    有趣的链接。 在人物方面,我估计我的阅读是betweem 100-200 CPM,我觉得接近200时,它是一个简单的文字,我知道所有的话。 2中国人,我测试了其中两个以上500cpm。

    [ 回复此评论 ]

  13. 五月
    11
    2:11
    凯凌

    唯一的“慰安妇”是中国人有时也用自己的话失去当他们“预配对”他们在错误的方式,尤其是在日常语言中不很常见的组合。

    [ 回复此评论 ]

  14. 五月
    11
    6:24
    julen马达里亚加

    你是什​​么意思? 任何例子?

    [ 回复此评论 ]

  15. 五月
    12
    12:54
    凯凌

    现在我不有任何考虑,但我也经历过,当他们看到非常奇特的话文本。 当然,一旦他们读它,下一次他们会记住这个配对。

    [ 回复此评论 ]

  16. 五月
    13
    1:46
    凯凌

    我现在还记得,在台湾,在许多书籍,适当的名称(主要是外来的或非常具体的技术的话)通常强调“的东西,我看到一些中国内地太旧的书,也许是在共和党的时间,以帮助读者链接字符(如个人姓名),通常不会一起出现,喜欢洛杉矶,旧金山,马德里,欧阳开泰等方式

    [ 回复此评论 ]

  17. 六月
    19
    6:49
    ZZY

    我是一名中国学生
    它也是我一口流利的英语阅读理解的话,完全

    [ 回复此评论 ]

  18. 八月
    8
    10:55
    上午
    杰夫

    我看到这个讨论,我很晚,但看到你有没有最近发布的,我想这没关系。
    我觉得你做一些伟大的要点,尤其是基于字符与字母文字接近一个句子非常不同的方式,。
    有一件事我想提出的是它是否有可能增加你的阅读速度和内置的解析能力,因为你把它的问题。
    幸运的是,答案是肯定的,虽然你不能做阅读了很多,它只是。 它实际上是需要一个相当结构化的方法。 为母语的能力,建立行之有效的做法,通过朗读和记忆从各个历史时期的某些文本。 文本,如“三字经和诸如此类的东西。 这里发生的是,学生们建立一个精神的句子和短语结构的数据库,实际上变成一个直观的(几乎是下意识的)语言的节奏意识。 当通道被精心编写的,它会坚持或多或少这样的节奏或结构,允许自动进行解析。
    我听说过在在奥伯林沉浸课程的高级语言,如尝试复制这些内置的阅读习惯和其他方面的训练设施使用若干套练习。 我没有尝试过自己,但谁一直在使用这种方法的老师说,这是非常有效的,并不需要多年的来自中国的小学课本复习。 当你再次发布,或许你可以考虑给它一个尝试。

    [ 回复此评论 ]

  19. 十一月
    12
    9:38
    上午
    迈克尔·答罗布森

    “祝你好运! 这几乎是很难相信,中国的实际看他们的语言,在正常的速度(相信我,他们这样做)。“

    是啊,以及正常的,是毫无意义的字在这里。 我仍然能听到收音机,女孩显然是从提词/页阅读,并再次游过她的话,停止并重新启动slipups吨。 解析的话是巨大的,espcially因为有吨的例子,“你如何解析的话,依赖的情况下,它只是更多的大脑/眼睛的工作。 是中国唯一的语言,没有做到这一点?

    [ 回复此评论 ]