神“断句”背后究竟有什么奥秘?
2022/10/12 17:45:59 中国科普博览

    

    生活中的“断句梗”不仅火爆各大社交平台,有时也会在新闻标题中闹乌龙。比如,「广东省长假成绩单」这则标题虽然是夸赞广东省消费市场在长假期间迅速回暖的积极现象,但一不留神就会被人误以为是广东/省长“假成绩单”的负面新闻。

    (来源:网络)在这篇新闻的评论区,网友们竟然不约而同地热烈讨论起了标题。于是,广州日报将标题重新修改为:「广东长假“成绩单”」。

    (来源:网络)为什么我们在阅读中偶尔会受到“断句”的困扰呢?这可能要从中文阅读的特点说起。首先,我们一起看看下面这句英语:

    很明显,这句英语阅读起来非常困难,原因就是词和词之间原本的空格被删除了。在英文中词间空格可以帮助读者阅读,相比之下中文读者却没有这种捷径可走,我们每天看的中文句子是没有词间空格的。比如下面这个句子:

    虽然中文没有词间空格,但是我们阅读起来也没有觉得很困难。这要归功于我们练就了一套高效的方法——词切分,将连续的汉字切分成一个又一个词的过程,可以简单理解为我们通常说的“断句”。

     Part.1

     我们如何进行词切分呢?一则新闻“火箭军某部营长沙子呷荣立一等功”曾登上微博热搜,这则新闻标题的原意是“火箭军/某部/营长/沙子呷/荣立/一等功”。但该热搜最初却出现在了“长沙同城”的推荐中,网友疑惑地评论道:“这条热搜自己也迷糊了吧,怎么归入了长沙同城热搜”。

    

    (来源:网络)由于有很多人都错误理解了这则新闻标题,四川日报不得不出来澄清,上演了一番“抢人大战”。

    (沙子呷并非长沙人,而是四川人)从中可以发现,越常见的词,越有可能被切分出来。当我们看到标题中“营长沙”这三个字时,大脑会同时浮现出“营长”和“长沙”两个词。对于长沙人而言,“长沙”这个词更常见更熟悉,所以会被优先选择。此时,标题就被理解为“长沙/子呷”。心理学研究者在实验室中也探索了这种现象。现在邀请你也来体验一下,读出下面每组中的第二个汉字吧~

    在这组材料中,第二个字是多音字,它的读音根据组成的词不同而不同。比如,“卫校订”中间汉字“校”组成“卫校”这个词时读音为[xiào],组成“校订”这个词时读音为[jiào]。如果你读出了[jiào],说明“校订”被切分出来了。在上面的例子中,“校订”比“卫校”更常见,“利率”比“率性”更常见。实验结果发现,大部分读者会把更常见的词切分出来。也就是说,大部分读者将第二个字读为“校[jiào]”和“率[lǜ]”。你刚才是这样读的吗?如果你更倾向于把左边的词给切分出来,也并不奇怪。因为我们阅读的方向是从左至右的,当眼睛从左至右移动时,左边的词会更早地被看到,所以具有一定的优势。研究者也确实发现,当左边的词更常见时,人们在绝大部分(约90%)情况下会把它切分出来。但是当右边的词更常见时,人们把它切分出来的概率就降到了50%左右。

     Part.2

     我们总能切分正确吗?“断句”乌龙显示出,有时读者一开始切分出来的结果实际上是不符合句意的。心理学研究者利用眼动跟踪技术发现,中文读者在意识到自己的这种切分错误后,眼睛就会回视到前面可能出错的地方,对一开始的切分结果进行修正。比如,阅读“这位文学家从小吃谈起了传统的北京文化”这个句子时,读者最初会把更常见的“从小”给切分出来。但他们很快会发现后面的文字读起来并不通顺、很难理解,于是就会意识到自己切分错了,然后看向“从小吃”区域重新进行切分,把“小吃”给切分出来。

     虽然我们已经掌握了一套相对高效的“词切分”功夫,并能够及时纠正切分错误,但这种切分错误仍然会带来一定的困扰和额外的加工负担。因此在撰写文章的时候,还是要尽量避免构造可能产生歧义的字句,让读者能够成功理解句意~

     容易断句出错的句子,你都遇到过哪些?

     参考文献:

     Huang, L., Staub, A., & Li, X. (2021). Prior context influences lexical competition when segmenting Chinese overlapping ambiguous strings.Journal of Memory and Language, 118, 104218.

     Li, X., Huang, L., Yao, P., & Hy?n?, J. (2022). Universal and specific reading mechanisms across different writing systems.Nature Reviews Psychology, 1, 133–144.

     Li, X., & Pollatsek, A. (2020).An integrated model of word processing and eye-movement control during Chinese reading. Psychological Review,127(6), 1139–1162.

     Ma, G., Li, X., & Rayner, K. (2014). Word segmentation of overlapping ambiguous strings during Chinese reading.Journal of Experimental Psychology: Human Perception and Performance, 40(3), 1046–1059.

     来源:科学阅读实验室本文已获转载授权,如需转载请联系原作者文章仅代表作者观点,不代表中国科普博览立场

    

    

     转载注明出处 未经授权不得转载转载授权、合作、投稿事宜,联系webmaster@kepu.net.cn

     中国科普博览是中科院科普云平台,由中科院计算机网络信息中心主办,依托中科院高端科学资源,致力于传播前沿科学知识,提供趣味科教服务。

    

    点这里告诉我你在看

    

    源网页  http://weixin.100md.com
返回 中国科普博览 返回首页 返回百拇医药