“蛮懵的girl”通过精心收集,向本站投稿了6篇现代汉语语料库建设及深加工,下面是小编为大家整理后的现代汉语语料库建设及深加工,欢迎阅读与收藏。
- 目录
篇1:现代汉语语料库建设及深加工
现代汉语语料库建设及深加工
<现代汉语语料库建设及深加工>项目是国家语委十五科研重大项目,项目编号为:ZDA105-44.项目于1月启动至1月完成,3月通过专家鉴定.
作 者:靳光瑾 肖航 富丽 章云帆 作者单位:教育部语言文字应用研究所,北京,100010 刊 名:语言文字应用 PKU CSSCI英文刊名:APPLIED LINGUISTICS 年,卷(期):2005 “”(2) 分类号:H1 关键词:篇2:现代汉语虚词知识库的建设
现代汉语虚词知识库的建设
语言知识库是自然语言处理系统的重要组成部分,迄今为止的各种知识库重在对实词的句法和语义知识的描述,很少涉及虚词.本文主要探讨现代汉语虚词知识库的`建构,包括建立一个基于用法的机器词典,一个与之配套的有虚词用法信息的适当规模的标注语料库,以及虚词使用规则库.文章结语部分指出了现阶段工作的重点.
作 者:刘云 俞士汶 朱学锋 段慧明 Liu Yun Yu Shiwen Zhu Xuefeng Duan Huiming 作者单位:刘云,Liu Yun(华中师范大学语言学系,武汉,430079)俞士汶,朱学锋,段慧明,Yu Shiwen,Zhu Xuefeng,Duan Huiming(北京大学计算语言学研究所,北京,100871)
刊 名:语言文字应用 PKU CSSCI英文刊名:APPLIED LINGUISTICS 年,卷(期):2005 “”(1) 分类号:H087 关键词:自然语言理解 虚词知识库 语料库篇3:大学英语四、六级考试语料库建设分析
大学英语四、六级考试语料库建设分析
大学英语四、六级考试是我国高等教育最重要的外语考试.我们的语料库开发建设也应注重建立像四、六级考试这类关系重大的`大规模外语考试的试题语料库.本文简要介绍我们建设完成的<大学英语四、六级考试语料库>的设计理念、建库方案,报告从这一语料库获得的这两项考试主要语法特征统计分析数据,探讨这一语料库对于大学英语教学,对四、六级考试复习以及备考的意义,并就怎样更充分地利用这个语料库提出了一点儿建议.
作 者:杨端和 YANG Duan-he 作者单位:云南师范大学,外语学院,云南昆明,650092 刊 名:外语电化教学 CSSCI英文刊名:COMPUTER-ASSISTED FOREIGN LANGUAGE EDUCATION 年,卷(期):2007 “”(1) 分类号:H319.3 关键词:大学英语 四、六级考试 语料库建设篇4:话语标记语语料库的建设与探索
话语标记语语料库的建设与探索
话语标记语是一种常见的.语言现象,很多学者从不同角度对其功能进行了诸多有益的探索.但是专门建立话语标记语语料库对其研究并不多见.基于语料库的方法能够对其进行更加详实和科学的分析.本文将对话语标记语语料库建设的目的、意义、基本框架及其赋码原则等方面作详细的介绍.
作 者:李佐文 侯晓舟 LI Zuo-wen HOU Xiao-zhou 作者单位:河北大学,外国语学院,河北保定,071002 刊 名:外语电化教学 CSSCI英文刊名:COMPUTER-ASSISTED FOREIGN LANGUAGE EDUCATION 年,卷(期):2007 “”(2) 分类号:H319.3 关键词:话语标记语 语料库篇5:高师现代汉语课程建设与教学改革刍议论文
现代汉语作为高等师范院校重要的核心基础课程,对于培养师范类大学生的语文能力具有极其重要的作用。它是20世纪50年代中期仿照苏联的“现代俄语”开设的,从改革开放至今,我国高校的现代汉语教学改革与研究大致经历了这样几个阶段:(1)以教材编写和修订为重点的阶段(1978—1985);(2)以教学内容调整为重点的阶段(1986—1992);(3)以教学方法改革为重点的阶段(1993—1995);(4)以课程体系建设为重点的阶段(1995至今)。总体来说,现代汉语学科建设和教学改革取得了一系列成果,教学质量也获得了长足的提高。[1]
但是,目前高校的现代汉语课程改革仍是在应试教育和知识教育的框架下进行,随着语言本身的不断发展、新课标的实施以及中学语文教学的不断改革,迫切要求培养创新型的复合人才。面对新形势,高等师范专业现代汉语的教学出现了种种新的问题。
同时,作为一门重要的工具性课程,现代汉语在师范专业的课程中理应占有举足轻重的重要地位,它的教学水平直接关系到学生的语言现状。[2]但是文秘站-您的专属秘书!多年来现代汉语教学界却颇有这样同感:学生普遍反映现代汉语课不如文学课生动活泼,考试及格率不理想,造成了学生厌学,教师厌教的恶性循环。为此,我们完全有必要对新课程背景下的高师现代汉语教学改革进行更深层次的审视与思考。
一、高师现代汉语教学现状简析
(一)课程定位欠科学
目前的现代汉语课程体系是五十年代确定下来的。我们模仿与现代汉语有很大差别的极富形态变化的现代俄语,把现代汉语分割成语音、词汇、语法、文字、修辞五大板块。之后,又把这种语言分类的方法和语言研究的路子直接运用于语言教学。现代汉语作为一门社会的学科,跟心理学、人类学、社会学、民族学、历史学、符号学等其他学科有复杂的联系。目前忽略了语言学是在与诸学科的交叉渗透中发展的特点,课程定位教学内容没有充分体现这一现代特点。
(二)教学内容缺乏领先性、全面性、实用性和针对性
首先,现行课程中语音、词汇、语法、修辞四部分的内容都比较陈旧,缺乏深度,有的内容跟中学教材简单重复,也比较保守,没有或很少反映学科发展的新成果,因而激发不起学生的兴趣。
其次,从严格意义上讲,现代汉语应包括现代汉民族共同语(普通话)和现代汉语方言,可目前的现代汉语教材及课堂教学往往只讲共同语,不讲或很少讲到方言,存在着严重的片面性。事实上,无论从教学还是从研究讲,共同语和方言都是相互促进的。
第三,这也是最重要的一点,师范学校的现代汉语教学,还担负着一个重要的'使命:提高未来的中小学教师的语言教学能力和自身的语言表达能力。目前的现代汉语教学与现实的需求错位,学生学了现代汉语课程后,语言素养并没有明显提高,尤其是作为教师运用语言的技能没有明显提高。目前的现代汉语教学只重视书面语的教学,忽视了口语是未来教师传授知识时运用语言的主要形式。这就直接导致了高师现代汉语教育与中学语文教学实际的严重脱节,造成大多数学生对该门课程的重视度不够。
(三)教学方法缺乏启发性和实践性
目前的现代汉语教学,在教学方法上,往往只重课堂讲授,满足于一般知识的介绍,缺少课堂讨论和双边活动,没有着力启发学生去思考和发现问题,而且不太注重语言实际和研究实践,不是积极引导学生去观察和分析现代汉语共同语的种种事实,帮助学生提高语言运用能力。由于学生总是处于被动接受的状态,缺乏作为语言课必不可少的实践环节,因而学的都是一些死的知识,并未转化为实际能力,而且这样在很大程度上限制了学生的创造性,极易形成学生僵化的思维方式。
二、高师现代汉语教学课程建设和教学改革内容
(一)转变观念,构建适合高师专业的课程体系
目前高校现代汉语的很多分支学科发展极不平衡,如现汉语的结构学研究和教学相对要强,其中的语音结构和法结构的教学研究则更为成熟,语义、语汇的教学研究近来也获得了长足的进展。现在的现代汉语教材(包括使面最广的胡裕树先生、黄伯荣与廖序东先生主编的两个本),都是由语音、文字、词汇、语法、修辞五大板块组成。内容大大超过调整学科专业结构后新教学计划所规定的时,结果往往因课时不够而匆匆结束语法教学,修辞部分几个常见辞格了事。我们认为,针对现代汉语学科系统性特点,应调整教内容,形成“一主多选”的现代汉语课程教学模式。即把语音、词汇、语法这一构成语言本体的三要素作为现代汉的主干课程(“一主”);而将语言本体以外的文字、修辞、用这些又十分必要的知识逐一剥离,系统配套,形成“汉字通论、语用学、方言学”三门选修课。在保证现代汉语基理论和基本知识教学总量的前提下,增设“演讲与口才”“朗诵学”等基本技
能训练课,强化口语表达和口才技巧训练,使现代汉语的教学内容更加贴近语文教学的实际在专业能力的延伸方面,开设“中外语言学史”“语言和文化”“语法研究专题”等选修课,促进师范综合素质的提高实现课程体系的重构。
(二)创新课程内容,构建适合不同层次学生需要的教学模式
在教学内容上,现代汉语课应反映出语言学研究的最新成果,如加进文化语言学的有关内容,在语法教学中引进三个平面的语法观,增加语用的内容,引导学生关注与日常生活密切相关的语言现象,如广告用语、校园用语等。现有现代汉语教材将语言当成一种游离于社会和人文世界的纯形式系统,把语言各要素的分类、特征、构成和关系等作了详尽的形式化描写,学生从中感受到的只是一个零件和部件组成的机械的语言世界。因此,要把语言放在社会的大背景下,在教学中引导学生对语言进行文化等方面的深层次的认识和阐释。在教学中加进文化语言学的有关内容,加进社会语言学的有关内容,会使学生充分考虑到语言的动态因素。
课程内容应该贯穿两条线索:一条是现代汉语共同语(普通话)的主线,一条是现代汉语方言的副线。一主一副,相互配合。我们认为,作为主线的共同语固然是主要的讲授对象,但作为副线的方言也当受到应有的重视。之所以在教学内容中穿进副线,是因为汉语方言复杂丰富,是发展我国语言学的一大宝库,在现代汉语课程中加强方言的学习,可以加深对共同语的认识,对于学习古代汉语和语言学理论也有好处。
(三)加强实践环节,突出师范教育的特色
现代汉语属于语言专业基础课,对培养师范大学生教学技能至关重要。为了调动师范大学生学习语言:请记住我站域名的积极性和主动性,深化他们对语言理论的理解,培养学生发现、观察、分析现实生活中语言现象的能力,在教学中可以设计一系列有针对性的语言实践形式。
以现代汉语语音教学为例,由于地域的影响,贵州大学生,尤其是来自农村的少数民族大学生,受本民族语言与汉语方言的双重影响,形成了自身较固定的语言模式,所说的普通话与实际的普通话存在较大的偏差,给普通话学习带来了严重障碍。
篇6:二语学习者的汉语易混淆词语词典和语料库建设
一、引 言
对外汉语教师普遍认为,词语辨析是教学中的难点。学生可能难以分清一些只有微妙差异且意思比较抽象的近义词,如“孤单/孤独/寂寞”“居然/竟/竟然”等的用法;也可能因母语的影响,误解或误用了在教师看来无需辨析的词对,如“祖国/故乡”“偏偏/故意”等;一些同译词也是相应母语学习者辨析的难点,如“本质/自然”是英语同译词,“事实/内容”是法语同译词,“正确/公平”是西语同译词,“赞同/满足”是阿语同译词。(郭志良 1988)
鉴于此,有学者提出使用“易混淆词语”(confusable words) 的概念,并指出“‘易混淆词语’是站在中介语的立场、着眼于目的语理解和使用中的词语混淆现象并根据混淆的普遍程度归纳出来的词语类聚”。(张博 2005)
二、词典编写理念
我们编写词典的理念是:“授人以鱼”的同时“授人以渔”。此类词典不仅应能帮助二语学习者辨析所列的易混淆词语,还能帮助他们掌握辨析的方法。
1.编纂针对不同母语学习者的汉语易混淆词语词典
有些易混淆词语是由于汉语系统内部原因产生的,有些则可能是因学生母语迁移产生的。后一种类型中有些可能具有语种的普遍性,有些则可能只针对个别语种。如日韩语的汉字与汉语汉字的混淆;又如引言部分所列举的同译词。这些同译词的混淆只在相应的语种中存在。鉴于此,应该编写针对不同母语的汉语易混淆词语词典,如《面向英语学习者的汉语易混淆词语词典》《面向日语学习者的汉语易混淆词语词典》等等。
2.易混淆词语的来源、类型及辨析维度
有些易混淆词语只是个别现象,另一些则具有一定的普遍性,词典收词范围应为后者。而针对某一母语又具有普遍性的易混淆词语如何得来呢?
(1)易混淆词语来源
是不是所有的汉语近义词、同义词词典中的条目都需要纳入考虑呢?不然!因为有些近义词由于可以借助其母语翻译中介或其他手段加以区分,对于有些学习者而言,不算易混淆词语;而有些近义词较生僻,二语学习者学习的词语主要是词汇等级大纲中的词语,平时使用汉语主要是完成日常交际,那些书面性、文学性很强,或使用频度很低,或带方言古语意味的词语一般不会遇到,这些词语形成的易混淆词语对他们而言,一般可以忽略。如:“受伤/挂彩”“熟悉/熟稔”等。
(2)易混淆词语类型
根据影响学习者词语混用和误解的因素,可把汉语中介语易混淆词语分为以下几种:
A.汉语的音、形、义相同或相近诱发的易混淆词语
a.语音相同相近的词或词组。如:“权利/权力”“厉害/利害”等。
b.词形相同相近的词或词组。又可具体分为四种:
具有相同部件,如“话/语”“线/浅”等;
字形近似,如“千/干”“日前/目前”等;
异序,如“样式/式样”“兄弟/弟兄”等;
具有相同语素,如:“后来/以后/之后/然后”“鲜/新鲜”“有点儿/一点(儿)”等。
c.理性意义基本相同的词和词组。如“粗心/马虎”“诞辰/生日”“百分之/成”“两/俩/两个”等。 需要指出的是,有些词同时在音、形、义的两个或三个方面都易混淆,如“练/炼”“必须/必需”等。
B.因二语学习者母语负迁移形成的易混淆词语
a.同译词:见引言。
b.母语一词多义对应的汉语词。如:英语的live有两个常用义:(在某处)住,居住;(以某种方式)生活,过日子。学生学过“住”后,可能会误将汉语“住”与英语的live等同起来,表“生活”这一意义时也常用“住”,写出“我住的地方还留着封建的想法”这类句子。
c.母语汉字词与对应的汉语词。主要是日、韩等语言,如:日语“娘”表示“姑娘、女孩”的意思,汉语则是“妈妈”的意思,日本学生刚开始学习时可能混淆。
d.方言词与对应的普通话词。如,有客家方言背景的印尼学生在该用“吃”时,会误用“食”,造出“我们一般七点食早餐”这样的句子。(转自张博 2007)
(3)易混淆词语的辨析维度和方法
易混淆词语大多是近义词,有大量近义词辨析成果可供借鉴,可从语义、语法、语用三个大维度若干小维度进行研究。此外,词语的音、形以及跨文化视角等也应纳入考察。
有关易混淆词语的来源、类型与辨析维度和方法应在词典说明部分加以介绍,以便使用者系统地掌握辨析知识,再结合词典中具体的辨析,使他们更好地掌握辨析词语的方法,弥补词典收词的不足。
3.释义元语言简明易懂
既然词典是针对二语学习者,那么释义元语言(简单地说,就是解释词语所使用的词句)必须简明易懂,让词典使用者一看就懂,乐于使用,获得自信。为此,必须从用词范围、用词数量、专业术语和句式四个方面控制释义语言的难度。
专业术语不能不用,但不能多用。可使用基本的、常用的专业术语,如“名词、动词、主语、谓语、陈述句、疑问句、单音节词、短语、褒义、贬义、书面语、口语”等。但比较专业的术语,如“语义、语用、句法、中心语、动补短语、偏正短语、自主动词、持续动词”等,尽量不用。另外,还可以在词典说明部分加上一个常用专业术语的汉语与其他语种的对照表。
句式方面,应尽量使用简单句、短句,不用或少用长句式、复杂句式。(赵新,刘若云 2005)如《现代汉语词典》第6版释“好奇”为“对自己所不了解的`事物觉得新奇而感兴趣”。这样的解释就比较复杂,杂糅了“对……觉得……”“对……感兴趣”“所V的”“……而……”几个结构,这一释义可以改为“对自己不了解的事物,觉得很新奇,有兴趣”。例句也是释义的一部分,例句的选用也应遵循以上基本要求。此外,例句要规范、贴近实际生活、适量而有针对性(为对比分析服务)。传统词典从经典文学作品中选取例句的做法似不可取,我们主张从教材、学生创造的例子、日常会话、新闻语篇中选取例句,也可以由编纂者自编。如:《现代汉语词典》第6版中“悄悄”条有一条例证为“部队在深夜里悄悄地出了村”。这样的例句离学生的生活太远,可以换成“为了不吵醒妈妈,她悄悄地走了进来”“上课时,她悄悄和同学说话”。
4.词典编排方式的突破
(1)词对或词群的编排突破音节、词性等的限制
面向二语学习者的易混淆词语词典应突破传统近义词典只收词而不收短语、固定格式的限制。在编排词对或词群时,突破音节、词性等的限制,只要有可能造成混淆,就把它们编为一组。如:“既……又……/既……也……/又……又……/不但……而且……/不光……还……”等。
(2)突破以往词典的编排方式
以往词典的编排基本是:先给出词对;然后描述各自的意义;指出其同,给出例句;再分别描述其不同之处,给出例句。我们的编排方式则是:A.先借助语料库给出足够的典型而有效的例句;B.然后根据是否可以替换(a.能替换,替换后意思是否完全一致?差异在哪里?b.不能替换=差异)给出问题提示,引导学生在形成初步语感的基础上自己归纳异同;C.再用几条简洁的公式、图示、图片或说明给出参考答案,强调使用情境;D.给出一些常见偏误或练习题。
下面我们用一个例子来说明我们的编排设想:
夸张/夸大
(1)张悟本夸大了“食疗”的效用。
(2)黑客指责科学家“夸大”气候变化。
(3)Lady Gaga的衣着很夸张。
(4)一件衣服就3万元,他知道她没有夸大价格,但他觉得太夸张了!
(5)主持人幽默而又夸张的话把大家逗乐了。
根据以上例句,再利用语料库或网络,找出更多的例句,思考:“夸大”和“夸张”可以替换吗?两者的同与不同是什么?
以上例句一般不能互换。
“夸大”一般做动词,后面带宾语,另外的例子还有:夸大成绩/功效/优点等。
“夸张”一般做形容词,可以说“很/太/非常/十分/特别……夸张”,也可以说“夸张的话/打扮/表演”“夸张地说/表演/笑”等。
两个词都含有“夸”,“夸”的意思是夸奖,说得很好,很漂亮,实际可能不是真的这样。
“夸大”是贬义,知道事实不是这样,说话人说大话、言过其实;而“夸张”则有知道事实是这样,但是觉得有点不正常或不能相信,如例(3)、(4)。此外,“夸张”还是说话或写文章时,为了使话语更加生动,更有想象力,给人留下更深刻的印象,而采用的一种艺术手法,如例(5),再看下面夸张的艺术手法: (6)他的嗓子像铜钟一样,十里地都能听见。
(7)这么巴掌大的地方,怎么住人哪?
(8)古代有个名叫夸父的人,为了追赶太阳而一路奔跑,他渴极了,喝完了黄河、渭河的水,还要继续追赶,最后渴死在路上,他遗留下的木杖,后来变成了一片树林,叫做邓林。
以上语句有什么特点?其中例(7)是夸大了还是缩小了?你还可以说一些类似的句子吗?第(8)是一个神话故事,你还知道其他相似的故事吗?
――夸张,可以往大和小两个方向夸张。如“一日不见如隔三秋”“白发三千丈”“疑是银河落九天”,以及“他瘦得像一只猴子”“鸡毛蒜皮的小事不要放在心上”“教室里安静得连针掉在地上都可以听得见”等。
电视电影、神话故事里常常用到夸张的手法,还有如《爱丽丝梦游仙境》《阿凡达》等。
这样的“夸张”表达法,可以让你说话、写文章更加生动精彩,以后多试试吧!
常见偏误或练习:
(9)不要(夸张*[1]/夸大)这个产品的功能。
(10)他知道数据是真实的,但还是觉得有点(夸张/夸大*)。
(11)她今天穿得很(夸张/夸大*)。
(12)他(夸张/夸大*)地大叫了一声。这是一部真正的学习词典,通过它,学生掌握的不仅是词语的异同,更是词语的辨析方式,词语所出现的典型语境,甚至词语所反映的文化。
三、语料库建设理念
词典编纂必须依托语料库。首先,例句需要从语料库中筛选;其次,学生利用词典来辨析易混淆词语之后,可能还没有真正内化成自己的语感,还需借助语料库,输入相关词语,得出若干例句,反复朗读体会其含义,验证给出的图示或说明是否准确,并最终内化为语感;再次,借助语料库,二语学习者便可通过词典编纂中介绍的方法去自己操作,包括词典中不可能穷尽的一些项目;此外,利用语料库,我们可以足量占有、穷尽分析语料,定量分析与定性分析相结合,提高释义的完备性、可靠性,促进释义的精确性、科学性;分析义频,筛选常用项目,淘汰不常用项目;运用搭配、语体等分析,揭示易混淆词语的区别性。遗憾的是,目前我们并没见到附有语料库网址的词典,更没有针对性的语料库或软件供用户查询、使用。
对于易混淆词语辨别而言,理想的自然语言语料库应该能够帮助二语学习者检索相关的易混淆词语(如标注了可替换词语,或对易混淆词语进行了标注,具有易混淆词语模糊检索功能),然后得出若干足够易理解并有用的例句。为了实现这一目标,我们认为语料库样本应主要取自日常会话和新闻语篇(有选择性的,对难词进行过干预的);要考虑词汇量的输出与复现,对于难以辨别的易混淆词语,不妨通过人工干预增加它们的复现;而理想的中介语语料库则应对词语偏误进行标注并能有效检索、系统分析。这些问题还有待深入研究。
四、结 语
本文主要探讨了如何编纂面向二语学习者的汉语易混淆词语词典及其语料库建设。当然,不管是词典编纂还是语料库建设都是一个系统工程,需要一代一代有志于此的专家学者共同努力。但语料库的建设应该先行,因为一旦能通过语料库获取需要的语例,二语学习者便可通过词典中介绍的方法去自己操作,包括辨析一些词典中不可能穷尽的易混淆词语。
附 注
[1]*表示句子不成立。
参考文献
2.郭志良. 对外汉语教学中词义辨析的几个问题. 世界汉语教学,1988(1).
3.李绍林. 对外汉语教学词义辨析的对象和原则. 世界汉语教学,2010(3).
4.卢福波. 对外汉语常用词语对比例释.北京:北京语言文化大学出版社,2000.
5.马晖男,吴江宁,潘东华. 一种基于同义词词典的模糊查询扩展方法.大连理工大学学报,2007(3).
6.钱厚生. 语料库建设与词典编纂. 辞书研究,2002(1).
7.王永耀. 语料库介入的汉语语文词典释义途径.辞书研究,2010(1).
9.张宝林. 汉语中介语语料库建设的现状与对策.语言文字应用,2010(3).
★ 现代汉语试题
现代汉语语料库建设及深加工(锦集6篇)




