Chat with us, powered by
学术写作应当如何使用语料库?

学术写作应当如何使用语料库?

在学术写作中,使用语料库是一种有效的工具,可以帮助作者准确地选择词语、理解词语的用法和含义,并提高写作的质量。下面是关于如何有效使用语料库的一些建议。


什么是语料库?


语料库是指收集和整理大量文本数据的电子数据库,包括书籍、期刊文章、报纸、网络文本等。语料库通常用于研究语言学和语言使用。


语料库分为很多种,例如英国国家语料库(BNC)、美国当代英语语料库(COCA)、密歇根大学学术英语口语语料库(MICASE)、中文文本分类语料库等。


语料库具有动态性,即语料是不断动态补充的,可以追踪到语言成分的产生、成长和消亡。随着各领域用词的流通应用和变化,语料库的容量、选材和抽样也都随之变化。


How Should Corpora Be Used in Academic Writing


语料库的作用


语料库需要并能够与在线词典、翻译软件和电子期刊库在帮助学术写作方面实现互补。词典的作用是解释单词含义和语法规则。翻译软件能够粗略翻译出句子结构和用词。电子期刊库能够通过标题、摘要或全文给出英文专业术语及其用法示例。


  • 修订细节: 语料库可以帮助作者修订不确定的英文细节,如用词搭配、语法结构等,从而提高文章的准确性和可读性。

  • 提供同义词和应用示例: 语料库可以提供单词的同义词列表和应用示例,帮助作者丰富写作用词,使文章表达更加生动。

  • 提供最新学术用词: 语料库能够提供比词典更新更快、更频繁的最新学术用词及用法示例,帮助作者跟上学术写作的潮流和要求。

  • 供美式英语和英式英语之间的差异和用法示例: 语料库可以提供美式英语和英式英语之间的差异和用法示例,帮助作者根据自己的需要选择合适的用词和表达方式。


例如,在美国杨百翰大学语料库网站有美国英语和英国英语语料库的链接,用户可以搜索和比较在这两种风格中使用的术语或短语。例如,美式英语喜欢用“in the hospital”,而英式英语喜欢用“in hospital”。这种实际用法上的差异往往是词典、语法书中的理论和翻译软件所无法揭示的。需要注意的是,语料库通常不会解释什么是正确的、什么是错误的。它只是提供现实世界中常用的用法。


  • 校验译文正确性: 语料库还可以用于校验翻译器的译文是否正确,帮助作者在翻译和润色过程中发现和纠正错误。


在复杂的语境下,即使一些常用的词汇也可能被翻译器译错。英文学术写作的主要困难是把握专业术语和生词,以及一些词汇在特定语境下的特殊含义。要想在细节上准确把握这些词语的用法,以及判断翻译器给出的译文是否正确,就需要使用语料库。例如,中文的“结婚权”可以被翻译为“right to marriage”。对于这种组合词,查词典有可能查不到,而不同的翻译器则可能会给出多种译法,包括“matrimonial right”。这时,我们需要判断“matrimonial right”究竟是表示结婚权,还是表示婚姻中的权利。为了解决这种疑问,可以去语料库检索,甚至包括输入“matrimonial right*”这种带星号“*”的词。星号代表“right”后可能出现的任意字符。通过对语料库中最接近所译材料语境的文本例句分析,可以确认翻译器把“结婚权”翻译成“matrimonial right”是错误的


How Should Corpora Be Used in Academic Writing

常见语料库


  • 美国当代英语语料库(COCA): 收录了大量美国当代英语的语言材料,是研究美式英语使用的重要资源。

  • 杨百翰大学语料库(BYU corpus): 包含了来自不同来源的语言材料,可用于研究英语语言和语言学。

  • 英语整合语料库(Corpus Concordance English): 包括了英语不同时期、不同来源的语料,是研究英语语言发展和变化的重要工具。

  • 英国国家语料库(BNC):该语料库由牛津出版社、朗文出版公司和大英图书馆等机构共同建立,总词量超过1亿,其中书面语约占90%,口语约占10%。

  • 密歇根大学学术英语口语语料库(Michigan Corpus of Academic Spoken English):该语料库由美国密歇根大学英语语言研究所建立,内容主要为学术英语口语,词量高达184万。


在学术写作中,合理利用语料库可以帮助作者提高写作质量、准确理解词语用法和含义,并使文章更加地道和专业。