“corpus”作为名词,基本含义为“语料库”“文集”“全集”等,在不同领域有不同具体指向。其用法多样,在语言学中常用于描述收集整理的语言材料集合;在文学、学术等领域可表示某位作者或主题相关的作品全集;也可用于比喻意义,指大量相关事物的集合。使用时需根据具体语境确定准确含义,并注意单复数形式及搭配使用。
语料库:在语言学、计算机科学等领域,“corpus”最常见的含义是“语料库”,即为了语言研究、自然语言处理等目的而收集整理的大量语言材料的集合。这些材料可以是文本、语音等形式,涵盖了各种语言风格、体裁和主题。例如,英语学习者可能会使用英语语料库来研究词汇的使用频率、语法结构等。
文集、全集:在文学、学术等领域,“corpus”可以表示某位作者的作品全集,或者与某个特定主题、学科相关的所有文献的集合。比如,“the corpus of Shakespeare's works”(莎士比亚作品全集)。
大量相关事物的集合(比喻义):在一些非正式或比喻的语境中,“corpus”也可以用来表示大量相关事物的集合。例如,“a corpus of data”(大量的数据)。
在语言学中的用法
作为可数名词:当指具体的语料库时,“corpus”是可数名词,复数形式为“corpora”或“corpuses”(“corpora”更为常用)。例如,“We have built several corpora for different research purposes.”(我们为了不同的研究目的建立了多个语料库。)
搭配使用:常与一些动词和介词搭配使用,如“create a corpus”(创建一个语料库)、“analyze a corpus”(分析一个语料库)、“a corpus of written texts”(一个书面文本语料库)等。
在文学、学术领域的用法
作为不可数名词:当表示某位作者的作品全集或与某个主题相关的所有文献时,“corpus”通常被视为不可数名词。例如,“The study focuses on the corpus of medieval literature.”(这项研究聚焦于中世纪文学全集。)
修饰语:可以用一些修饰语来进一步限定“corpus”的范围,如“the complete corpus of”(……的完整全集)、“the literary corpus of”(……的文学全集)等。
在比喻义中的用法
作为可数名词:在表示大量相关事物的集合时,“corpus”可以作为可数名词使用。例如,“We need to collect a large corpus of examples to support our theory.”(我们需要收集大量的例子来支持我们的理论。)