- 英
- corpus
- 関
- 体
WordNet
- a collection of writings; "he edited the Hemingway corpus"
- the main part of an organ or other bodily structure
PrepTutorEJDIC
- (特定の事に関する,または特殊の性質の)文書資料の集成 / (研究用に収集した)資料
Wikipedia preview
出典(authority):フリー百科事典『ウィキペディア(Wikipedia)』「2015/05/22 21:38:29」(JST)
[Wiki ja表示]
|
この項目では、自然言語の文章を構造化し大規模に集積したものについて説明しています。その他の用法については「コーパス (曖昧さ回避)」をご覧ください。 |
|
言語学 |
|
基礎分野 |
音韻論
形態論
統語論
意味論
語用論
音声学
記号学
個別言語学
言語獲得
言語の起源 |
言語の変化と変異 |
歴史言語学
比較言語学
言語地理学
方言学
言語類型論
言語系統論
言語年代学
社会言語学 |
理論 |
生成言語学
認知言語学
理論言語学 |
応用分野 |
応用言語学
言語人類学
社会言語学
心理言語学
神経言語学
生物言語学
計算言語学 |
関連項目 |
言語
言語学者 |
Portal:言語学
プロジェクト:言語学 |
|
コーパス(corpus)とは、言語学において、自然言語処理の研究に用いるため、自然言語の文章を構造化し大規模に集積したもの。構造化では言語的な情報(品詞、統語構造など)が付与される。コンピュータ利用が進み、電子化データとなった。
概要
「身体」を意味するラテン語corpusに由来する。複数形はcorpora(コーポラ)。英語式複数形としたcorpusesの使用も散見される。
大規模なコーパスの作成には相当の費用と時間がかかる。使用する文章に関わる著作権などの法的問題が発生するためである。データ作成の手間はあるが、コンピュータ利用によりそれ以前に比べかなりの労力軽減と多様な構造化が実現した。日本では国立国語研究所が一億語の収録を目指す「KOTONOHA計画」をすすめている。
構造化した言語データを一般利用するという観点からは、三省堂がウィズダム英和・和英辞典の用例を「用例コーパス」として期間限定で無料公開している。
日本でコーパスを一般に広く知らしめたのは、英語学者の投野由紀夫である。2003年、NHK教育テレビジョン『100語でスタート!英会話』で、英語コーパスを教材に活用した放送授業を展開し、それまで専門家しか知らなかったコーパスを一般的な存在へ変えた。2009年には新シリーズとしてずばりコーパスをタイトルに入れた『コーパス100!で英会話』が放送されている。
関連項目
- コーパス言語学
- 言語資源
- 計算言語学
- 辞典
- ツリーバンク
- 言語資料学
- 構文解析
- 形式文法
- 句構造規則
- 語彙項目
- en:Quranic Arabic Corpus
外部リンク
- KOTONOHA計画
- 三省堂「用例コーパス」
- 特定領域研究「日本語コーパス」
- American National Corpus(アメリカ英語のコーパス)
- NINJAL-LWP for TWC(「筑波ウェブコーパス」を検索するためのツール)
- byu.edu(Mark Davies教授による 英語, スペイン語, ポルトガル語等に対応するコーパスのリンク集)
|
この項目は、コンピュータに関連した書きかけの項目です。この項目を加筆・訂正などしてくださる協力者を求めています(PJ:コンピュータ/P:コンピュータ)。 |
|
この項目は、言語学に関連した書きかけの項目です。この項目を加筆・訂正などしてくださる協力者を求めています(ウィキポータル 言語学)。 |
UpToDate Contents
全文を閲覧するには購読必要です。 To read the full text you will need to subscribe.
Japanese Journal
- Analysis of a Corpus of Written Recipes to Add Authenticity to EFL Materials
- McShane Edward
- 紀要 = Bulletin (11), 39-53, 2019-03-31
- 本論文は、英語の教科書に書かれている料理レシピの語彙の適合性を判断するために、専門コーパスを使用している。さらに、教科書に提示されている語彙よりも、より信憑性が高い英語使用法を表している教材を作成する為に、使用可能なデータを提供することも目的としている。コーパスを分析し、レシピの中で最も頻度の高い動詞を識別したうえで、動詞の頻出パターンを記録している。調査目的として使用された教科書と調査結果を比較 …
- NAID 120006602335
- 『太陽コーパス』における従属接続詞の使用実態について
- シェイクスピアと農業(2) : エリザベス朝「農書」の系譜
- 上村 幸弘
- 梅花女子大学文化表現学部紀要 = Baika Women's University Faculty of Cultural and Expression Studies Bulletin (15), 1-18, 2019-03-21
- 5 世紀にローマ軍が撤退すると、ブリテン島はゲルマン系諸民族の侵略を受けるが、農業は常に支配者を支える封建制の経済的基盤として機能してきた。特に11 世紀のノルマン征服以降、厳密な検地が行われ、課税対象が明確になるにつれ、効率的な農業経営が求められるようになる。農業生産の舞台となる荘園において、安定的に利潤を生み出すシステムの構築に、農書は大きな役割を果たす。本稿は前編を承け、その第2 章として初 …
- NAID 120006586063
Related Links
- このサイトでは大学共同利用機関法人人間文化研究機構国立国語研究所と文部科学省科学研究費特定領域研究「日本語コーパス」プロジェクトが共同で開発した『現代日本語書き言葉均衡コーパス』(BCCWJ:Balanced Corpus of ...
- 株式会社コーパスは、各種ラベル、POP、CDラベル、はがき宛名などを印刷できる「夢ぷりんと」など、多彩なラベル作成ソフトを販売しています。
★リンクテーブル★
[★]
- 英
- body
- ラ
- corpus、corpora
- 関
- 肉体、身体、本体、コーパス、ボディー