[最終更新日]2017年06月23日

C-JAS 中国語・韓国語母語の日本語学習者縦断発話コーパス

中国語母語話者3名、韓国語母語話者3名、計6名の日本語学習者を3年間縦断的に調査し、データを収集した、発話コーパスです。 コーパスの名称は「中国語・韓国語母語の日本語学習者縦断発話コーパス」、略称は「C-JAS(Corpus of Japanese as a Second Language)」です。
収録したデータ量は、約46.5時間分で、総語数は約57万語です。 オンラインで検索システムが使え、形態素単位や文字列で用例を検索することができます。 さらに、文法習得の観点から、統語・文法・発音の誤用には、誤用タグが付与されています。

I-JAS 多言語母語の日本語学習者横断コーパス

本プロジェクトでは、日本を含む20の国と地域で、異なる12言語を母語とする日本語学習者1000人の話し言葉および書き言葉を収集することを目標に、横断的に調査・収集を行っています。 コーパスの名称は「多言語母語の日本語学習者横断コーパス」、略称は「I-JAS(International Corpus of Japanese as a Second Language)」です。 学習者には日本語能力テストを実施し、レベル判定を行っています。 そのため、レベル別、母語別、技能別、学習環境別にデータの比較が可能です。 オンラインで用例検索ができるコーパスを目指して準備を進めています。 発話調査の音声データも公開する予定です。