I-JAS関連資料

ここに挙げている資料は、I-JASを利用する際に重要となる情報がまとめられています。
(青字部分をクリックすると資料がダウンロードできます。)

 

(1)I-JASを利用するための必読資料

I-JASの概要、文字化のルール、検索システムなど、I-JASを具体的に利用する際には、必読の情報が掲載されている報告書。

迫田久美子・小西円・佐々木藍子・須賀和香子・細井陽子(2016)「NINJAL-多言語母語の日本語学習者横断コーパス International Corpus of Japanese as a Second Language
『国語研プロジェクトレビュー』第6巻3号,93-110

 

(2)I-JASの背景情報を知るための科研報告書

I-JASを構築するためのグランドプランの策定から、国内外の調査内容などが詳細にまとめられた科研(研究課題領域番号 24251010)の報告書。

海外連携による日本語学習者コーパスの構築_I-JAS構築に関する最終報告書

 

(3)I-JAS(第一次・第二次公開データ)の補足情報 (2017/12/20更新)

I-JASの第一次・第二次公開データの学習者ID、母語、タスクや音声編集、作文データの有無および作文調査で使用したプロンプト(課題文)などの補足情報の資料。

第一次_第二次公開データの補足情報一覧_20171220_PDF

第一次_第二次公開データの補足情報一覧_20171220_Excel

注1)
① EAU01:学習者IDを示す。 E(母語:英語),AU(国名コード:オーストラリア),01(学習者番号)
※同一国で2カ所以上調査を行っている場合や管理上の都合で3文字目を変更している場合がある
② 絵描写タスクの有無:絵描写のタスクを行ったかどうかを記載(途中から実施したため)
③ 音声編集の有無:発話データで音声の編集を行ったかどうかを記載
④ 音声編集の詳細:音声編集の編集内容を記載
⑤ 作文調査の有無および作文プロンプトの種類:NNS非母語話者とNS日本語母語話者、また海外と国内の日本語学習者で作文のプロンプトの表現や設定を変えているため、その学習者に用いられたプロンプトの種類を記載

 

(4)I-JASの作文調査で使用したプロンプトの内容(メール8種類・作文1種類)

作文調査のエッセイのプロンプトは同一の内容ですが、メール文に関しては(3)注1)の⑤の通り、学習者の環境によって、部分的に表現や設定を変えています。

作文調査_環境別プロンプト一覧

注2)
セルの背景色:色がついているものは、同様のプロンプトであることを表している 。また、赤字の箇所は他のプロンプトと表現や設定が異なる部分を表している。

 

(5)I-JAS第二次公開および第一次データの修正点についての詳細情報

第二次公開で追加されたデータの詳細や第一次公開からの修正点などについて、以下の資料で詳しく説明しています。

第二次データ_一般公開のお知らせ_20170619

 

(6)データ修正箇所一覧

すでに公開されているデータのうち、データ更新の際に、修正した箇所の詳細を一覧にまとめています。

◆2017年11月24日

特に大きな修正は以下の通りです。

・IDのアルファベットは全て、1短単位になるよう修正した。
・更新に伴い発話番号を振り直した。
・Fタグでまとめられていたもの(※1)をUniDicの規定に沿って分割し、それぞれに形態論情報を付与した。
※1:これまでは「えー、あのー、うーん」などのようにフィラーが続くものは、1短単位としてFタグでまとめられていた。

その他の個々の修正箇所は以下のファイルに詳細が書かれています。

I-JASデータ_修正箇所一覧_20171124

◆2017年06月07日

I-JASデータ_修正箇所一覧_20170607