*disclaimer
1197154
[CHILDES]
IPSyn: Index of Productive Syntax
- IPSyn: Index of Productive Syntax
基づく文献
- Miller, 1981
Miller, J. F. (1981). Assessing language production in children: Experimental procedures (Vol. 1). University Park Press.
- Scarborough, 1990 が、文法範疇と構文の発達段階に関して、基づいた文献の一つ
- Scarborough, 1990
Scarborough, H.S. (1990). Index of Productive Syntax. Applied Psycholinguistics, 11, 1-22.
- 2歳から4歳の構文の発達のチェックシートとしてIPSynを開発
- Scarborough, 2008
- CLAN Changelog (2010)
- CLANでIPSynが使えるようになる
- "2010-08-25: IPSYN: created this new command" https://dali.talkbank.org/clan/changes.txt
- CLANでIPSynが使えるようになる
- Bernstein Ratner and MacWhinney (2016)
- Altenberg, Roberts, & Scarborough, (2018)
- IPSynの評価基準の見直し、定義の明確化
- Roberts et al., 2020
- MacWhinney et al., 2020
- Roberts et al., 2020の指摘を受けてIPSynを改善した結果報告
統語指標
- 59の統語形式が使われているかどうかでスコアを出す
- 違う形式で2回使われていたら2点
| カテゴリ | 形式の数 | 得点(上限) |
|---|---|---|
| Noun Phrases (NP) | 11 | 22 |
| Verb Phrases (VP) | 17 | 34 |
| Questions and Negations (Q/N) | 11 | 22 |
| Sentence Structures (SS) | 20 | 40 |
| 計 | 59 | 118 |
- この計がIPSynの総合スコア(満点118点)
準備
CLANのインストール
形態素解析プログラム MOR のインストールと実行
- MORをかけて、形態素タグ(%mor)と文法依存関係タグ(%gra)をつけておく
- MORをかけてないと、IPSynは動かない。
注意点
- 節構造を持つ発話が原則100必要
- 少ない場合、+cオプションで発話数を指定する。+c50 オプションの指定で、50発話で実施
- 発話が足りないとエラーメッセージが出る
CAN'T FIND NECESSARY SAMPLE SIZE OF 30 OF COMPLETE UTTERANCES. *CHI: FOUND ONLY 20 COMPLETE UTTERANCES IF YOU WANT TO USE SMALLER SAMPLE SIZE, THEN USE "+c" OPTION
- Yang et al. (2022)で、50で十分だとの結論。
コマンド
ipsyn +t*CHI -leng ファイル名.cha
- +t で分析するティア
- -l で分析する言語 eng を指定
- 出力ファイル: ファイル名.ipsyn.cex
Tips
- 発話が複数のファイルに分かれている場合、+u オプションでまとめる
- その際、対象ファイルをワイルドカードで指定するとよい
ipsyn +t*CHI -leng 2007_1829_P*.cha +u +c20
> ipsyn +t*CHI -leng 2007_1829_P*.cha +u +c20
Using script file: C:\talkbank\clan\lib\ipsyn\eng.cut
ipsyn +t*CHI -leng 2007_1829_P*.cha +u +c20
Sat Aug 21 21:56:00 2021
ipsyn (12-Aug-2021) is conducting analyses on:
ONLY speaker main tiers matching: *CHI;
and those speakers' ONLY dependent tiers matching: %MOR:; %GRA:;
****************************************
From file <2007_1829_P01.cha>
From file <2007_1829_P02.cha>
From file <2007_1829_P03.cha>
From file <2007_1829_P04.cha>
From file <2007_1829_P05.cha>
From file <2007_1829_P06.cha>
From file <2007_1829_P07.cha>
From file <2007_1829_P08.cha>
From file <2007_1829_P09.cha>
From file <2007_1829_P10.cha>
Output file <2007_1829_P01.ipsyn.cex>
結果出力ファイル例 "2007_1829_P01.ipsyn.cex"
2007_1829_P01.ipsyn.cex.txt(259)
(参考)CLANに最初からついているサンプル
/examples/transcripts/ne32 folder ipsyn +t*CHI +leng 98.cha
98.ipsyn.cex が出力される(各発話にポイント付与)
98.ipcore.cex も出力される(分析対象の発話リスト)
IPSynのポイント付与方法
基本は、Scarborough 2008のAppendexに一覧が載っている
現在は、Altenberg et al. 2018のAppendex参照
具体的には、/CLAN/lib/ipsyn フォルダーに入っている eng.cut ファイルにルールが書いてある
- 例
RULENAME: V9 if INCLUDE: |mod ^ $V EXCLUDE: (I ^ think ^ so) + here + there DIFFERENT_STEMS: 1 if POINT: 2 INCLUDE: can't + won't
- INCLUDE行にマッチしたらポイントを得る
- EXCLUDE行に該当するものは除く
*CHI: it's a house ! %mor: pro:per|it~cop|be&3S det:art|a n|house ! %gra: 1|2|SUBJ 2|0|ROOT 3|4|DET 4|2|PRED 5|2|PUNCT
IPSynのルールの仕組み
MORコマンドが出力する形態素をまとめて「変数」として、その変数を使って、一般的ルールを記述している
- たとえば、名詞の$Nには、名詞,固有名詞,複数名詞の三つの形態素が含まれる。
- 修飾語$MODには、形容詞,冠詞,所有限定詞,数詞,指示代名詞,数量詞の六つの形態素が含まれる。
% The following is the list of variables used in the rules. % Variables are marked in rules with $, as in $N. N = |n,|n:prop,|n:pt V = |v,|cop,|aux AMC = |aux,|mod,|cop PRO = |pro:per,|pro:indef,|pro:refl,|pro:obj,|pro:sub,|pro:int MOD += |adj,|det:art,|det:poss,|det:num,|det:dem,|qn ART = |det:art DET = |det:dem ADV = |adv,|adv:tem NP = $N + $PRO + ($MOD ^ $N) + ($DET ^ $N) + ($ART ^ $N) + ($ART ^ $MOD ^ $N) + ($DET ^ $MOD ^ $N)
MORコマンドでつけられる形態素は細かい
https://talkbank.org/manuals/MOR.html
| Category | Code |
|---|---|
| Adjective | adj |
| Adjective - Predicative | adj:pred |
| Adverb | adv |
| Adverb - Temporal | adv:tem |
| Communicator | co |
| Complementizer | comp |
| Conjunction | conj |
| Coordinator | coord |
| Determiner Article | det:art |
| Determiner - Demonstrative | det:dem |
| Determiner - Interrogative | det:int |
| Determiner - Numeral | det:num |
| Determiner - Possessive | det:poss |
| Filler | fil |
| Infinitive | inf |
| Negative | neg |
| Noun | n |
| Noun - letter | n:let |
| Noun - plurale tantum | n:pt |
| Proper Noun | n:prop |
| Onomatopoeia | on |
| Particle | part |
| Postmodifier | post |
| Preposition | prep |
| Pronoun - demonstrative | pro:dem |
| Pronoun - existential | pro:exist |
| Pronoun - indefinite | pro:indef |
| Pronoun - interrogative | pro:int |
| Pronoun - object | pro:obj |
| Pronoun - personal | pro:per |
| Pronoun - possessive | pro:poss |
| Pronoun - reflexive | pro:refl |
| Pronoun - relative | pro:rel |
| Pronoun - subject | pro:sub |
| Quantifier | qn |
| Verb | v |
| Verb - auxiliary | aux |
| Verb - copula | cop |
| Verb - modal | mod |
https://sugiura-ken.org/wiki/