チュービンゲン生活

チュービンゲンに引っ越して2週間ほど経ったので、現時点での街やそこでの生活に関する感想を記しておこうと思います。

街自体は小さく、だいたいどこにでも徒歩で移動が可能です。それくらいのサイズなので、自転車を主な移動手段として用いている人が多い印象で、その点ではケンブリッジと似ています。街の大きさはケンブリッジ(徒歩30分で横断可)と同程度でしょうか。街の中で栄えている中心部の面積は割と広い印象です。これはドイツの街は勝手に拡大できない(建造物を建てて良い場所が法律で決められているそうです)ことと関連しているのかもしれません。街自体は拡大できないので、その代わりに栄えている部分が拡大するのではないかと思います。因みにドイツでは街の中心部(イギリスで言うCity Centre)をOld Townと呼ぶそうです。教会などがありそこから街が発展していったためそう呼ばれているのだと理解しています。

ドイツは物価が安いイメージがあったのですが、チュービンゲンに関しては東京はおろかケンブリッジよりもやや高いくらいかもしれません。家賃に関しては東京と同水準かやや低額ですが、そもそもチュービンゲンでは部屋を見つけるのが大変で、私に関しては許容可能な家賃を大幅に上げざるを得なかったので、そういったことを考えると家賃も安く抑えられるかどうかは運次第というところもありそうです。一方で給与水準はアカデミアに関して言えば、決して高くないイギリスよりも更に低いので、トータルで見ればイギリスに住んでいた時よりも苦しい生活になりそうです。これがチュービンゲン特有の話なのかドイツの他の街にも当てはまるのかはわかりません。

生活ができれば良いという基準であれば、ドイツ語は全く必要ありません。大学街ということもあるのでしょうが、街の人たちも大抵の人は英語をある程度は話すことができます。但し当然ながら店の看板やレストランのメニューなどは全てドイツ語で書かれているので、ドイツ語ができる(少なくとも読める)と利便性が大幅に増すのは間違いありません。また、DHLの支店でのみ英語対応をしてもらうことができませんでした。そんなわけで私はドイツ語のクラスに通い始めました。受講生の母語や出身地(南アフリカ・パキスタン・イタリア・アルバニア・ギリシャ・エクアドル・フィンランド・ルーマニア・コソボ・カザフスタン)が様々であるため、基本的にはドイツ語のみで授業が行われます。雰囲気が高校のESLのクラスと大変似ています。

ドイツではresidence registrationという、日本でいう住民票のようなシステムがあり、ドイツ内の住居に住み始めて2週間以内に市庁舎で登録をしなければなりません。ただしドイツ人やEU国出身者とは違い、日本人(など居住にビザが必要な人たち)は外国人局(Ausländerbehörde)というところで登録する必要があります。私は滞在期間を全てカバーするビザを持っているのであれば外国人局ではなく通常のRegistration Officeで登録すれば良いと大学で教えられたためそこに行って(1時間半以上待たされて)みましたが、ビザの有無にかかわらず私もやはり外国人局に行かなければいけなかったようで、翌日そこで登録を行いました。登録自体はほんの数分でしたが、登録に必要な書類には大家などに書いてもらうものもあり、その準備に多少時間を要しました。

SIMカードはイギリスでも使っていたO2と契約しました。SIMカードの契約のためにはドイツの銀行口座が必要で、まずはそこから始める必要があります。ただ銀行口座は給与を受け取る際などにも必要ですし、作っておいて損はありません。またチュービンゲンは(ドイツは?)東京程度にはキャッシュ社会なので、キャッシュを常に持ち歩く必要があります。そのためにもこちらでの銀行口座は必要です。銀行口座を開くには上記のresidence registrationを行っていなければならないと言われるのですが、実際はそうでなくても開ける場合が多いようです。
Standard

MDA論文が出ました

多次元分析(MDA)を用いて学際的研究論文のディスコースを分析した下記の共著論文がInternational Journal of Corpus Linguistics誌に掲載されました。

Thompson, P., Hunston, S., Murakami, A., & Vajn, D. (2017). Multi-Dimensional Analysis, text constellations, and interdisciplinary discourse. International Journal of Corpus Linguistics, 22(2), 153–186. doi: 10.1075/ijcl.22.2.01tho [リンク]

本論文は2013年8月から2015年10月まで勤務していたバーミンガム大学でのIDRDプロジェクトの成果の一部です。まずは11の研究分野のジャーナルを対象に、学際的な研究分野のジャーナルと非学際的な研究分野のジャーナルはどのように異なるのかをMDAの各次元に基いて見ています。その後に、Global Environmental Change(GEC)というジャーナルに焦点を当て、そこに出版された論文をMDAの次元得点に基いてクラスタリングを行い、ボトムアップ式にGEC論文のパターン(論文ではconstellationと呼んでいます)を見いだしています。また副次的にランダムフォレストを用いて、個々の論文が次元得点を基にどの程度それが出版されたジャーナルに正しく分類できるかを見ています。MDA→クラスタリングの流れ自体はBiberが既に1980年代に行っていますが、それをより狭い対象(クラスタリングに関しては一つのジャーナル)で行い、それでも意味のあるパターンが見いだせたというのが新しい点です。
Standard

チュービンゲン大学の博士研究員になります

4月中旬に任期満了によりケンブリッジ大学を退職した後、5月下旬に日本に帰国して江ノ島近郊に滞在していましたが、10月1日より半年間、ドイツはチュービンゲン(独:Tübingen; 英:Tuebingen)大学で博士研究員(postdoctoral researcher)として勤務することになりました。私の博士論文の外部審査員であったDetmar Meurers氏や言語統計で著名なHarald Baayen氏がいらっしゃるところです。私自身はLEAD Graduate School and Research Networkという学際的な教育研究を行うセクションの所属となります。統計関係の授業を一コマ担当する以外は研究に注力できるはずです。ドイツで研究できる機会は今後もそうないでしょうし、色々と学びたいです。

渡独するに当たり、主にビザ申請と住居探しという2点が労力を必要としました。まず研究滞在ビザに必要な書類はここに書かれているのですが、諸々の確認のためにドイツ大使館に問い合わせを行ったところ、上記ページの書類に加え、学部から博士まで全ての大学の学位証明書と滞在期間全てをカバーする保険 1の証明書も提出するように言われました。またその際に、私の滞在が研究滞在ビザの対象となるかどうかを領事官に確認してもらえました。ビザ自体は保険がカバーしている期間に合わせて出るようです。ビザは予約を取ってドイツ大使館で申請するのですが、8月12日の時点で最短でも9月18日まで待たねばならず、ビザ申請が許可されビザを入手するまでに更に一週間ほどかかったためビザの入手はギリギリ(渡航日の前日!)となってしまいました。ビザ申請予約は大阪にある総領事館ではもう少し空きがあるようでしたが、住んでいる場所により申請場所が決まるのでどうしようもありません。

住居探しに関しては更に大変でした。チュービンゲンは大学街なのですが、大学規模が拡大し続けているにもかかわらず街の住居数はそれほど増えていないため、部屋探しは常に大変なようです。年度初めの10月は特に酷く、大学のジムで寝泊まりする学生もいるとのこと。ケンブリッジも大学街でやはり大学規模の拡大に住居数が追いついていない街でしたが、チュービンゲンほど酷くはありませんでした。チュービンゲンでは私が問い合わせた中でも、一件の空きアパートに対して24時間で150件の問い合わせがあったケースもあり、競争率だけだと就職活動よりも厳しいかもしれません。チュービンゲン大学にはWelcome Centerという我々のような国外から来る研究者の面倒を見てくれるところがあるのですが、そこも住居に関してはほとんどお手上げのようで、数件(こちらの条件を満たさずあまり魅力的ではない)物件を紹介してくれたほかは、物件紹介のウェブサイトを教えてくれたのみでした。

私は結局、ここここここここのウェブサイトで物件を探していました。とりわけここが役に立ちました 2。ウェブサイト上でおそらく数十件の物件に関して家主や現借主にメッセージを送りましたが、その過半数はレスポンスがなく、あった場合も他の人に貸すことが既に決まっている(あるいはそう決めた)という連絡や、主に賃貸期間に関する条件が合わない(もっと長期に亘り貸与したい大家が多い)ため貸せないというものでした。8月中旬から部屋探しを始め、9月中旬になっても何も決まっていなかったため気を揉みましたが、幸いにして渡航一週間前くらいに幾つか良いレスポンスがありました。結果的に最初の2週間強はある物件に滞在し、その後は数日間のホテル暮らしを経て、10月中旬から私がドイツを去る4月初旬まで別の物件に滞在する予定です。しかしそのためには当初予定していた家賃の上限を上げざるを得ず、半年間なので収支が多少マイナスでも何とかなるものの、これが年単位だと借りれないだろうというような物件になりました。折角なので、私の収入ではなかなか住めないようなアパートでの生活を半年間楽しみます。

Notes:

  1. 私はCare Concept社のものに加入しました
  2. サイトによらず、詐欺が横行しているようです。私も詐欺だと思われるメッセージを数件受信しました。私の場合は「自分は国外にいるから直接会うことができない。Airbnbを通じて家賃を支払ってくれ」というメッセージと共に、Airbnbに似せた他サイトに導かれる、という手口です。
Standard

トピックモデルの論文が出ました

トピックモデルをコーパス言語学コミュニティーに紹介することを目的とした下記の論文がCorpora誌に掲載されました。オープンアクセスですので、どなたでもご覧頂けます。

Murakami, A., Hunston, S., Thompson, P., & Vajn, D. (2017). ‘What is this corpus about?’ Using topic modelling to explore a specialized corpus. Corpora, 12(2), 243–277. doi:10.3366/cor.2017.0118 [リンク]

本論文は2013年8月から2015年10月まで勤務していたバーミンガム大学でのIDRDプロジェクトの成果の一部です。プロジェクトも中盤に差し掛かった2014年の春頃に、プロジェクトミーティングで頻繁に「トピック」という語が出てくるようになり、当時名称を聞いたことがあった 1程度のトピックモデルが使えるのではないかと思って調べてみたことと、プロジェクトメンバーの一人が発表した学会で計算言語学系の研究者にトピックモデルを薦められたことが、本手法を用いるきっかけとなりました。

本論文ではトピックモデルの直感的な説明の後にGlobal Environmental Changeというジャーナルに1990年-2010年に出版された論文を対象にトピックモデルを構築し、論文内でのトピックの遷移(例えば論文の前半で顕著なトピック vs 後半で顕著なトピック)、ジャーナルの時系列変化(1990年→2010年で扱うトピックがどう変わったか)、異なるトピック構造を持つ論文の特定(例えば特定のトピックのみを扱った論文 vs 複数の主題がある論文)、語の多義性解消を事例研究として扱っています。更に意味タグとキーワード分析というコーパス言語学ではより伝統的な手法との比較を行っています。トピックモデルは文脈を考慮に入れないbag-of-wordsアプローチであるにもかかわらず、比較的直感的な結果が出ているのが面白いところです。

なお、本論文がオンラインに掲載される一週間ほど前に、ランカスター大学のAndrew Hardie氏がトピックモデルの使用を批判する基調講演をCorpus Linguistics 2017で行っています。本論文にも言及されていますし、こちらも併せてご覧ください。

本論文に関わるジャーナルとのやり取りは以下のように進行しました。

2015年10月7日: 投稿
2015年10月20日: 長すぎるので1万語以内に抑えるようにとの指示を受ける
2015年11月2日: 1万語まで削って再投稿
2015年12月14日: 査読結果の通知(minor corrections × 2人)
2016年1月28日: 修正後に再投稿
2016年1月29日: Accept通知
2017年4月〜7月: proofの確認や微修正等々を数ラウンド
2017年8月1日: オンラインに掲載される

Notes:

  1. 松浦さんのブログを通してだと思い込んでいましたが、トピックモデルに関する記事の投稿日を確認したところ2015年初頭だったので、私の記憶の誤りのようです。追記:これはブログを引っ越されたからであるとご本人に伺いました(下記)。ご指摘ありがとうございました。元の記事は2014年2月のものとのことで、私がトピックモデルを初めて知ったのはやはり松浦さんのブログを通してだと思います。 それはそうと、松浦さんのブログのこの記事の②の図はトピックモデルを直感的に理解するのに非常に役立ちました。改変版を学会発表等でも使用させて頂きました。
Standard

Albert Valdman賞

もう一ヶ月以上前のことになりますが、昨年SSLA誌に掲載された論文(L1 influence on the acquisition order of English grammatical morphemes: A learner corpus study)がAlbert Valdman Awardという賞を受賞しました。これはその年にSSLA誌に掲載された中で最も優れた論文に贈られる賞で、今年で設立三年目になるようです。受賞の旨はこちらに掲載され、私達のコメントがつい先日ここここに掲載されました。

受賞コメントやこちらのブログ記事にも書きましたが、私がSLAを初めて面白いと思ったのは学部の授業でNatural Orderについて学んだ時ですので、そのトピックで初めてのジャーナル論文を書き、その論文がSSLAから賞を頂くことになるとは、話として出来過ぎです。本賞受賞時が研究者としての最盛期だったと言われないように今後も精進していきます。

ところでこの賞、outstandingな論文に贈られると聞いていますが、具体的にはどのように評価しているのでしょう。SSLA(を含むCUPの全てのジャーナル?)では昨年あたりからAltmetricという論文のインパクト評価の指標がジャーナルの公式サイトに表示されるようになりましたが、これを見てみると確かに当該論文の値は相対的に高いです 1。ただし内訳を見てみると、その多くがツイッターでの言及で、仮にこういった値が影響するのであれば、掲載後に積極的に宣伝することも重要になるのだろうか、などと考えました。

Notes:

  1. 理由の一端は受賞後にブログやツイッターで取り上げられたからですが、受賞前も割と高い値でした
Standard

タスク効果論文

Language Learning誌のEarly Viewに下記の共著論文が掲載されました。

Alexopoulou, T., Michel, M., Murakami, A., & Meurers, D. (2017). Task effects on linguistic complexity and accuracy: A large-scale learner corpus analysis employing Natural Language Processing techniques. Language Learning. Advance online publication. doi: 10.1111/lang.1223 [リンク]

様々な言語的複雑性や正確性の指標の横断的発達並びにそれらへのタスクやタスクタイプの効果を学習者コーパス(EFCAMDAT)に基づき分析した実証研究で、数ヶ月後に出るLanguage Learning誌の特集号(Language learning research at the intersection of experimental, corpus-based and computational methods: Evidence and interpretation)に載録されます。

学習者コーパス研究ではタスク効果に頻繁に言及されるものの、それを中心に据えた論文はあまり(全く?)ありませんでした。SLAでのSkehanやRobinsonの枠組みを用いるには典型的な学習者コーパスのデータは粗すぎるというのが私のこれまでの印象でしたので、今回、タスクの特徴付けを事後的に行ってもある程度は予想に沿った産出になるという結果は面白いと思います。

また本プロジェクトは私がケンブリッジ大学に着任直後(2015年11月頃)に始まり、離任直前にオンラインに公開されました。これがケンブリッジでの期間の主成果というわけではありませんが、この1年半弱はコンスタントにこの論文関係のことを行っていたので、将来ケンブリッジでの任期を振り返る時、この論文を思い出すのではないかと思います。

本論文に関わるジャーナルとのやり取りは以下のように進行しました。

2016年6月3日: 投稿
2016年6月8日: 著者の匿名化と全体のフォーマット(ダブルスペースなど)を修正するようにとの依頼を受け、微修正後に再投稿
2016年7月19日: Round 1の査読結果の通知(2名分)
2016年8月12日: 3人目の査読者のコメントが送られてくる
2016年9月2日: 修正後に再投稿。直後に小ミスに気づき修正し、unsubmitしてもらい同日再投稿
2016年11月20日: Round 2の査読結果の通知(査読者は1名のみ)。この時点で原則acceptされる。
2016年12月16日: 修正後に再投稿
2016年12月18日: Acceptの通知
2017年1月23日〜: proofの確認や微修正等々を数ラウンド
2017年3月20日: オンラインに掲載される

今後もこのメンバーで研究を続けていく予定ですので、第二弾やそれ以降の論文もご期待ください。

Standard

Asia-Pacific Corpus Linguistics Conference 2016

北京は北京航空航天大学で開催された標題の学会に参加しました。前回、2014年に香港で開催された時 1に続き、二回連続二度目の出席です。中国本土は2009年に広州を訪れて以来で、北京語圏には初めての訪問でした。本学会は土日の二日間のみの開催であったことと、私自身が月曜日の夜にケンブリッジで授業を行わなければならなかったことにより、二泊五日の強行日程となってしまいましたが、知人が運営に深く携わっていて参加を促されていたことやlangstatさんからお誘いを受けたことで、参加を決めました。

行った発表は以下の通りです。Multidimensional Analysis Tagger (MAT)を用いてICNALEのサブコーパスをタグ付けし、Biber (1988)が特定した6つの次元上に各テキストをマッピングすることにより、学習者の話し言葉と書き言葉にはどのような差異が観察されるかを見た研究です。

Kobayashi, Y., & Murakami, A. Contrastive analysis of L2 speech and writing: A multi-dimensional approach

さて本学会では参加者の大半を中国語話者が占めていたため、コミュニケーションは頻繁に中国語で行われ、初日に行われた参加者全員の写真撮影に至っては指示が全て中国語でした。またアジアでのコーパス言語学の学会であるにもかかわらず日本人の参加者は少なく、我々を含めて発表は三件のみでした。これは開催時期の問題もあるのかもしれません。そして良くも悪くもコーパス言語学の学会らしく、発表の質もマチマチだと感じました。しかしそれでも私にとってはバーミンガム時代の友人や3-4年前に他の学会で知り合った人達などと再会でき、その意味では参加して良かったです。

また学会以外でも現在北京在住のPhD時代の友人達と会え、彼等に美味しい北京ダックのレストランに連れて行ってもらえました。万里の長城も訪れたのですが、天候が悪く霧(?)のため数十メートル先も見えない状態でした。またタクシーをチャーターして行ったのですが、往復で800元と現地の物価を考えると割高であったこともあり、あまり良い思い出とはなりませんでした。

今回は中国本土ということもあり、事前にVPNをMBPとiPhoneの双方にインストールして行きました。ケンブリッジ大学が提供しているVPNHexatechというアプリがとりわけ役立ちましたが、そもそも会場にWi-Fiがなく、またローミングも非常に遅く使い物にならなかったため、実質的に会場ではインターネットアクセスがない状態でした。

次回の本学会は2018年に日本で開催されるようです。その時にどこで何をしているのかわかりませんが、可能であればまた参加したいと思います。

Notes:

  1. 当時の参加報告はこちら→こちら
Standard

EUROSLA 2016

フィンランドはユバスキュラで開催された標題の学会に参加しました。EUROSLAは2010-2013年に参加していたので 1、3年振り5度目の出席となります。ユバスキュラはこれまでに参加したEUROSLAの開催地の中では比較的交通の便が悪く、通常は午後の早い時間に学会が終わるとその日中にケンブリッジに戻れるのですが、今回は翌日に帰英せざるを得ませんでした。またユバスキュラ‐ヘルシンキ間の便は毎日飛んでいるわけではないため、ユバスキュラからタンペレまで電車で移動し、そこからヘルシンキ経由でヒースローまで戻ってきました。 2

さて、今回の学会では私は以下の二件の発表を行いました。
  • Alexopoulou, T. & Murakami, A. Incomplete acquisition of relativisors in L2 English. 要旨はこちら
  • Murakami, A., Michel, M., Alexopoulou, T., & Muerers, D. Analyzing learner language in task contexts: A study case of linguistic complexity and accuracy in EFCAMDAT. 要旨はこちら
前者は共同発表者が急遽学会に参加できなくなってしまったため、学会の前々日になって私が発表を行うことになってしまいました。しかし私がほぼノータッチの研究である上に、内容も馴染みのない言語学寄りで、結局共同発表者が作成した原稿をほぼ丸読みする形になってしまい 3、オーディエンスの方々には申し訳ありませんでした。学会最終日で更にConference Dinnerの翌日の朝一の発表だったので聴衆は2-3人だと踏んでいたのですが、蓋を開けてみると10人以上に来て頂けました。

また、もう一方の発表も準備不足のまま会場入りしてしまい、学会初日と二日目に共同発表者と必死に打ち合わせ&スライド修正を行いました。最終的に自分たちの発表(やはり最終日でした)の20分ほど前までスライドをいじっていました。本発表では私は第一発表者であるにもかかわらず発表を担当しませんでした。それが功を奏してか、共同発表者の見事なプレゼンテーションにより、オーディエンスには好評であったようです。

本学会で私がとりわけ面白いと思ったのはAndrea Revez氏他による「L2 revision behaviors, written text quality, and working memory capacity: A mixed methods study」という発表です 4。ライティングのプロセスを視線追尾とキーストローク、それに刺激再生法を組み合わせて見ることにより、作文時の修正とワーキングメモリの関係を調べるという研究です。要旨はこちらにあります。

この研究もそうですが、今年のEUROSLAではeye-trackingを用いた研究が非常に多かった印象です。2012年頃のEUROSLAで、最近は処理を見る研究が増えているという旨を以前からEUROSLAに参加されている方に伺いましたが、その流れが更に加速しているのでしょうか。そういえば私の所属する学科でも視線追尾の新しい機器を導入したと聞きました。

ところで今回のEUROSLAは日本人の比率が以前よりも更に高かったように思います。「東アジア系の人を見かけると大体日本人」というような状況でした。この分野の日本人研究者の活躍は目覚ましいですね。

来年のEUROSLAは英国のレディングで開催されるようです。EUROSLAは2014年にも英国のヨークで開催されているので少し意外でした。来年はどこで何をしているのかまだわかりませんが、参加できるようであればまた参加したいと思います。

Notes:

  1. 当時の参加報告はこちら→2010年2011年2012年2013年
  2. いま考えるとヘルシンキ‐ユバスキュラ間は電車で移動するべきで、実際多くの学会参加者がそうしていたのですが、何をどう思ったのか、本学会のための交通の手配をしていた時の私はヘルシンキ経由でタンペレまで飛ぶ便を取ってしまいました。ヘルシンキ-タンペレ間は僅か25分間のフライトでした。
  3. 「featural composition」「(featureの)underspecification」などの表現を私が学会発表中に使用することは今後はない気がします。
  4. 全くの余談ですが、この発表では実に91枚のスライドを20分間に詰め込んだそうです
Standard

The 38th Annual Meeting of the Cognitive Science Society

米国はフィラデルフィアのPennsylvania Convention Centerで開催された標題の学会(通称CogSci)に出席しました。この学会には初めて参加するのですが、認知科学全体をカバーしているだけあり(私がよく参加しているEUROSLACLなどと比べて)規模が大きく、950人が事前登録していたそうです。ただ認知科学と言っても(近年は?)認知心理学周辺の研究が多く、本学会でもその傾向は顕著でした。また私が見た範囲では研究の水準が高く、レベルがピンキリのCLなどと比べると面白い研究が多い印象を受けました。とは言え採択率が低いわけではなく、今回は口頭発表で3割強、ポスター発表で更に3割強が採択されたようです。ただし、CogSciではアブストラクトではなく2段組6ページの論文で審査を行い、その論文が予稿集として公開されます。つまりそもそも発表申し込みをするためには6ページの論文を書かなければならず、望みがないと判断した場合、その前段階で発表を諦めるのかもしれません。

本学会前日にはワークショップチュートリアルが多数開講されるのですが、私は「認知・意思決定の量子モデル」とどちらにしようか迷った結果、深層学習のワークショップ(Contemporary Deep Neural Networks)に参加しました。コネクショニズムのモデルで有名なJames McClelland氏らが主催者なのですが、蓋を開けてみると既に深層学習についてそれなりに知識がある参加者向けで、深層学習はおろか、ニューラルネットワークモデルを一度も走らせたことのない私のような参加者(ほとんどいなかったように思いますが)にはついていくのが難しい内容でした。それでもGoogle DeepMindの人の話を聞ける機会は我々の分野ではそうありませんし、興味深い経験ではありました。

認知科学の学会なので第二言語習得に関する研究は少なく、三件あった基調講演はいずれも言語に関するものではありませんでしたが、それでも言語処理に関する発表や副次的に言語獲得に言及する発表は多く、少なくとも個別発表に関しては十分に面白いと感じることができました。またニューラルネットワーク系のものを中心とする学習・習得のコンピューターモデルを用いた研究が多く、これはEUROSLAなどには見られない傾向だと思います。脳機能イメージングなど脳を見る研究は思っていたよりも少なかった印象です。

私は「Longitudinal L2 Development of the English Article in Individual Learners」というタイトルでポスター発表を行いました。用いたポスターはこちらにアップロードしています。また論文はこちらから読むことができます。ポスター発表自体は1時間半のセッションで5-6名にしか来てもらえませんでしたが、第二言語習得研究に携わっている参加者は決して多くないこと、セッション当たり160件を超えるポスター発表が同時進行で行われたこと、ポスターセッションは(会場外で各自でとる)昼食直後であることを考えると、やむを得ないのかもしれません。ただし、後ほど知人に助言を受けたように、あまり第二言語習得である旨を前面に押し出さず、より汎用的な知見・示唆を中心に据えたタイトル・内容にした方が良かったように思います。これは学会の参加者層に考えを巡らせなかった私のミスです。今後のCogSciで発表する機会があれば、もう少し広く学会がカバーする分野を見て発表内容等を決めようと思います。

本学会で私が拝聴した中でとりわけ面白いと感じたのがランカスター大学のPadraic Monaghan氏による「Degeneracy results in canalisation of language structure: A computational model of word learning」という発表です。こちらから論文を読むことができます。論文の概要は以下の通りです。

背景
  • 言語インプットは人によって異なるのに、人々がおおよそ同じ言語体系を獲得できるのはなぜか(canalisationの問題)
  • 従来はインプットの構造化に制約を与える(生得的な言語特性など)ことにより、それを説明しようとしてきた
  • しかし近年、コミュニケーション時に存在する複数の情報を組み合わせることにより、その学習が可能となっているのではないかという話が出てきている
  • 複数の要因が絡み合うと情報処理構造は安定さを増すことが知られており、それがcanalisationに繋がっているのではないか
  • 近年、このように言語環境が言語学習に寄与するという考え方が再び注目を浴びている
  • どのように複数の情報源が統合されるかについては、幾つかの説明がある
  • 一つの可能性は、言語学習では複数のキューが絡み合い、その結果として、(インプットなど)環境的な要因にゆれがあっても安定したシステムに繋がる、というもの
  • 複数の構造的に異なる要素が同一の機能を果たしたり同一のアウトプットを生むという言語の特性(degeneracyと呼ぶ)により、特定のキューのみに頼ることのない、頑健なシステムが構築される
  • 言語や他の複雑系のdegeneracyのコンピューターモデルは、degeneracyが学習の頑健性に重要であることを示している
  • 本論文では複数の要因が絡み合うコンピューターモデルをproof of conceptとして用いることにより、degeneracyがcanalisationに繋がることを示す
  • 例として語の学習を取り上げる。語の学習は難しい(いわゆるGavagai問題で)
  • キューとして分布(冠詞の後は名詞、など)やプロソディーがあり、それらは語の形式と意味のマッピングの学習を促進することが知られている
  • 状況間の統計的情報(同じ形式-意味の結びつきに異なる状況で何度も触れること)もキューの一つ。ジェスチャーなどもキュー。
  • しかしこれらのキューは単独ではいずれも学習に丁度良い制約を与えるものではない。例えば冠詞の後には形容詞も来うるので、分布のキューは完璧ではない。
  • 実は特定のキューの信頼性が低いのはむしろ良いことである。仮に一つのキューのみに頼ってしまうと、そのキューがない時にコミュニケーションが疎外され得る。
  • 一方で、複数のキューが存在するデメリットは、より多くの情報を一度に処理しなければならなくなること
  • 複数の情報源を統合することにより語の形式と意味の結び付きが促進されるか否かを検証するコンピューターモデルを構築した
  • 二種類のシミュレーションを行った。
    1. 個々のキューを加えると習得は容易になるか否かを検証する。しかしキューの信頼性が高いと、そのキューが不存在の場合に形式と意味のマッピングの習得が疎外されることが予測される(=頑健性が犠牲になる)
    2. ノイズがある複数のキューを加えると習得は促進され、また頑健になるか否かを検証する
モデル
  • hub-and-spoke architectureのモデルを用いることにより、複数の異なるモダリティーからの情報をインプットとして処理資源に渡す。そうすることにより、学習をサポートするのに最適な情報統合方法をモデルが決められる。
  • このモデルは先行研究にある語学習の連合モデルやcross-situationalな語学習のモデルと一貫している
アーキテクチャ
  • recurrent backpropagation neural networkのモデル
  • 100ユニットの隠れ層が一つあり、そこに様々なモダリティーからの情報がインプットとして与えられ、意味を表す層にアウトプットする
  • 音声情報を表すインプット、視覚情報を表すインプット、分布情報を表すインプットがある
  • (村上注:詳しくは本文のFigure 1を参照)
表象
  • 100語を学習する。意味を表す層のユニット数も100で、各語が1つのユニットに対応する
  • 音声情報に関しては、1語が(全10種類ある内の)4つの音素から成っている。各音素が5つのユニットに対応していて、内2つがアクティブである。
  • 視覚情報に関しては、20ユニットから成っており、各語において内8ユニットがアクティブな状態である
訓練
  • 二語が同時に提示され、その内の一語のみインプットに表象される
  • すなわち、音声情報には二語分のスロットがあるが、その内の一語は提示された二語の内の一語の音声情報が正しく表象されるが、もう一語分のスロットには無作為に選択された他の語の音声情報が表象される。視覚情報のインプットも同様。
  • プロソディーとジェスチャーのキューはそれぞれ音声情報、視覚情報の活性度を二倍にすることにより表現した
  • (村上注:つまり、何もキューがない状態でも語に対応する音声情報や視覚情報はあるが、キューがあることにより、それらが強化されるということ)
  • 分布は語の外在的なキューとして実装された。すなわち、ある語がカテゴリー1に属する語だと、分布層のユニット1が活性化した
  • 単一キューの検証時はキューの信頼性は100%とし、複数のキューの貢献を検証する際はキューの信頼性を25%から100%まで変化させた
  • 活性化のサイクルには6ステップあり、Time 1では視覚情報と音声情報がインプット層に表現され、Time 2では活性情報がインプットから隠れ層、隠れ層から意味の層、そして隠れ層から隠れ層へと伝搬される。Times 3-6では意味のアウトプット層に意味が表現される。
  • 1エポック当たり100語それぞれが一度ずつ対象語として出現した。最大10万エポックまで訓練された。
  • 初期値を変えるなどして20種類のモデルを構築した
テスト
  • 意味の層で最も活性度の強いユニットが対象語と一致していれば、モデルは正確であると判断した
  • 訓練中の正確性と、100語全て正解した時点を見た
  • 訓練後に、テスト時にキューが不在でもモデルは正確なアウトプットを産出するか否かを見ることにより、モデルの頑健性を検証した
結果
<単一のキューの場合>
  • プロソディーのキュー又はジェスチャーのキューがあると、キューがない場合と比較してより早く100%の正確性に達した
  • 分布のキューはキューなしと大差なかった
  • プロソディーのキューとジェスチャーのキューは分布のキューよりも効果があった
  • プロソディーのキューとジェスチャーのキューは差なし
  • 頑健性を検証するため、それぞれのキューがない状態での正確性を見てみたところ、プロソディーのキューとジェスチャーのキューはそれぞれが不在だと正確性がキューなしよりも劣る
  • 分布のキューはなくてもキューなしの状態と同等の正確性だった
<複数キューの場合>
  • それぞれのキューの信頼性が高いほど、学習が速い
  • 頑健性については、単一キューの場合と同様にテストしたところ、信頼性が50%→75%→100%と上昇するに従い、正確性は低下した
  • キューの信頼性が低くても学習が速くなったり頑健になったりするわけではないが、キューの出現率が50%を超えると、モデルの頑健性が損なわれる
  • 50%の信頼性が学習速度と頑健性の最適なトレードオフを実現するポイントのようだ
考察
  • 複数のキューに注意することは処理負荷を増やすが、一方でそれは言語学習に二つのメリットがある
    1. 学習の速度と正確性が向上する。キューの生起確率が50%だとしても、キューがないよりは学習が促進された。
    2. degenerateな環境から学習すると頑健になり、キューの出現が安定していなくても(=コミュニケーションの状況により異なっても)そのキューを活用できる。
  • しかしこの頑健性はキューにノイズがある時にのみ観察された。従って、語学習におけるcanalisationは複数の情報源が絡み合う結果だと見ることができる。
  • 更に、学習速度と頑健性にはトレードオフが観察された。キューの信頼性が高いほど学習速度は速くなる。情報源が増えるほど頑健になるが、それはそれぞれの情報にノイズが混ざっていた場合のみである。
なお、当該研究は本学会でComputational Modeling賞という賞を受賞しています。この賞はその名の通りコンピューターモデルを用いた優れた研究を表彰するものですが、いくつかの下位分野があり、その中の「言語」に関するモデリングの賞を受賞しています。

本学会は来年はロンドンで開催されるとのことです。来年どこで何をしているのかわかりませんが、参加できるようならまた参加してみたいと思います。
Standard

CogSci予稿集

来週のCogSciを前に、予稿集がオンラインで公開されました。私たちの論文はここからダウンロードできます。書誌情報は以下の通りです。

Murakami, A., & Alexopoulou, T. (2016). Longitudinal L2 development of the English article in individual learners. In A. Papafragou, D. Grodner, J. Trueswell, & D. Mirman (Eds.), Proceedings of the 38th Annual Meeting of the Cognitive Science Society (pp. 1050–1055). Philadelphia, PA: Cognitive Science Society.

本論文ではEFCAMDATに基いて、L2英語の冠詞の正確性を対象に、集団レベルの発達パターンと個人レベルの発達パターンは必ずしも一致しないことを示し、集団レベルのデータを用いて個人レベルの発達を類推することは問題がある旨を主張しています。

また、来週の当該学会で使用するポスターをここにアップロードしました。論文を読むのは面倒だがポスターくらいならチラ見しても良いという方はそちらをご覧ください。
Standard