Nick Ellis氏との共著論文がLanguage Learning誌に掲載されました

ミシガン大学のNick Ellis氏との共著論文がLanguage Learning誌に掲載されました。2018年8月に現職に着任した後に始めた、最初のプロジェクトの成果です。オープンアクセスで、論文はここから、データとRコードはこちらのOSFレポジトリからダウンロードできます。

【概要】

用法基盤理論ではインプット内での語や構文の分布(頻度など)が(第二)言語習得・処理・使用に影響を与えるとされていますが、それが英作文での屈折形態素の正確性にも影響を及ぼすのか否かを検証した研究です。具体的には以下の分布的要因を対象としました。

  1. 可用性(availability)。当該屈折形にどの程度触れているかを表す要因で、当該屈折形のトークン頻度を用いて測定しました。例えばsaysなどの高頻度な語形の屈折形態素はprefersなどの相対的に低頻度な語形の屈折形態素よりも正確性が高いだろうというのが仮説です。
  2. 随伴性(contingency)。手がかり(cue)と結果(outcome)の確率的な連合を指します。随伴性自体は様々なものが考えられますが、本研究では手がかりが語のレンマ、結果が屈折形です。具体的には、屈折形の頻度を対応するレンマの頻度で除した値 (信頼性 = P(屈折形 | レンマ))、すなわち当該屈折形がレンマの中に占める割合を用いて測定しました。例えばdecidedのように過去形でよく用いられる語はlikedのようにあまり過去形で用いられない語と比較して、過去形の-edの正確性が高いだろうというのが仮説です。
  3. 定型性(formulaicity)。どの程度定型的な(決まった)表現であるかを指します。本研究ではΔPという指標を用いて、周囲の語から対象屈折形が予測できる度合いを計算し、それを定型性としました。例えばpractice ____ perfectという表現だと空欄に入るのはmakesである可能性が高いと予測できるのでmakesの屈折形態素(三単現の-s)の正確性も高くなる傾向にある一方、____ do notだと何が入るか予想しづらいため、例えばsays do notという表現だったとしても、そのsaysの屈折形態素の正確性は低くなるだろうというのが仮説です。

変数の操作化等の手法に違いはあるものの、Guo and Ellis (2021; Front. Psychol.)は誘出模倣課題(elicited imitation task)を用いて可用性・随伴性・定型性の屈折形態素の正確性への影響を見ていて、3つの要因全てが屈折形態素の正確性と正の相関があったことを報告しています。私達の研究はGuo and Ellis (2021)の概念的追試ということになります。

我々の研究ではGuo and Ellis (2021)と同様に、過去形の-ed、進行相の-ing、三単現の-s、複数形の-sを対象としました。学習者の英作文データは大規模学習者コーパスであるEFCAMDATから、可用性・随伴性・定型性の値はCOCAを参照コーパスとして用いて算出しました。

結果:随伴性は全ての形態素の正確性と正の関係にある一方、可用性と定型性の明確な影響は観察されませんでした。また随伴性と学習者のL2熟達度との交互作用は認められませんでした。つまり随伴性と正確性の関係は高熟達度の学習者で低くなるとは限らないということです。

随伴性に関しては、(語の意味を表していると考えられる)レンマが屈折形の手がかりとして機能しており、第二言語学習者はそのような随伴性を屈折形態素を処理する際に用いているということを、本研究は示唆しています。これは用法基盤理論の予測に沿う結果で、本論文では具体的に連合学習理論や構文文法、第二言語習得の(アスペクト仮説などの)機能理論と合致している旨を説明しています。

一方で、可用性と定型性の明確な影響が観察されなかったのは、Guo and Ellis (2021)が誘出模倣課題でそれらの影響を確認していることを考えると面白い結果です。これにはいくつかの理由が考えられます。例えば、誘出模倣課題と(EFCAMDATに含まれる)自由産出作文のタスクの差は大きく、誘出模倣課題が暗示的・自動化された処理に依拠する一方、自由産出作文は明示的・意識的な処理に依拠する傾向にあります。すると暗示的・自動化されたシステムがボトムアップ式に提供する定型性等の効果(例えば ____ do notの空欄を埋める語は予想しづらい等)を作文時の意識的な方略(例えば一度書いたものを修正するなど)が上回ってしまい、結果的に定型性等の影響が観察されなかったと考えられます。

【経緯】

掲載までの経緯は以下の通りです。投稿以降は非常にスムーズに掲載まで至りました。

(投稿前)
  • 2018年9月:EUROSLA@ミュンスターで本プロジェクトについて話し合う。当時既にGuo and Ellis (2021)の結果が概ね出ており、それをスケールアップした(大まかな意味での)追試を行うことで合意する。
  • 2018年10月-12月:特に何もできず
  • 2019年1月-9月:最初の数ヶ月間で一気にスクリプト等を書き、その後に分析も一応の形で仕上げる。5月-9月にSLRFやLCRなど各所で発表
  • 2019年10月-2020年6月:現職で初めての授業等で何もできず
  • 2020年7月-10月:データやその分析方法に多少の変更を加え再分析。初稿を仕上げて共著者に送る。
  • 2020年11月-2021年4月:2021年の早い段階で共著者から原稿をもらっていたが、授業で5月まで手つかず。
(投稿後)
  • 2021年5月:投稿
  • 2021年8月:査読者2人+ハンドリングエディター兼査読者からのコメント。2人の査読者からのコメント(計12点)は非常に軽微なものばかり(おそらくこれまで受けた査読コメントの中で最も軽微)。ハンドリングエディターのコメント(12点)は再分析を要したものの、レスポンスに困るようなコメントはなし。
  • 2021年9月:再投稿
  • 2022年1月:査読者2人(1人は新規)からのコメント。いずれも軽微なものばかりの計5点。1週間ほどで再投稿 → アクセプト
  • 2022年3月:ジャーナルのプルーフ
  • 2022年4月:出版社のプルーフ → オンラインに掲載される

【感想など】

共著者
まずNickと共著論文を出版できたことは嬉しいです。ご存じの方も多いように、Nickは早い段階から第二言語習得研究におけるコーパスの有用性を説いており、私の興味・関心の中心は両者の接点にあるので、Nickと一緒に研究を行えたのは幸せなことです。また、Nickは2011年のイベントで知り合って以来私のことを気にかけてくださっていたので、その意味でも一緒に形になる仕事ができて良かったです

実は博士課程をどの大学・プログラムで行うか(出願するか)を考えていた時(2008年-2009年)も、Nickの下で勉強・研究がしたいと思ったのですが、Nickは心理学科所属で私のようなTESOL出身者には心理学のPhDは荷が重そうだと感じたことと、当時はNickもコーパスを用いた実証研究はそれほど行っていなかったことから断念しました。ただその直後からEllis and Ferreira-Junior (2009)などで積極的にコーパスに基づく第二言語習得研究を始められたので、今から思えばせめてNickに連絡くらいはしてみるべきでした。

データとコード
冒頭に記した通り、Rコードとモデリングに用いたデータをOSFレポジトリで公開しています。計量分析処理のコードを公開する流れはできてきましたが、コーパス処理(テキスト処理)部分のコードを公開しているのは第二言語習得・コーパス言語学の分野では比較的珍しいのではないかと思います。しかしそれでも結果が完全に再生可能(reproducible)かと言うとそうでもなく、少なくとも以下の要因により数値結果は異なり得ます。

  1. COCAのフルテキストデータは購入者により微妙に異なること
  2. TreeTaggerは以前のバージョンが公開されておらず、私の理解が正しければ使用したバージョンをOSF等にアップロードもできないこと(つまり今後TreeTaggerのバージョンアップがあった場合、現時点での結果は再生できなくなる可能性がある)
  3. 使用したデータ(EFCAMDATとCOCA)にも同様のことが言えること
  4. brms(のバックエンドのStan)の結果はハードウェア依存であること

ただしコードを公開することにより透明性は高まるので、原理的に再現可能(replicable)ではあるはずです。

High-Performance Computing
また、今回初めて本学で提供されているHPCサービスを本格的に活用しました。従来であればメモリ不足によりできなかった(あるいは時間がかかりすぎて非現実的だった)複雑な統計モデルのパラメータ推定ができたり、重い処理を複数件同時に回すことができたりと、HPCを用いる利点が多くあり、今後もHPCは私の研究ツールの一部となるのではないかと思います。

一方で、HPCを用いた研究でデータやコードを公開しても実際にそれらを使用して結果を再現するにはHPCへのアクセスが必要になるわけで、それでは原理的に再現可能であっても現実的には難しいという場合が生じ、それはデータやコードを公開する価値を減じることになるのではないかという気もします。ただコードを公開することにより透明性が飛躍的に高まるのは確かで、私はその部分がとても大切であると思っています。

Standard

就職活動記録

少なくとも当分の間は再び職探しをすることはないでしょうから、博士課程に在籍していた頃から断続的に続けていたアカデミアでの就職活動も、これにて一旦終了したことになります。そこで、就職活動を開始した2012年5月から2017年7月までの就職活動をまとめてみました。職探しの方法は以前ここで書いた時と大きくは変わっていません。

表の左から順にID、応募した年月、応募先の機関がある国、対象研究エリア(募集が行われていた学科など)、ポスドクか講師職か、書類選考を通過したか否か、最終的にオファーを頂いたか否か、です。色分けは応募当時の私の所属先・職で、黄色がPhD学生時、オレンジがバーミンガム大学でのポスドク時、緑がケンブリッジ大学でのポスドク時、最後の青が日本で無職の時です。公募のみをリストしており、例えば2015年10月から2017年4月まで勤めていたケンブリッジ大学のポスドク職を得た時のように一本釣りであったものは含めていません。

5年1ヶ月の間に6ヶ国・地域の37機関へ67件の応募を行いました。応募してから募集自体が消滅した(時間をかけて応募書類を書いてるのに!)ID54を除く66件の内、書類選考を通過したのが17件(26%)、オファーを頂いたのが3件(5%)です。内1件は面接がありませんでしたので、書類選考を通過した17件の中でオファーを頂いたのは2件でした。また計17件の面接の内、スカイプを経由したものが7件、対面が10件でした。

面接まで進んでから不採用であった場合はその理由を先方に尋ねていましたが、それによるとポスドク職の場合はプロジェクトに必要とされるスキルと私のスキルセットの差異、講師職の場合は教歴(やそれに伴う経験)不足が原因で不採用になることが多かったようです。

Standard

Tier 1 (Exceptional Talent) visa

(注)英国のビザ周りの規則は毎年のように変わります。以下は2017年〜2018年半ばの話なので、ビザ申請をお考えの方は必ず最新の情報に当ってください。

8月1日からバーミンガム大学で勤務することになりましたが、実はバーミンガムフェローのオファーは昨年の6月には頂いており、それは通常であれば昨年の夏か秋には着任できるタイミングでした。にもかかわらず着任が遅れたのは、ビザを今月まで取得できなかったからです。ではなぜビザの取得が遅れたかというと、それには以下のUKVI(UK Visas and Immigration:英国移民局)の2つの規則が関係しています。

  1. 一度Tier 2 (General)ビザが失効すると向こう一年間はTier 2 (General)ビザを申請することはできない(クーリングオフ期間:この文書のp.32を参照)
  2. Tier 2 (General)ビザのスポンサーになる場合、resident labour market testをクリアしなければならない
Tier 2 (General)は一般的な労働ビザに相当するビザで、雇用主にビザ申請者のスポンサーとなってもらうことで、ビザ申請が可能となります。私が昨年まで有していたのはこのTier 2 (General)ビザで、2013年-2015年はバーミンガム大学が、2015年-2017年はケンブリッジ大学がそれぞれスポンサーでした。さて、英国は欧州経済領域(EEA)圏内で、採用にあたってはEEA圏内出身者が優遇されます。日本人などEEA圏外の国籍を持つスタッフがTier 2 (General)ビザで就職する場合、雇用主は「resident labour market test」と呼ばれるものを行う必要があります。これはつまり「EEA圏内には適切な人材がいませんのでEEA圏外から採用します」という証明のようなもので、これを満たしていないと、企業や大学はスポンサーになることができません。但し書類作成を除くとそれほど特別なことを行う必要はなく、この条件は通常は採用プロセスによって充足されます。

さて、私が昨年まで有していたTier 2 (General)ビザは昨年4月下旬に失効しています。そうすると上記1の規則により、今年の4月下旬まではTier 2 (General)ビザを申請することができません。そこで、以下の2つの可能性があると昨年7月の段階で考えました。(A)1年間待って2018年4月下旬以降にTier 2 (General)ビザを再度申請し、2018年6月頃より勤務を開始する、(B)異なるカテゴリーのビザ(Tier 1 (Exceptional Talent)ビザ)を申請し、2017年の夏か秋に勤務を開始する。ただ、バーミンガム大学からのオファーを頂いた直後(2017年7月)にチュービンゲン大学に2017年10月から2018年3月まで半年間滞在できることが決まり、そうであれば上記Aの方が(i)行ってみたかったチュービンゲン大学に行ける、(ii)通るかどうかわからないTier 1 (Exceptional Talent)ビザ(後述)の申請を避けられるという2点から好ましいと判断しました。実はこの辺りのことは可能性の一つとしてバーミンガム大学のフェローシップに応募した時(2017年3月)から頭にあり、そのため早い段階(応募前)で着任時期が柔軟であること(大体いつでもOKであること)を先方に確認していました。

しかし私が把握していなかったのは、resident labour market test(RLMT)の結果は1年間しか有効ではないということです。それの何が問題かと言うと、Birmingham Fellowshipは広く世界中から応募可能であるため、当然その採用プロセスはRLMTを満たすようになっています。しかし、私が応募して内定を頂いたフェローシップは2017年2月-3月くらいに募集されていたものなので、2018年4月にはそこで満たされていたはずのRLMTの効力が切れてしまっており、そのままでは2018年4月下旬以降に行うはずであった私のTier 2 (General)ビザ申請をバーミンガム大学がスポンサーできなくなってしまいます。そこで、昨年7月の予定では、2018年3月頃に再び行う予定であったBirmingham Fellowshipの選考を持って代えることになっていました。つまり、翌回のBirmingham Fellowshipの募集時に、EEA圏内には適切な人材がいなかったので私(日本人)を採用することに書類上はする、ということです。

これで一件落着かと思っていたのですが、今年に入り再び状況が変わります。まず、2月13日にバーミンガム大学の人事部から、「あなたに連絡しようとしているが捕まらない 1のでできるだけ早くこちらに電話して欲しい」というメールを受信し、慌てて翌日電話してみると、「Birmingham Fellowshipのキャンペーン 2は今年の3月には行わないことになったので、Tier 2 (General)ビザではなくTier 1 (Exceptional Talent)ビザを申請して欲しい」とのことでした。

Tier 1 (Exceptional Talent)とは「Exceptional Talent」や「Exceptional Talent (Promise)」のためのビザですが、プレミアリーグでプレーするサッカー選手クラスの人材でなければ取得できないというわけではなく、このドキュメントのp.24辺りを見てみても、「a prestigious UK-based Research Fellowship, or an international Fellowship or advanced research post」があればExceptional Talent (Promise)に当てはまるようです。また、同ドキュメントのp.25にあるように、British Academy Postdoctoral Fellowshipsなど、特定のフェローシップを持っていれば(具体的にはここのp.6を参照)、ほぼ確実にExceptional Talent (Promise)であることは認められる(下記のステージ1はクリアする)ようです。

申請プロセスに関してですが、Tier 1 (Exceptional Talent)ビザに関しては、まずステージ1で(私の場合は)British Academy(から依頼を受けた研究者)が私はExceptional Talent (Promise)だと考えられるか否かを審査し、それに合格すると、ステージ2でTier 1 (Exceptional Talent)ビザ自体をUKVIに申請する、という2段構えになっています 3。ノーベル賞クラスである必要はないものの、Tier 1 (Exceptional Talent)ビザは総じて以前保持していたTier 2 (General)ビザよりもハードルが高く、また、推薦状やなぜ自分がExceptional Talent (Promise)だと考えられるのかを記したもの(7000文字)など、必要書類という面でもTier 2 (General)ビザよりも準備に時間がかかりそうなものが多くあります 4

Tier 1 (Exceptional Talent)ビザのハードルは高いものの、バーミンガム大学が私に申請を勧めるくらいなので、ちゃんとやればTier 1 (Exceptional Talent)ビザも通るのだろうと考えました。2月下旬から必要書類等についてバーミンガム大学の人事部とやり取りし、3月上旬にバーミンガム大学の副学長からの推薦状をもらい 5、その数日後(3月10日)にステージ1の申請を行いました。3月19日にHome Office(内務省。UKVIはその一部)から、British Academyに諮問したとの連絡がありました。そのままうまくいけば当初予定していた6月よりも早く渡英できるはずでしたが、4月9日にリジェクトの通知を受け取ってしまいます。これまでビザ申請に失敗したことがなかったので少しショックでしたが、落ちたものは仕方がありません。通知を読むと推薦状が満たすべき条件 6を満たしていないので不可とあります。申請費456ポンドと審査にかかった1ヶ月間を失ったのは痛いですが、気を取り直して 7元指導教官(兼ケンブリッジでのポスドク時のPI)に新たに推薦状をお願いし、5月11日に再度オンライン上で申請&必要書類を投函しました。5月21日にやはりBritish Academyに諮問したとの連絡があり、6月25日までに結果を知らせてもらえるはずが何の連絡もなかったためこちらから問い合わせたところ 8、6月27日にBritish Academyから私はendorseされた(=ステージ1はクリア)という旨の連絡がUKVIからありました。早速6月29日にTier 1 (Exceptional Talent)ビザ本体の申請を行い、(申請を優先して処理してもらえる)優先ビザサービスに同時に申し込んだこともあり、1週間後の7月6日にはビザを受け取ることができました。

というわけで来月からはTier 1 (Exceptional Talent)ビザで英国に滞在することになるのですが、特にTier 2 (General)ビザと比較して具体的なメリットがあるわけではありません。強いてあげるなら雇用主と紐付いているわけではない(Tier 1 (Exceptional Talent)は申請時にスポンサーは必要ない)ので、転職したり移動したりしてもビザを取り直す必要がなく、またうっかり無職になってしまっても英国に滞在する権利はあるという程度でしょうか。いずれにせよ大学教員として勤めている限りは、Tier 1 (Exceptional Talent)ビザとTier 2 (General)ビザの差はほとんどないのではないかと思います。

Notes:

  1. 当時チュービンゲンにいて、ドイツのSIMカードを使用していたため
  2. 募集のこと。こういうのを「キャンペーン」と呼ぶことを知らず、何度か聞き返してしまった
  3. 但し、ステージ2はUKVIでの審査なので、(以前強制送還されたことがあるなど)余程のことがない限りは大丈夫だと思います
  4. 但しこれらも上述した特定のフェローシップを持っていれば免除されます
  5. この頃ちょうど英国中の大学がストライキで大変だったはずなのに、よくこの辺りは滞りなく進んだなと思います
  6. このドキュメントのp.27の下部にあります
  7. この辺はほかにも色々とあったのですが察してください
  8. 久しぶりに英国を感じました
Standard

バーミンガムフェロー

2018年8月1日より、英国バーミンガム大学でバーミンガムフェローとして勤務することになりました。2013年9月から2年間ほどポスドク研究員として勤務した英語・応用言語学科(ELAL)に戻ることになります。

バーミンガムフェローとはバーミンガム大学が行っているBirmingham Fellowshipのプログラムにより採用される研究員です。Birmingham Fellowshipのプログラムとは以下のようなものです(このページから抜粋)。

Our sector-leading Birmingham Fellowship programme offers five years of protected time for high-quality research, allowing outstanding, high potential, early-career researchers of all ages to establish themselves as rounded academics who will go on to excel in their academic discipline across research, teaching and wider citizenship. All Fellowships come with a permanent academic post at the University.

つまり、「任期なしの職を与えるので、少なくとも最初の5年間は研究に注力しなさい」という、採用される側の視点からは大変ありがたいポジションです。そのプログラム下で雇用されたからには良い研究を行うこと(そしてREFに貢献すること?)が職責ですから、今後はより一層、研究に力を入れるつもりです。

また、私がバーミンガム大学を去ってから3年間ほど経っていますが、その間にELALは多くの新しいスタッフを獲得し、そのほとんどが計量分析に非常に強い方々です。私も言語研究における計量分析には強い関心がありますので、彼等との交流も楽しみにしています。
Standard

共著論文二本

この数ヶ月の間に共著論文が二本出ました。一本はModern Language Journal誌に掲載された、佐々木みゆき先生水本篤先生との共著論文で、ライティングストラテジーの縦断的発達に関する研究です。インタビューに基づく質的分析と混合効果モデルに基づく量的分析を行っており、私は主に後者を担当しました。量的分析に関するデータやRコードはIRISにて公開しています(こちら)。

Sasaki, M., Mizumoto, A., & Murakami, A. (2018). Developmental trajectories in L2 writing strategy use: A self-regulation perspective. Modern Language Journal, 102(2), 292–309. doi: 10.1111/modl.12469 [リンク]

もう一本はInternational Journal of Corpus Linguistics誌に掲載された、ケンブリッジ大学のTALセクション(旧DTAL)のメンバーとの共著論文です。構文解析(係り受け解析)を学習者の英作文に適用した際の正確性を検証すると共に、機械の解析結果を人手で修正すると、その修正は最初の機械の結果に影響を受けてしまうことを示しています。筆頭著者は計算言語学の博士課程の学生で、本論文は彼女の博士論文のための研究ということもあり、私は最後にコーパス言語学コミュニティーに向けて多少手直しをした程度です。実験の密度が高く、IJCLに掲載される論文の中ではかなり計算言語学の色が強いものだと思います。

Huang, Y., Murakami, A., Alexopoulou, T., & Korhonen, A. (2018). Dependency parsing of learner English. International Journal of Corpus Linguistics, 23(1), 28–54. doi: 10.1075/ijcl.16080.hua [リンク]

Standard

帰国します

あっという間にチュービンゲンでの6ヶ月が経ってしまい、現在帰国の途についています。ドイツ語ができない中でのドイツでの滞在は大変な部分もありましたが、所属していたLEAD Graduate School & Research NetworkICALL Research Groupの環境・雰囲気が素晴らしく、博士課程を始める前にここを知っていればここで博士課程を行うことも考えただろうと思います。

5月末までは概ね東京近郊に滞在する予定ですので、また色々な方にお会いできればと思います。

また、日本滞在中の5月12日(土)に早稲田大学で開催されるSONASに登壇予定です。ご興味がおありの方は参加申込みの上、是非お越しください
Standard

チュービンゲン生活

チュービンゲンに引っ越して2週間ほど経ったので、現時点での街やそこでの生活に関する感想を記しておこうと思います。

街自体は小さく、だいたいどこにでも徒歩で移動が可能です。それくらいのサイズなので、自転車を主な移動手段として用いている人が多い印象で、その点ではケンブリッジと似ています。街の大きさはケンブリッジ(徒歩30分で横断可)と同程度でしょうか。街の中で栄えている中心部の面積は割と広い印象です。これはドイツの街は勝手に拡大できない(建造物を建てて良い場所が法律で決められているそうです)ことと関連しているのかもしれません。街自体は拡大できないので、その代わりに栄えている部分が拡大するのではないかと思います。因みにドイツでは街の中心部(イギリスで言うCity Centre)をOld Townと呼ぶそうです。教会などがありそこから街が発展していったためそう呼ばれているのだと理解しています。

ドイツは物価が安いイメージがあったのですが、チュービンゲンに関しては東京はおろかケンブリッジよりもやや高いくらいかもしれません。家賃に関しては東京と同水準かやや低額ですが、そもそもチュービンゲンでは部屋を見つけるのが大変で、私に関しては許容可能な家賃を大幅に上げざるを得なかったので、そういったことを考えると家賃も安く抑えられるかどうかは運次第というところもありそうです。一方で給与水準はアカデミアに関して言えば、決して高くないイギリスよりも更に低いので、トータルで見ればイギリスに住んでいた時よりも苦しい生活になりそうです。これがチュービンゲン特有の話なのかドイツの他の街にも当てはまるのかはわかりません。

生活ができれば良いという基準であれば、ドイツ語は全く必要ありません。大学街ということもあるのでしょうが、街の人たちも大抵の人は英語をある程度は話すことができます。但し当然ながら店の看板やレストランのメニューなどは全てドイツ語で書かれているので、ドイツ語ができる(少なくとも読める)と利便性が大幅に増すのは間違いありません。また、DHLの支店でのみ英語対応をしてもらうことができませんでした。そんなわけで私はドイツ語のクラスに通い始めました。受講生の母語や出身地(南アフリカ・パキスタン・イタリア・アルバニア・ギリシャ・エクアドル・フィンランド・ルーマニア・コソボ・カザフスタン)が様々であるため、基本的にはドイツ語のみで授業が行われます。雰囲気が高校のESLのクラスと大変似ています。

ドイツではresidence registrationという、日本でいう住民票のようなシステムがあり、ドイツ内の住居に住み始めて2週間以内に市庁舎で登録をしなければなりません。ただしドイツ人やEU国出身者とは違い、日本人(など居住にビザが必要な人たち)は外国人局(Ausländerbehörde)というところで登録する必要があります。私は滞在期間を全てカバーするビザを持っているのであれば外国人局ではなく通常のRegistration Officeで登録すれば良いと大学で教えられたためそこに行って(1時間半以上待たされて)みましたが、ビザの有無にかかわらず私もやはり外国人局に行かなければいけなかったようで、翌日そこで登録を行いました。登録自体はほんの数分でしたが、登録に必要な書類には大家などに書いてもらうものもあり、その準備に多少時間を要しました。

SIMカードはイギリスでも使っていたO2と契約しました。SIMカードの契約のためにはドイツの銀行口座が必要で、まずはそこから始める必要があります。ただ銀行口座は給与を受け取る際などにも必要ですし、作っておいて損はありません。またチュービンゲンは(ドイツは?)東京程度にはキャッシュ社会なので、キャッシュを常に持ち歩く必要があります。そのためにもこちらでの銀行口座は必要です。銀行口座を開くには上記のresidence registrationを行っていなければならないと言われるのですが、実際はそうでなくても開ける場合が多いようです。
Standard

MDA論文が出ました

多次元分析(MDA)を用いて学際的研究論文のディスコースを分析した下記の共著論文がInternational Journal of Corpus Linguistics誌に掲載されました。

Thompson, P., Hunston, S., Murakami, A., & Vajn, D. (2017). Multi-Dimensional Analysis, text constellations, and interdisciplinary discourse. International Journal of Corpus Linguistics, 22(2), 153–186. doi: 10.1075/ijcl.22.2.01tho [リンク]

本論文は2013年8月から2015年10月まで勤務していたバーミンガム大学でのIDRDプロジェクトの成果の一部です。まずは11の研究分野のジャーナルを対象に、学際的な研究分野のジャーナルと非学際的な研究分野のジャーナルはどのように異なるのかをMDAの各次元に基いて見ています。その後に、Global Environmental Change(GEC)というジャーナルに焦点を当て、そこに出版された論文をMDAの次元得点に基いてクラスタリングを行い、ボトムアップ式にGEC論文のパターン(論文ではconstellationと呼んでいます)を見いだしています。また副次的にランダムフォレストを用いて、個々の論文が次元得点を基にどの程度それが出版されたジャーナルに正しく分類できるかを見ています。MDA→クラスタリングの流れ自体はBiberが既に1980年代に行っていますが、それをより狭い対象(クラスタリングに関しては一つのジャーナル)で行い、それでも意味のあるパターンが見いだせたというのが新しい点です。
Standard

チュービンゲン大学の博士研究員になります

4月中旬に任期満了によりケンブリッジ大学を退職した後、5月下旬に日本に帰国して江ノ島近郊に滞在していましたが、10月1日より半年間、ドイツはチュービンゲン(独:Tübingen; 英:Tuebingen)大学で博士研究員(postdoctoral researcher)として勤務することになりました。私の博士論文の外部審査員であったDetmar Meurers氏や言語統計で著名なHarald Baayen氏がいらっしゃるところです。私自身はLEAD Graduate School and Research Networkという学際的な教育研究を行うセクションの所属となります。統計関係の授業を一コマ担当する以外は研究に注力できるはずです。ドイツで研究できる機会は今後もそうないでしょうし、色々と学びたいです。

渡独するに当たり、主にビザ申請と住居探しという2点が労力を必要としました。まず研究滞在ビザに必要な書類はここに書かれているのですが、諸々の確認のためにドイツ大使館に問い合わせを行ったところ、上記ページの書類に加え、学部から博士まで全ての大学の学位証明書と滞在期間全てをカバーする保険 1の証明書も提出するように言われました。またその際に、私の滞在が研究滞在ビザの対象となるかどうかを領事官に確認してもらえました。ビザ自体は保険がカバーしている期間に合わせて出るようです。ビザは予約を取ってドイツ大使館で申請するのですが、8月12日の時点で最短でも9月18日まで待たねばならず、ビザ申請が許可されビザを入手するまでに更に一週間ほどかかったためビザの入手はギリギリ(渡航日の前日!)となってしまいました。ビザ申請予約は大阪にある総領事館ではもう少し空きがあるようでしたが、住んでいる場所により申請場所が決まるのでどうしようもありません。

住居探しに関しては更に大変でした。チュービンゲンは大学街なのですが、大学規模が拡大し続けているにもかかわらず街の住居数はそれほど増えていないため、部屋探しは常に大変なようです。年度初めの10月は特に酷く、大学のジムで寝泊まりする学生もいるとのこと。ケンブリッジも大学街でやはり大学規模の拡大に住居数が追いついていない街でしたが、チュービンゲンほど酷くはありませんでした。チュービンゲンでは私が問い合わせた中でも、一件の空きアパートに対して24時間で150件の問い合わせがあったケースもあり、競争率だけだと就職活動よりも厳しいかもしれません。チュービンゲン大学にはWelcome Centerという我々のような国外から来る研究者の面倒を見てくれるところがあるのですが、そこも住居に関してはほとんどお手上げのようで、数件(こちらの条件を満たさずあまり魅力的ではない)物件を紹介してくれたほかは、物件紹介のウェブサイトを教えてくれたのみでした。

私は結局、ここここここここのウェブサイトで物件を探していました。とりわけここが役に立ちました 2。ウェブサイト上でおそらく数十件の物件に関して家主や現借主にメッセージを送りましたが、その過半数はレスポンスがなく、あった場合も他の人に貸すことが既に決まっている(あるいはそう決めた)という連絡や、主に賃貸期間に関する条件が合わない(もっと長期に亘り貸与したい大家が多い)ため貸せないというものでした。8月中旬から部屋探しを始め、9月中旬になっても何も決まっていなかったため気を揉みましたが、幸いにして渡航一週間前くらいに幾つか良いレスポンスがありました。結果的に最初の2週間強はある物件に滞在し、その後は数日間のホテル暮らしを経て、10月中旬から私がドイツを去る4月初旬まで別の物件に滞在する予定です。しかしそのためには当初予定していた家賃の上限を上げざるを得ず、半年間なので収支が多少マイナスでも何とかなるものの、これが年単位だと借りれないだろうというような物件になりました。折角なので、私の収入ではなかなか住めないようなアパートでの生活を半年間楽しみます。

Notes:

  1. 私はCare Concept社のものに加入しました
  2. サイトによらず、詐欺が横行しているようです。私も詐欺だと思われるメッセージを数件受信しました。私の場合は「自分は国外にいるから直接会うことができない。Airbnbを通じて家賃を支払ってくれ」というメッセージと共に、Airbnbに似せた他サイトに導かれる、という手口です。
Standard

トピックモデルの論文が出ました

トピックモデルをコーパス言語学コミュニティーに紹介することを目的とした下記の論文がCorpora誌に掲載されました。オープンアクセスですので、どなたでもご覧頂けます。

Murakami, A., Hunston, S., Thompson, P., & Vajn, D. (2017). ‘What is this corpus about?’ Using topic modelling to explore a specialized corpus. Corpora, 12(2), 243–277. doi:10.3366/cor.2017.0118 [リンク]

本論文は2013年8月から2015年10月まで勤務していたバーミンガム大学でのIDRDプロジェクトの成果の一部です。プロジェクトも中盤に差し掛かった2014年の春頃に、プロジェクトミーティングで頻繁に「トピック」という語が出てくるようになり、当時名称を聞いたことがあった 1程度のトピックモデルが使えるのではないかと思って調べてみたことと、プロジェクトメンバーの一人が発表した学会で計算言語学系の研究者にトピックモデルを薦められたことが、本手法を用いるきっかけとなりました。

本論文ではトピックモデルの直感的な説明の後にGlobal Environmental Changeというジャーナルに1990年-2010年に出版された論文を対象にトピックモデルを構築し、論文内でのトピックの遷移(例えば論文の前半で顕著なトピック vs 後半で顕著なトピック)、ジャーナルの時系列変化(1990年→2010年で扱うトピックがどう変わったか)、異なるトピック構造を持つ論文の特定(例えば特定のトピックのみを扱った論文 vs 複数の主題がある論文)、語の多義性解消を事例研究として扱っています。更に意味タグとキーワード分析というコーパス言語学ではより伝統的な手法との比較を行っています。トピックモデルは文脈を考慮に入れないbag-of-wordsアプローチであるにもかかわらず、比較的直感的な結果が出ているのが面白いところです。

なお、本論文がオンラインに掲載される一週間ほど前に、ランカスター大学のAndrew Hardie氏がトピックモデルの使用を批判する基調講演をCorpus Linguistics 2017で行っています。本論文にも言及されていますし、こちらも併せてご覧ください。

本論文に関わるジャーナルとのやり取りは以下のように進行しました。

2015年10月7日: 投稿
2015年10月20日: 長すぎるので1万語以内に抑えるようにとの指示を受ける
2015年11月2日: 1万語まで削って再投稿
2015年12月14日: 査読結果の通知(minor corrections × 2人)
2016年1月28日: 修正後に再投稿
2016年1月29日: Accept通知
2017年4月〜7月: proofの確認や微修正等々を数ラウンド
2017年8月1日: オンラインに掲載される

Notes:

  1. 松浦さんのブログを通してだと思い込んでいましたが、トピックモデルに関する記事の投稿日を確認したところ2015年初頭だったので、私の記憶の誤りのようです。追記:これはブログを引っ越されたからであるとご本人に伺いました(下記)。ご指摘ありがとうございました。元の記事は2014年2月のものとのことで、私がトピックモデルを初めて知ったのはやはり松浦さんのブログを通してだと思います。 それはそうと、松浦さんのブログのこの記事の②の図はトピックモデルを直感的に理解するのに非常に役立ちました。改変版を学会発表等でも使用させて頂きました。
Standard