No.089 - リーダーに聞く『前川喜久雄 国立国語研究所 新所長』<前編>

前川喜久雄 国立国語研究所 新所長

2023年4月に前川喜久雄氏が国立国語研究所の新所長に就任されました。インタビューの前編では、音声学という研究テーマにたどり着くまでの過程や、様々な種類のコーパスの構築、MRIを用いた音声生成の研究といった過去から現在までの研究内容を伺いました。

 

<後編>はこちら

・研究のキーワードとなる「方言」、「音声」との出会い

音声学に行き着いた経緯として、外国語の発音の難しさがあります。私は、学部生の時はフランス語を学んでいたのですが、博士課程に入るのと同時にフランス語を止めて、日本語を研究テーマに絞る決心をしていました。

フランス語は日本人にとってそんなに難しい言語ではないと思うのですが、特に発音に厳しい先生にはよく直され、努力してもなかなか上手くいきませんでした。「何故こんなに難しいのか」を真剣に考え出すと、我々はどうやって発音しているのかという問題に行きつきました。そういうところから音声の分野に入る方は多いのではないかと思います。

ちょうど大学院生の時に、言語学者である柴田武先生の「言語の標準化」という大きな科学研究費(以下「科研費」)の研究に間接的にお世話になりました。この研究プロジェクトには文法や書き言葉、音声といったあらゆる領域が含まれており、更に音声の中には方言の標準化というテーマがありました。

また、当時鳥取大学におられた今石元久先生率いる方言学者の研究グループに呼んでいただき、東京大学工学部の藤崎博也先生の研究グループとの間で、通訳のような役割をしていました。このような研究者との関係が、今につながっていると思います。

 

・国立国語研究所での研究

最初は音節の構造といった日本の方言の音声を研究し、鳥取大学に就職してからも方言を中心に研究していました。その5年ほど後に、国立国語研究所(以下「国語研」)の音声の実験室の要員として採用されました。

音声学では昔から、喋っている時に人間が舌や喉、唇等といった音声器官をどう動かしているのかを推定してきていますが、それはあくまで想像や筋感覚で自分がどうやっているのかを内省しただけで本当かどうかは分かりません。それを客観的に見る手法が色々と考えられ、そのうちの1つがX線映画資料です。私がちょうど赴任した頃に、『日本語の母音,子音,音節 : 調音運動の実験音声学的研究』という報告書が出て、この研究を引き継いでいくということも考えられましたが、X線照射を受けて発音するという実験方法は被ばくの恐れがあり、同じ手法で多くのデータを取ることが困難でした。2010年代になって磁気共鳴画像(以下「MRI」)で動画が撮れるようになり、30年ぶりにこの研究の続きを進めています。

リアルタイムMRI画像の例
リアルタイムMRI画像の例

 

国語研に赴任してからは、自由に試行錯誤をさせてもらいました。当時、東京大学医学部に音声言語医学研究施設(以下「音声研」)という組織があり、そこに出入りして、日本全国の方言のイントネーション研究をやりました。同時に、それを筋電図で生理学的に見るという仕事をしていました。その他にも、外国人の日本語の音声的な特徴を研究するグループに参加したり、日本語教育のデータベースを作ったりしていました。

 

・アメリカ留学とLaboratory Phonology

1993年に、アメリカのオハイオ州立大学の言語学科に10か月行かせていただきました。今考えると、この留学がその後の研究に影響を与えたと思っています。

当時の音韻理論は頭の中だけで考えるものでしたが、オハイオ州立大学は音韻理論と実験的な研究を融合させようとする「Laboratory Phonology」の中心地のひとつでした。私自身もその必要性をずっと感じてきたので、楽しく研究させてもらいました。帰国すると、Laboratory Phonologyの流れが日本にもやってきたので、ちょうどよかったです。

帰国してしばらくの間は、Laboratory Phonology的な思考で研究をし、その発展形として今度は「パラ言語情報」をやり始めました。「パラ言語情報」とは、関心、落胆、疑い、反問といった、いろいろな発話意図のことです。1997年くらいから、音声研の人たちと組織的に共同研究を始めました。生理学的にファイバースコープで声帯観察をしたり、MRIとは別の方法で舌の動きを観察したりして、面白い発見が次々と出ました。国際学会で招待講演をするなど結構反響があったのですが、そこで突然、日本語話し言葉コーパス(以下「CSJ」)の話が来ました。

インタビュー時の前川所長(左)と木部機構長(右)
インタビュー時の前川所長(左)と木部機構長(右)

 

・日本語話し言葉コーパス(CSJ)

CSJの仕掛け人は当時、国際電気通信基礎技術研究所(ATR)におられた山本誠一さん(同志社大学名誉教授)という方で、音声認識の大きなデータベースを作るに当たって、情報工学だけでなく言語学の研究者も入るのがよいだろうという構想のもと、去年お亡くなりなった東京工業大学(以下「東工大」)の古井貞熙先生をトップに据えたチームが作られました。私としては、データベースの必要性を学生の頃からずっと認識していて、方言音声についても自分で小規模なものを作って研究をしていましたが、ここで初めて大規模な形で思う存分予算も時間も使う、という機会を与えられました。1999~2003年度の5年プロジェクトで、2004年のゴールデンウイークに公開しました。

元々このコーパスは音声認識の研究のために作ったものですから、できたところからデータを出すとさまざまな研究で使われました。プロジェクト3年目の秋ぐらいに、データがかなり充実し、それを使った音声認識システムの学習が出来るようになりました。京都大学(以下「京大」)から河原達也先生にもご参加いただいて、東工大と京大のシステムを別個に学習したところ、両方とも劇的に性能が上がりました。

いろいろな研究でコーパスが使われて私もうれしかったですし、国語研にとっても、組織的な共同研究として人も予算も集中的させて、成果を出すという仕事を復活させることができました。

 

・現代日本語書き言葉均衡コーパス(BCCWJ)

CSJの公開後は、CSJだけでなく書き言葉の研究者を含めて1年間コーパス研究会をやりました。その中で、書き言葉として均衡のとれたコーパス(balanced coups)がないため、統計的な代表性を持っているような日本語のコーパスを作ることになりました。

私個人としても書き言葉のコーパスの必要性を感じていました。心理言語学の論文では、「実験にその単語を使った理由は何ですか」、「頻度はどのくらいで、偏りはありませんか」ということを必ずチェックされます。しかしそれに答えるデータがないため、国際的な雑誌に出すと査読で落とされるのです。話し言葉はCSJでなんとかなりましたが、書き言葉のコーパスはないからそういうのが是非必要だという声をかなり聞いていました。

自然な流れでスタートした現代日本語書き言葉均衡コーパス(BCCWJ)ですが、国語研の予算ではとても足りないので、最終的には大型の科研費を取りました。5年計画のプロジェクトの4年目の2009年に、国語研が人間文化研究機構に移管され、公開がちょっと遅れてしまいました。翌2010年の秋に「中納言」(国語研で作った形態論情報を指定して検索するためのコーパス検索アプリケーション)をウェブ上で公開し、2011年にやっとDVD版でデータ全体を公開できました。この頃が一生で一番忙しかった時でした。

コーパス検索アプリケーション「中納言」
コーパス検索アプリケーション「中納言」

 

※ コーパス検索アプリケーション「中納言」とは?

国立国語研究所で開発された、日本語のコーパスを検索するためのWebアプリケーションです。単純な文字列検索のほかに、形態論情報を用いた様々な検索機能をコーパスごとに提供しています。ご利用は無償ですが、著作権保護の観点からユーザ登録をお願いしています。

ユーザ登録はこちらから。

<後編>はこちら

(聞き手:木部 暢子 人間文化研究機構 機構長)

(文 責:大場 豪  人間文化研究機構 人間文化研究創発センター研究員)

 

国立国語研究所 前川喜久雄 所長
専門は音声学、言語資源。上智大学大学院で言語学を学んだ後、最終的に東京工業大学大学院情報理工学研究科にて学術の博士号を取得。1984年に鳥取大学教育学部助手、1987年に同学部講師、1989年より国立国語研究所に務め、2023年4月より現職。