No.086 - 人間文化研究と科学技術・政策研究の機関長による意見交換会<後編>

人間文化研究機構 木部暢子 機構長
文部科学省 科学技術・学術政策研究所 佐伯浩治 前所長

2021年4月に施行された科学技術・イノベーション基本法(科学技術基本法からの改正)において、人文・社会科学が振興の対象となりました。今後、人文・社会科学では「知」の蓄積を図りつつ、自然科学の「知」との融合による、人間や社会の総合理解と課題解決に資する「総合知」の創出と活用が重要になります。総合知の前提となる異分野融合もしくは学際研究のヒントを探るべく、木部機構長が自然科学の様々な組織や研究者との交流がある文部科学省 科学技術・学術政策研究所の佐伯所長(当時)をお招きし、2022年11月に意見交換会を開催しました。意見交換会の後編では、人間文化研究機構と科学技術・学術政策研究所がそれぞれに進めている異分野融合の事例を取り上げます。

<前編>はこちら

 

・データベース化

木部:今、人間文化研究機構(以下「人文機構」)で進めているのは、資料のデータベース化です。例えば、国文学研究資料館(以下「国文研」)では、古典籍をPDF化してデータベース化し、それだけでなく、情報学の先生と一緒になって、昔のくずし字をなんとか読めるようにするという研究をやっています。コンピューターがくずし字を解読することがかなりできるようになりました。

佐伯:コンピューターに教えていくとできるみたいですね。

木部:私は大学時代に国文科でくずし字の演習に非常に苦労した思い出があるので、コンピューターがそんなに簡単に読んだら困るという感じもしますが、解読ができると多くの人が古典に親しむことができるので、やっぱりそれはすごい技術だと思います。古典籍の原典の知識は国文学の専門の先生が持っており、その専門知識と、コンピューターがくずし字を自動的に解読するという情報学の専門的な知識とがマッチングして、本当にいい連携研究になると思います。

こういう連携研究が行われると、どんないいことがあるかというと、国文研と国立極地研究所が連携して過去の古典籍・古記録のなかからオーロラに関する記述を見つけ出すとか、東京大学の地震研究所の、日本の古代・中世の文献史料の地震や噴火などの記録をデータベース化して分析するとか、過去のデータがどんどん自然災害等に使えるようになります。日本でオーロラが見られるなんて、現在ではとても考えられませんが、情報・システム研究機構の藤井機構長によると、「地軸の角度が違っていたのではないか」とのことです。

佐伯:回転軸が違うのですね。

木部:「なるほどな」と思いました。国文研が現在整備しているのは、主に日本の中央の資料ですが、各地に残っている資料がデータベース化されれば、もっと様々な研究、人文系だけでなくいろいろな研究が進むと思います。今も昔もメモ魔みたいな人がたくさんいました。われわれが日記を書くのと同じで、今日の天気は晴れとか、午後曇りとか、今日何をしたとか、綿密に記録を残している人が各地にたくさんいます。もし、AIにより資料が自動的に読めるようになると、このような資料がたくさんデータベース化できるようになる。そうすると、過去の全国の天気状況も分かるし、生活の形態も分かり、いろんなことが分かってくるようになると思います。

 

・負ミュオンを用いた文化財の調査

木部:それからもう1つは、国立歴史民俗博物館が高エネルギー加速器研究機構と一緒に行っている負ミュオンによる歴史資料の研究です。考古学の資料などは、出土した時は鉄だと錆びていたりしますが、文化財ですので壊して成分を調べるわけにはいきません。

佐伯:ミュオンを透過させてピラミッドの内部構造などを調べた例がありますね。

木部:そうですね。それと同じで、粒子を当てて、出土物を壊さずに中がどういう構造で、金属の成分がどうだったかなどを知るという研究です。考古学とか歴史学のなかでも物を対象にする研究は、理系の技術と連携することで、現在、大きく発展しています。過去にどういう金属がどこでどういうふうに使われていたのか、どういう組成をもっていたのか、どんな素材だったのか。それが現物を壊さなくても分かる。やっぱり随分昔とは違う時代に入ったな、と思っています。

佐伯:確かにこれまでのX線だと見える範囲が限られますが、ミュオンX線だと透過力が強く、非破壊分析が広がります。

意見交換の様子
意見交換の様子

 

・政策研究へのAIの活用

佐伯:科学技術・学術政策研究所では、自然言語処理も含めてデータサイエンスや人工知能(以下「AI」)関連技術を使って政策研究を発展させられないかという活動があります。もう1つ、AIを進める上で社会との在り方をどう考えるかという活動があり、倫理的・法的・社会的課題(ELSI)的な見方で、取組を進めています。両者を含めて理化学研究所(以下「理研」)の革新知能統合研究センター (AIP)と連携して活動しています。

具体的なテーマとしては、前者については、統計的因果探索手法を用いた研究や、英語雑誌論文の引用関係がポジティブな引用なのかネガティブな引用なのか、といった引用の分析研究が行われています。後者については、AIの進展やオープンデータの利用が拡大する中、科学と社会の在り方を変え得る「兆し」を共有し、中長期的な視点の問題提起を行う議論を進めています。理研側としても、AI技術が発展し活用が広がる際にどのような課題が生じるか関心が強く、協力してセミナーの開催を進めています。

木部:これまで、人文学の研究はデータベース化されることが少なかったのですが、これからデータベース化が進むと研究の質の検証の問題や他分野の研究や社会とどう関わっていくかの問題が出てくると思いますね。

 

・デジタル・ヒューマニティーズ(DH)

木部:人文系のデータはデジタル化されていないものが多過ぎます。論文もそうですが、その理由の1つに英語でない言語で書かれたものが多いということがあります。

佐伯:地域での研究も多いですよね。

木部:そうですね。地域の研究は地域の言語で公表するという考えもあります。今はいろいろな言語に対応する翻訳システムが非常に発達してきました。英語だけではなく様々な言語でも検索ができ、拾い出しができるような、そういう技術はすぐ可能になると思うので、とにかくデジタル化を始めることが大切だと思います。

それから、人文機構の各機関は論文だけではなく資料をたくさん持っています。古い時代の文献資料もありますし、博物館には物の資料もあります。総合地球環境学研究所には自然関係や災害関係の資料もあります。人文機構の第4期中期目標・計画では、文字データだけではなく、いろいろなデータをデジタル化し、それを基にして研究を発展させることを目標にしています。

そのために、国文研による歴史的古典籍のデータベースを先駆として、人文機構のその他の機関の膨大なデータもデジタル化していこうとしています。デジタル化すれば、AIを使ってデータをコンピューターの上で分析することができますし、分類することもできます。類似のものを寄せ集めることもできます。分野を越えてそういった分析や寄せ集めができるようになります。それが私たちに新しい発想を与えてくれるのではないかと考えています。

佐伯:古いジャーナルが捨てられてしまう問題も、電子化によって多くが創刊号まで閲覧・検索できるようになりました。資料についても目録等を検索して倉庫から持ってこなくても、画面で見られるようになれば、すごく活用が進みそうです。

木部:機構の中で閉じないで、大学もたくさん資料を持っていますので、大学とも連携して、デジタル化を進めたいと思っています。データは多ければ多いほど可能性は広がります。まずは機構で実験的にやってみて、そのあと、他の大学や研究機関にも広げていきたいと思っています。

佐伯:今のところ、どうしてもデジタル化は人による膨大な作業が必要になりますね。

木部:そうです。

佐伯:物理的な本の形式も違いますし、なかなか自動化は難しいところありますね。でもそれで雇用が生まれるかもしれない。

木部:生まれますよね。とにかく人文系も理系もデータ化されてないものがたくさんあります。

佐伯:デジタル化が進まないと、価値を生み出す資料が使われないことになります。自然科学系でも同様であり、せっかく取ったデータがきちんと管理されないと使えなくなります。データを適切に管理し、組織や分野を越えて広く活用していくことが、研究の発展のためには重要です。特に最近ではAIが雑誌や資料を読む時代ですので、もはやデジタル化することが前提となっています。

木部:だからできるだけデジタル化をしたいです。幸い、保存メディアも発達して、大容量のものでも保存が可能なようにだんだんなってきているようです。

佐伯:ぜひそういう形で使われるようになっていくといいですね。

木部:そうですね。保存だけではなくて、それを引き出す方法を私たちが考えないといけないのです。蓄積したものをどうやって引き出すか。分かりやすく言うと、タグ付けですね。どういうタグ付けをするか、そういうことを研究者が共同で理系も文系も共同でやるべきだと思います。

佐伯:地味な作業になりますが、本当に大事な基盤づくりですね。実はそのような、研究データ基盤整備の先にある科学と社会の変容(オープンサイエンス)にも大変注目しており、私たちの研究所の大切な仕事として取り組んでおります。木部先生も日本学術会議のオープンサイエンスに関する委員会に参画していると伺っています。

木部:はい、オープンサイエンスを推進するデータ基盤とその利活用に関する検討委員会に所属し、データ駆動型科学が切り開く学術と社会を模索しています。その中で、人文学系研究の特徴についても取り上げてもらっております。

佐伯:NISTEPでは、科学技術に限らず人文学・社会学系の将来にも注目しておりますので、オープンサイエンスが切り開く科学と社会を明らかにしていくために連携することも考えられそうですね。

木部:いいですね。オープンサイエンスによって分野の異なる研究者が出会い、新しい研究が生まれていくことと思います。是非、連携して総合の知を一緒に生み出していきたいですね。

<前編>はこちら

 

(司会:大場 豪 人間文化研究機構 人間文化研究創発センター研究員)

木部 暢子(きべ のぶこ)
人間文化研究機構 機構長
九州大学大学院文学研究科修士課程修了。博士(文学)(九州大学)。鹿児島大学教授、国立国語研究所教授を経て、2022年から現職。専門は言語学、日本語方言学、音韻論, 音声学。

佐伯 浩治(さえき こうじ)
文部科学省 科学技術・学術政策研究所 所長(2023年3月末日まで)
旧科学技術庁入庁後、内閣府宇宙開発戦略推進事務局審議官や文部科学省研究開発局長、科学技術振興機構(JST)理事を歴任。