研究内容 | 坂田・森・浅谷研究室

当研究室ではデータサイエンスを活用して、経営・社会・科学技術に関する現象を体系的に理解し、新しい知見を創出することを目指しています。機械学習・深層学習、自然言語処理、ネットワーク分析などの手法を中心に、手法そのものの基礎研究にも取り組んでいます。

解析対象は、学術ビッグデータ、ソーシャルメディア、企業取引情報やM&A、特許データ、都市行動データ、レビュー文など多岐にわたります。生成AIについては、逆学習を用いた大規模言語モデル（LLM）の解析や、LLMを活用した社会・科学データの分析にも先駆的に取り組んでいます。

学生の研究テーマ選択については自主性を尊重し、多様なテーマの研究が進められています。研究者同士が活発に交流し、分野横断的な取り組みが進んでいます。

さらに、テクノロジー・インフォマティックス社会連携講座や NEDO/産業技術総合研究所のプロジェクトなど、外部機関との共同研究も積極的に推進しています。研究成果の社会実装と広範なコミュニティへの貢献を重視しています。

Science of Science / Science of Science

科学論文、特許、企業活動などから、知識や技術がどのように創出され、社会へ広がるかを数理的に解析します。多様性やジェンダーなどの社会的要因も対象とし、近年国内外で活発化している研究領域です。

都市における人の行動やSNS上のインタラクションをデータから数理的に解析します。Google MapデータやTwitterデータの分析、LLMを活用した社会データ解析、企業ネットワークや特許情報を用いた技術・経済の相互作用の研究を進めています。

逆学習・モデル合成・学習データ蒸留などの最先端手法を開発し、言語モデルの汎化能力や推論能力がどのように獲得されるかを解明します。また、言語モデルの透明性・安全性・効率性の向上を目指した研究に取り組むとともに、LLMをエージェントとして活用する新しい枠組みも探求しています。

各国の研究者が出す論文群のリサーチトピックを定量的に時系列に比較

サスティナビリティに関する学術文献がSDGsに対しどのような関心を持っているかを分析

長い間注目されなかった論文であるSleeping Beautyとそのきっかけとなる論文であるPrinceを大規模に取得し、その特徴を明らかにしました。非連続な発見は遠い分野間だけではなく、近くの分野の見落としにも多く存在していることがわかりました。

異質なコミュニティをつなぐ結節点(ノード)を検出する新しいネットワーク指標(PW)を提案

Twitterの政治的エコーチャンバーにおいて効率的な情報拡散が行われている過程を明らかにしました。

木構造上のトピックから各トピックに関する要約文を生成する教師なし要約手法を提案