研究内容
当研究室ではデータサイエンスを活用して、経営・社会・科学技術に関する現象を体系的に理解し、新しい知見を創出することを目指しています。機械学習・深層学習、自然言語処理、ネットワーク分析などの手法を中心に、手法そのものの基礎研究にも取り組んでいます。
解析対象は、学術ビッグデータ、ソーシャルメディア、企業取引情報やM&A、特許データ、都市行動データ、レビュー文など多岐にわたります。生成AIについては、逆学習を用いた大規模言語モデル(LLM)の解析や、LLMを活用した社会・科学データの分析にも先駆的に取り組んでいます。
学生の研究テーマ選択については自主性を尊重し、多様なテーマの研究が進められています。研究者同士が活発に交流し、分野横断的な取り組みが進んでいます。
さらに、テクノロジー・インフォマティックス社会連携講座や NEDO/産業技術総合研究所のプロジェクトなど、外部機関との共同研究も積極的に推進しています。研究成果の社会実装と広範なコミュニティへの貢献を重視しています。
Science of Science / Science of Science
科学論文、特許、企業活動などから、知識や技術がどのように創出され、社会へ広がるかを数理的に解析します。多様性やジェンダーなどの社会的要因も対象とし、近年国内外で活発化している研究領域です。
近年の代表的な研究
- 国際的な研究トピックの進展と遅れの分析
- 基礎研究者を軸としたサイエンスエコシステムの理解
- 政策文書における論文引用メカニズムの解明
- サーキュラーエコノミー分野のトップ研究者の分析
計算社会科学 / Computational Social Science
都市における人の行動やSNS上のインタラクションをデータから数理的に解析します。Google MapデータやTwitterデータの分析、LLMを活用した社会データ解析、企業ネットワークや特許情報を用いた技術・経済の相互作用の研究を進めています。
近年の代表的な研究
- Twitter上の政治コミュニティ構造の変化の解析
- Google Mapデータによる都市インタラクション構造の理解
- 研究者のSNS利用と研究インパクトの関係分析
- 地銀を中心とした企業間取引ネットワークの距離特性
- パテントスペースを用いた企業ポートフォリオ戦略の評価
自然言語処理 / Natural Language Processing
逆学習・モデル合成・学習データ蒸留などの最先端手法を開発し、言語モデルの汎化能力や推論能力がどのように獲得されるかを解明します。また、言語モデルの透明性・安全性・効率性の向上を目指した研究に取り組むとともに、LLMをエージェントとして活用する新しい枠組みも探求しています。
近年の代表的な研究
- 大規模言語モデルの逆学習による訓練データ解析
論文/研究プロジェクト紹介
各国の研究トピックの進展を定量化
各国の研究者が出す論文群のリサーチトピックを定量的に時系列に比較
サステナビリティとSDGsへの科学的関心:学術論文のメタ分析
サスティナビリティに関する学術文献がSDGsに対しどのような関心を持っているかを分析
Large-scale analysis of delayed recognition using sleeping beauty and the prince
長い間注目されなかった論文であるSleeping Beautyとそのきっかけとなる論文であるPrinceを大規模に取得し、その特徴を明らかにしました。非連続な発見は遠い分野間だけではなく、近くの分野の見落としにも多く存在していることがわかりました。
Evaluating Nodes of Latent Mediators in Heterogeneous Communities
異質なコミュニティをつなぐ結節点(ノード)を検出する新しいネットワーク指標(PW)を提案
Dense and influential core promotion of daily viral information spread in political echo chambers
Twitterの政治的エコーチャンバーにおいて効率的な情報拡散が行われている過程を明らかにしました。
Unsupervised Abstractive Opinion Summarization by Generating Sentences with Tree-Structured Topic Guidance
木構造上のトピックから各トピックに関する要約文を生成する教師なし要約手法を提案