採択情報
令和7年度、令和6年度、令和5年度、令和4年度、令和3年度、令和2年度、平成31年度、平成30年度、平成29年度、平成28年度、平成27年度、平成26年度、平成25年度、平成24年度、平成23年度、平成22年度、平成21年度
令和6年度申請実績
利用区分 | カテゴリー | 応募数 | 採択数 |
---|---|---|---|
学術利用 | 成果公開 | 54 | 54 |
産業利用 | 成果公開 | 14 | 14 |
成果非公開 | 24 | 24 | |
合計 | 92 | 92 |
番号 | 所属機関 | 申請課題名 (課題概要) | 利用区分 (カテゴリー) | 利用 口数 | 報告書 |
---|---|---|---|---|---|
1 | 長崎大学生命医科学域(薬学部) | 植物ポリフェノールの化学構造および反応機構に関する研究 | 学術利用 (成果公開) | 1 | 提出免除 |
2 | 福島大学食農学類 | 糖鎖-蛋白質間の相互作用解析 | 学術利用 (成果公開) | 1 | 公開延期 |
3 | 星薬科大学 | MDシミュレーションと量子化学計算を用いた医薬品開発支援 | 学術利用 (成果公開) | 6 | |
4 | 東京大学医科学研究所 | ウイルスの形質および進化予測法の開発 | 学術利用 (成果公開) | 6 | |
5 | 東京農工大学大学院工学研究院 | 多機能統合メタサーフェスの大規模並列解析 | 学術利用 (成果公開) | 1 | 未提出 |
6 | 中央大学大学院 | 深層学習を活用した水防災シミュレーションの計算効率化及び高速化に関する研究 | 学術利用 (成果公開) | 1 | |
7 | 東京医科歯科大学難治疾患研究所 | 深層生成モデルによる人工タンパク質・人工ペプチド設計 | 学術利用 (成果公開) | 19 | 提出免除 |
8 | 国立感染症研究所病原体ゲノム解析研究センター | 分子動力学シミュレーションによる新興再興感染症に関する研究 | 学術利用 (成果公開) | 4 | 提出免除 |
9 | 理化学研究所革新知能統合研究センター | モデル崩壊の観察と対処方法の開発 | 学術利用 (成果公開) | 2 | 未提出 |
10 | 九州大学応用力学研究所 | 集風レンズ付き風車とそのマルチロータシステムの流体シミュレーション | 学術利用 (成果公開) | 5 | |
11 | 久留米工業高等専門学校 | ポリグルタミン病原因タンパク質凝集体の形成及び解離過程の理論研究 | 学術利用 (成果公開) | 5 | |
12 | アストロバイオロジーセンター・国立天文台 | 第一原理計算による惑星物質データベースの構築 | 学術利用 (成果公開) | 3 | 公開延期 |
13 | 産業技術総合研究所 計量標準総合センター | 界面・局所構造制御による熱物性変調メカニズムの解明 | 学術利用 (成果公開) | 24 | 提出免除 |
14 | 群馬大学大学院医学系研究科 | シナプスタンパク質間相互作用の解析 | 学術利用 (成果公開) | 1 | 公開延期 |
15 | 大阪公立大学 | 金属組織形成および物性の大規模フェーズフィールド・分子動力学解析 | 学術利用 (成果公開) | 6 | 提出免除 |
16 | 理化学研究所革新知能統合研究センター | 継続的ベイズ推論の改善 | 学術利用 (成果公開) | 60 | 提出免除 |
17 | 海洋研究開発機構 | 南海トラフ域の地震波速度構造モデルに基づく走時計算ニューラルネットワークの構築・公開 | 学術利用 (成果公開) | 2 | 提出免除 |
18 | 国立情報学研究所 コンテンツ科学研究系 | プライバシー保護と偽音声検出を統合する音声データ処理基盤 | 学術利用 (成果公開) | 9 | |
19 | 国立研究開発法人 物質・材料研究機構 | 超大規模焼結シミュレーションによる緻密化挙動の定量的解析 | 学術利用 (成果公開) | 10 | 公開延期 |
20 | 東京大学大学院工学系研究科 | 深層学習に関する研究 | 学術利用 (成果公開) | 9 | PDF1 PDF2 論文 |
21 | 慶應義塾大学理工学部 | 深層学習を用いた大規模化合物潜在空間の構築 | 学術利用 (成果公開) | 30 | |
22 | 国立情報学研究所コンテンツ科学研究系 | フェイクメディア検知の基礎研究と応用実験 | 学術利用 (成果公開) | 12 | 提出免除 |
23 | 産業技術総合研究所人工知能研究センター | 人工知能とその応用に関する研究 | 学術利用 (成果公開) | 9 | 公開延期 |
24 | 大阪公立大学大学院理学研究科 | 超流動ヘリウムにおける量子乱流の数値的研究 | 学術利用 (成果公開) | 1 | |
25 | 法政大学情報科学部 | 時空間並列アルゴリズムを用いた物理シミュレーョン | 学術利用 (成果公開) | 1 | |
26 | 一般財団法人高度情報科学技術研究機構神戸センター | TSUBAME 4.0におけるLAMMPSの性能評価 | 学術利用 (成果公開) | 2 | |
27 | 産業技術総合研究所 | 量子アニーリングにおける近似的断熱ショートカット | 学術利用 (成果公開) | 8 | |
28 | 東北大学大学院薬学研究科 | 生体脂質膜環境下でのシグナルタンパク質の分子動力学シミュレーション | 学術利用 (成果公開) | 4 | 提出免除 |
29 | 産業技術総合研究所 | 生成型音声・画像AIのための学習アルゴリズムの開拓と自動機械学習の研究 | 学術利用 (成果公開) | 11 | |
30 | 大阪大学大学院基礎工学研究科 | 極限環境構造材料の原子論解析に資する構造材料用ニューラルネットワーク原子間相互作用を用いた変形・破壊解析 | 学術利用 (成果公開) | 4 | |
31 | 国立研究法人情報通信研究機構 | GPUクラスタを用いたミリ波帯大規模広帯域電波伝搬シミュレーション | 学術利用 (成果公開) | 14 | 公開延期 |
32 | 東北大学大学院情報科学研究科 | マルチモーダル言語モデルの開発 | 学術利用 (成果公開) | 4 | 提出免除 |
33 | 早稲田大学基幹理工学部 | 計算機の文章読解・生成能力向上に関する研究 | 学術利用 (成果公開) | 14 | 提出免除 |
34 | 大阪公立大学工学研究科機械系専攻 | 直接数値解析データを用いた非平衡壁面モデルの開発 | 学術利用 (成果公開) | 2 | |
35 | 早稲田大学理工学術院基幹理工学部 | 自然言語の非線形性の計算論モデル | 学術利用 (成果公開) | 8 | |
36 | 同志社大学理工学部 | 大規模学術データ分析基盤の開発 | 学術利用 (成果公開) | 7 | |
37 | 国立情報学研究所 | フェイクメディア生成と検出 | 学術利用 (成果公開) | 5 | |
38 | 一般財団法人高度情報科学技術研究機構 | TSUBAME4.0におけるAI環境の利用技術の習得 | 学術利用 (成果公開) | 1 | |
39 | 国立大学法人 京都大学 | 大規模言語モデル(LLM)を活用した医薬品等の有効性・安全 性評価のためのアウトカム抽出の方法論の確立に向けた研究 | 学術利用 (成果公開) | 45 | 未提出 |
40 | 国立情報学研究所 | 大規模マルチモーダルモデルの研究開発および応用 | 学術利用 (成果公開) | 4 | 未提出 |
41 | 産業技術総合研究所人工知能研究センター | データの倫理問題を根本解決するテキストからの画像生成モデル構築 | 学術利用 (成果公開) | 18 | 未提出 |
42 | 東京医科歯科大学M&Dデータ科学センター | 次世代医療創出のための疾患・創薬研究 | 学術利用 (成果公開) | 2 | 提出免除 |
43 | 京都大学医学研究科 ビッグデータ医科学 | 医薬プロセス最適化と新薬開発を効率化・加速する製剤処方設計AIの開発 | 学術利用 (成果公開) | 5 | |
44 | 東北大学大学院情報科学研究科 | 現実世界の逐次的環境変化に適応するマルチモーダル自然言語理解モデル | 学術利用 (成果公開) | 7 | 提出免除 |
45 | 東京大学大学院新領域創成科学研究科 | 地理空間データ解析のための大規模マルチモーダルモデルの研究開発 | 学術利用 (成果公開) | 6 | 公開延期 |
46 | 産業技術総合研究所人工知能研究センター知識情報研究チーム | オープンソースかつ日本語に強い大規模言語モデルの構築 | 学術利用 (成果公開) | 18 | 提出免除 |
47 | 東京大学医科学研究所 | 効率的な感染症制御に資するバイオインフォマティクス研究 | 学術利用 (成果公開) | 6 | |
48 | 会津大学コンピュータ理工学科/情報システム学部門 | 深層学習に基づく小惑星上のボルダー検知技術の研究開発 | 学術利用 (成果公開) | 2 | |
49 | 大阪公立大学大学院工学研究科 | 直接数値解析による非相似伝熱制御の検討 | 学術利用 (成果公開) | 2 | |
50 | 山梨大学大学院総合研究部附属クリスタル科学研究センター | 無機有機ハイブリッド結晶の格子欠陥計算に関する研究 | 学術利用 (成果公開) | 1 | |
51 | 東北大学大学院工学研究科 | 深層学習を用いた文書画像解析手法の評価 | 学術利用 (成果公開) | 1 | 公開延期 |
52 | 一橋大学大学院ソーシャル・データサイエンス研究科 | 多言語マルチモーダル大規模言語モデルに関する研究 | 学術利用 (成果公開) | 2 | |
53 | 同志社大学文化情報学部 | 計算資源が限られた状況下における Low-Rank Adapter Fine-Tuning に関する研究 | 学術利用 (成果公開) | 1 | |
54 | 星薬科大学2 | MDシミュレーションを用いた医薬品等の分子設計 | 学術利用 (成果公開) | 1 |
番号 | 所属機関 | 申請課題名 (課題概要) | 利用区分 (カテゴリー) | 報告書 |
---|---|---|---|---|
1 | 株式会社Kotoba Technologies Japan | 日本語特化の音声生成モデル | 産業利用 (成果公開) | 未提出 |
2 | Sakana AI株式会社 | マルチモーダル基盤モデルとモデル間連携技術の研究開発 | 産業利用 (成果公開) | |
3 | アルテアエンジアリング株式会社 | GPUの産業分野の流体解析(車両空力、ファン騒音、建築物風荷重)への適応検討 | 産業利用 (成果公開) | 公開延期 |
4 | Turing株式会社 | 深層強化学習を用いた超人間級AI運転技術の研究 | 産業利用 (成果公開) | |
5 | 日揮グローバル株式会社 | プラントによる気象変化究明 | 産業利用 (成果公開) | 公開延期 |
6 | JT生命誌研究館 | クモ胚に基づく発生-進化の数理解析 | 産業利用 (成果公開) | |
7 | 株式会社デンソーアイティーラボラトリ | 株式会社デンソーアイティーラボラトリ | 産業利用 (成果公開) | 公開延期 |
8 | 株式会社アラヤ2 | EEGを用いた発話解読AIの開発 | 産業利用 (成果公開) | |
9 | フューチャー株式会社 | 特定領域に対する特化型日本語LLMの研究 | 産業利用 (成果公開) | |
10 | 株式会社CoeFont | 深層学習を用いたリアルタイムAI音声合成プラットフォームの技術開発 | 産業利用 (成果公開) | |
11 | Sakana AI株式会社 | 基盤モデルの進化的構築技術の確立 | 産業利用 (成果公開) | |
12 | Sakana AI株式会社 | LLMエージェントの研究開発 | 産業利用 (成果公開) | |
13 | アヘッド・バイオコンピューティング株式会社 | IT創薬向け並列計算化学シミュレーション手法の開発 | 産業利用 (成果公開) | |
14 | 株式会社Quemix | 有機高分子材料の量子化学的研究 | 産業利用 (成果公開) |
番号 | 所属機関 | 利用区分 (カテゴリー) | 状況 |
---|---|---|---|
1 | 大鵬薬品工業株式会社 | 産業利用 (成果非公開) | 終了 |
2 | エトリア株式会社(株式会社リコー) | 産業利用 (成果非公開) | 終了 |
3 | アリヴェクシス株式会社 | 産業利用 (成果非公開) | 終了 |
4 | 株式会社クレハ | 産業利用 (成果非公開) | 終了 |
5 | 住鉱資源開発株式会社 | 産業利用 (成果非公開) | 終了 |
6 | 東洋紡株式会社 | 産業利用 (成果非公開) | 終了 |
7 | 株式会社MQue | 産業利用 (成果非公開) | 終了 |
8 | 日本ガイシ株式会社 | 産業利用 (成果非公開) | 終了 |
9 | 中外製薬株式会社 | 産業利用 (成果非公開) | 終了 |
10 | 中外製薬株式会社2 | 産業利用 (成果非公開) | 終了 |
11 | 株式会社アラヤ | 産業利用 (成果非公開) | 終了 |
12 | 協和キリン株式会社 | 産業利用 (成果非公開) | 終了 |
13 | 太陽誘電株式会社 | 産業利用 (成果非公開) | 終了 |
14 | SB Intuitions株式会社 | 産業利用 (成果非公開) | 終了 |
15 | パナソニックオペレーショナルエクセレンス株式会社 | 産業利用 (成果非公開) | 終了 |
16 | 東芝デジタルソリューションズ株式会社 | 産業利用 (成果非公開) | 終了 |
17 | JSR株式会社 | 産業利用 (成果非公開) | 終了 |
18 | 株式会社CoeFont | 産業利用 (成果非公開) | 終了 |
19 | 太陽誘電株式会社2 | 産業利用 (成果非公開) | 終了 |
20 | 株式会社アラヤ3 | 産業利用 (成果非公開) | 終了 |
21 | 本田技術研究所 | 産業利用 (成果非公開) | 終了 |
22 | 中外製薬株式会社3 | 産業利用 (成果非公開) | 終了 |
23 | 富士電機株式会社 | 産業利用 (成果非公開) | 終了 |
24 | 鹿島建設株式会社 | 産業利用 (成果非公開) | 終了 |
利用課題概要(学術)
申請課題名 | 植物ポリフェノールの化学構造および反応機構に関する研究 |
利用課題概要 | 植物ポリフェノールはさまざまな生物活性を持ち、世界中で注目を集めている。しかし、その構造の複雑さのため、各種スペクトルデータより化学構造や立体配座を正確に決定することは困難なことが多い。植物より得られたポリフェノール成分やその反応生成物について、DFT計算を利用した構造最適化・各種スペクトル計算を行い、化学構造ならびに立体配座を解明する。さらに、それらの反応機構について解析を行う。 |
申請課題名 | 糖鎖-蛋白質間の相互作用解析 |
利用課題概要 | 単糖類がグリコシド結合を介して連なった糖鎖は、細胞間の情報伝達やウイルス感染、がん転移などの生命現象に関与しており、核酸・蛋白質に次ぐ「生体内の第三の鎖」として注目されている。さらに、これら糖鎖の生合成や分解に関与する酵素群、もしくはレクチンと呼ばれる糖認識蛋白質が糖鎖を認識するメカニズムの理解も、糖鎖を介した生命現象の解明に重要である。しかし、糖鎖-蛋白質間相互作用の解析および評価は、糖鎖の構造多様性も相まってとても複雑かつ多様であり、従来の実験的手法のみでは限界がある。そこで本研究では、分子動力学計算を中心とした手法により、糖鎖-蛋白質間相互作用の更なる機構解明に取り組む。 |
申請課題名 | MDシミュレーションと量子化学計算を用いた医薬品開発支援 |
利用課題概要 | 本研究では、MDシミュレーションと量子化学計算に基づき医薬品開発支援法を研究する。MDシミュレーションにより医薬品候補の物性を予測し、量子化学計算により分子の電子構造や反応性を評価する。TSUBAMEの高性能計算能力を活かし、複雑な分子システムの解析をおこない、医薬品の設計や効果予測に貢献する技術の確立を目指す。 |
申請課題名 | ウイルスの形質および進化予測法の開発 |
利用課題概要 | COVID-19パンデミックを皮切りに、ウイルス感染症研究はビッグデータの時代に突入した。例えば、これまでに1600万配列以上のSARS-CoV-2ゲノムが解読され、データベース上で公開されてきた。また、高スループット実験により、ウイルスの性質(免疫逃避能や細胞への感染性など)が変異によりどのように変化するのか計測することが可能となった。これらのビッグデータを活用すれば、ウイルスの形質や進化を一定の精度で予測することが可能となる。本課題では、上記のビッグデータと大規模言語モデルや拡散モデルに代表される深層学習モデルを駆使し、ウイルスの形質や進化を予測する手法の開発に取り組む。 |
申請課題名 | 多機能統合メタサーフェスの大規模並列解析 |
利用課題概要 | 本課題では、多機能統合メタサーフェスの設計に供するための、誘電体ナノ構造の光学的な応答解析を行う。現在、誘電体ナノ構造からなる可視波長域で動作するメタサーフェスレンズの開発を進めている。構造の最適化のためには光学特性の計算が必須であるが、必要なメモリが膨大となるため、従来所有していたワークステーションでは十分な計算を行えなかった。そこで、TSUBAME 4.0上でマルチフィジックス計算ソフトを利用することで、本課題の本格的な展開に取り組むことを目的として、申請を行った。2024年度には,偏光・集光性・偏向を制御するメタサーフェスに関するマルチスケール解析を行う。 |
申請課題名 | 深層学習を活用した水防災シミュレーションの計算効率化及び高速化に関する研究 |
利用課題概要 | 深層学習を活用し、航空写真から自動で高精度な土地利用データを生成します。また、生成したデータから土地利用条件に基づく粗度係数を算出し、防災シミュレーションへ活用することで計算効率化を図ります。さらに洪水氾濫シミュレーション結果を用いた深層学習による氾濫域予測モデルを構築し、高速な氾濫予測を実現します。これらにより、防災計画の高度化と住民の適切な避難行動等につなげ、防災対策強化と災害リスク低減への利活用を目指します。 |
申請課題名 | 深層生成モデルによる人工タンパク質・人工ペプチド設計 |
利用課題概要 | 本研究では、深層生成モデルと分子動力学シミュレーションを用いて、特定の作用をもつタンパク質およびペプチドをde novoで設計する技術を開発する。特に、特定のタンパク質モジュールを阻害する人工タンパク質/ペプチドに焦点を当て、実験検証を組み合わせることで、これらのタンパク質を自動で設計、構築、検証、学習するプラットフォームを開発する。最終的に、設計されたタンパク質/ペプチドを用いた新たながん治療法の開発を目指す。 |
申請課題名 | 分子動力学シミュレーションによる新興再興感染症に関する研究 |
利用課題概要 | 易変異性RNAウイルスによる新興・再興感染症は、社会や経済に多大な損失をもたらす。そのため、その対策は世界が共有する公衆衛生上の重要課題になっている。我々は、計算科学により易変異性ウイルスの理解と制御に向けた基礎・応用研究を進めている。ウイルスの性質は、ウイルスタンパク質の構造により決定される。本研究では、TSUBAMEにおいてAmberによる分子動力学シミュレーションを実施し、変異がウイルスタンパク質の動的性質や宿主因子との相互作用に及ぼす効果を解析する。得られた情報を、病原体の性質変化の分子基盤解明、リスク評価、リスク変異予測、創薬標的同定、ワクチン抗原設計等に活用する。 |
申請課題名 | モデル崩壊の観察と対処方法の開発 |
利用課題概要 | 生成モデルの学習に生成データが混入するという連鎖が続くと,次世代の生成モデルの性能が劇的に劣化する「モデル崩壊」と呼ばれる現象が知られている.申請者らの研究により,このようなモデル崩壊は1世代目から見られることも明らかになっている. 生成モデルの発展に伴い,生成データがインターネット上に大量に現れるようになった一方,生成モデルを含む深層学習はインターネット上の大量のデータを用いて開発されてきた経緯があり,この問題の理解と対処は喫緊の課題である. 本課題では「モデル崩壊」現象を詳細に観察するとともに,データ拡張により改良する対応策を探索する. |
申請課題名 | 集風レンズ付き風車とそのマルチロータシステムの流体シミュレーション |
利用課題概要 | 高い発電性能を持つ風車として集風レンズ付き風車が注目されており,本研究グループは九大発ベンチャーである(株)リアムウィンドの共同実施者として,環境省の地域競争・セクター横断型カーボンニュートラル技術開発・実証事のプロジェクトで定格出力200kWの中型レンズ風車およびそのマルチロータシステムの研究開発を進めている.本利用課題では,新しいレンズ集風体を採用する200kWレンズ風車の発電性能,風荷重,空力特性,静音性を数値流体シミュレーションにより明らかにするためTSUBAME4.0を利用する.また,新しい集風体形状を2基マルチロータにしたときの発電効率やウェイクの流れをシミュレーションで評価する. |
申請課題名 | ポリグルタミン病原因タンパク質凝集体の形成及び解離過程の理論研究 |
利用課題概要 | 神経変性疾患の一つであるポリグルタミン病は長いグルタミン鎖を含むポリグルタミンタンパク質(polyQ)が凝集し、神経細胞内に蓄積することで発症する。アルギニンがpolyQの凝集に対する阻害効果を示し、ポリグルタミン病に対して治療効果をもつことが見出されたが、その分子論的メカニズムは解明されていない。また、凝集阻害化合物によるpolyQの凝集阻害を理解するためには先にpolyQの凝集過程を把握する必要があるが、そもそもpolyQが凝集する詳細なメカニズムは未解明である。本研究課題では、polyQの詳細な凝集機構及びアルギニンがpolyQの凝集体を分解し、その形成を阻害するメカニズムを解明する。 |
申請課題名 | 第一原理計算による惑星物質データベースの構築 |
利用課題概要 | 惑星における物質進化や多様性の理解を深めるために、第一原理計算による物質データベースを構築する。これによって将来得られる観測データに対して、その物質環境に関する解釈を深化させることを目指す。(1)主に太陽系外惑星大気における分子同定に向けた、分子の高精度なスペクトルデータを構築する。特に、実験で測定するのが難しいものやデータが不十分なものを優先する。また、(2)惑星の内部構造推定のために、第一原理分子動力学法で得られた原子間ポテンシャル作成用の学習データを蓄積し、応用例をつくる。 |
申請課題名 | 界面・局所構造制御による熱物性変調メカニズムの解明 |
利用課題概要 | 磁性多層膜や二次元積層膜における界面や、ファンデルワールス結合や水素結合で構成される有機物、複雑な多面体ネットワークから成る結晶やアモルファス材料など、局所構造とその秩序が材料全体の熱物性と関係することが知られている。本研究課題では、第一原理・分子動力学法・格子動力学法と数理的手法に基づいた構造解析法を組み合わせることで、界面を含む多層膜・積層低次元材や層状化合物、有機結晶、軽元素固体水素貯蔵材、アモルファス酸化物におけるフォノン(格子振動の量子)の特性を解析し、構造と熱物性の相関メカニズムの解明に取り組む。 |
申請課題名 | シナプスタンパク質間相互作用の解析 |
利用課題概要 | ニューロンはシナプスにおいて相互に接続され、シナプス受容体を介して情報を交換することで様々な生理機能を果たす。シナプスに局在するタンパク質間の相互作用は、このような生理機能の調節に重要であり、相互作用の異常は、自閉症スペクトラム障害や統合失調症、うつ病などの精神疾患を引き起こす可能性があると考えられる。しかしながら、現在解明されている相互作用はごく一部にとどまっており、疾患との関連を十分に解明するまでには至っていない。そこで、実験系による相互作用解析に加えて計算機科学的なアプローチを併用することで、タンパク質間相互作用検出の加速化、および正確なデータ抽出を目指す。 |
申請課題名 | 金属組織形成および物性の大規模フェーズフィールド・分子動力学解析 |
利用課題概要 | 多結晶材料の高特性化のためには,製造工程における相変態,再結晶・粒成長などを通じた組織形成の高精度制御が鍵となる.本研究では,高効率な組織計算が可能な現象論的手法:フェーズフィールド法と,物性値等の入力不要で組織発展を扱える原子論的手法:分子動力学とをデータ科学により融合し,複数GPU並列計算を併用することで,原子レベルの物理を反映した大規模・定量的な多結晶組織予測を初めて可能とする.今年度は,純金属および合金の主として界面物性をデータ駆動型材料物性同定手法により評価し,特に合金特有の元素偏析などの因子が物性および組織形成に及ぼす影響を解析する. |
申請課題名 | 継続的ベイズ推論の改善 |
利用課題概要 | 深層学習では全てのデータが揃った状態で学習を行い、一度学習したモデルは更新できないのが一般的である。本利用課題では、継続的に学習しつづけるモデルの開発を目指す。また、継続的な深層学習に関する試みもいくつか存在するが、技巧的な手法を用いて経験的な性能向上を重視するものが多い。本利用課題では、数学的に厳密なベイズの原理に基づく理論により継続学習を根本的に見直すことを目的とする。ただし、ベイズ的な深層学習には通常の深層学習以上の膨大な計算量を要するため、TSUBAME4.0のような大規模な計算資源が必要である。 |
申請課題名 | 南海トラフ域の地震波速度構造モデルに基づく走時計算ニューラルネットワークの構築・公開 |
利用課題概要 | 自然地震の震源の位置決めは地震計における地震波到達時刻のデータを用いて行われる。震源位置決定精度の向上のため、現実的な地下の地震波速度構造を反映させた地震波到達時刻計算(走時計算)を迅速かつ手軽に行えることが重要である。本研究では、Physics-informed neural network(PINN)を活用し、巨大地震の発生が予測される南海トラフ域の速度構造モデルに対する走時計算ニューラルネットワーク(NN)を構築・公開することを目指す。このNNは、震源位置決定に必要な震源・観測点間の走時計算を現実的な速度構造モデルについて学習させて構築され、震源・受振点の入力に対し高速に走時を出力する。 |
申請課題名 | プライバシー保護と偽音声検出を統合する音声データ処理基盤 |
利用課題概要 | インフォデミックの時代において、AIが生成した偽音声の検出と声紋などの個人情報の保護ができる音声データ処理基盤が不可欠である。だたし、既存の偽音声検出と声紋を保護する匿名化技術は独立して設計されるため、共同最適化ができず、検出と保護の水準も理論的に示せない。本プロジェクトは偽音声検出と音声匿名化を尤度比に基づいた深層学習の枠組みに統一し、検出と匿名化モデルの構築を目指す。 |
申請課題名 | 超大規模焼結シミュレーションによる緻密化挙動の定量的解析 |
利用課題概要 | 焼結によって作製する多結晶材料の,種々の材料特性を制御するためには,焼結中に生じる材料の巨視的収縮と緻密化を正確に理解することが重要である.本研究では,数万粒子を用いた大規模な焼結のフェーズフィールドシミュレーションを実施することで,材料の緻密化挙動を評価し,加熱温度・速度・時間と緻密化挙動の関係を定量的に評価する.さらに,シミュレーションから得られた緻密化挙動を従来の理論モデルと比較し,その同異点を明らかにすることを目指す. |
申請課題名 | 深層学習に関する研究 |
利用課題概要 | 本課題では深層学習に関する基礎技術開発やあらゆる技術の応用に取り組む。 具体的には次世代深層学習に関する基礎技術の開発、大規模言語モデルの創発性に関する研究、ニューラルネットと大規模言語モデルを使用した自然言語処理に関する研究、大規模言語モデルを用いたマルチモーダル推論タスクの実行、大規模言語モデルを用いた未知の方策獲得のための既存方策の合成やロボットの低レベル方策の学習効率化アルゴリズムの開発、最適化アルゴリズムにおける方法論の開発とその実践的なタスクへの応用に関する研究、事前学習された拡散モデルを用いた画像編集などの下流タスクへの適応などである。 |
申請課題名 | 深層学習を用いた大規模化合物潜在空間の構築 |
利用課題概要 | 本研究では、創薬や材料工学における化合物探索の効率化を目的として、天然化合物を含む大規模な化合物データセットを扱える深層学習のための分子生成VAEモデルを構築する。モデルアーキテクチャにTransformerを適用し、分子をフラグメントに分解して表現することで、計算速度と生成精度の改善を図る。さらに、分子特性が異なる複数のベンチマークデータを用いて、既存のVAEモデルと比較評価を行う。これにより、天然化合物だけでなく低分子化合物に対しても高い性能を発揮する汎用的な手法の開発を目指す。加えて、分子最適化タスクを通じて構築した潜在空間の有用性を検証し、実際の創薬や材料設計への応用可能性を探る。 |
申請課題名 | フェイクメディア検知の基礎研究と応用実験 |
利用課題概要 | 深層生成モデルによるディープフェイクの問題は社会で認知され、日本政府やG7でも対策が急務とされている。日本の国立情報学研究所ではディープフェイクの検知技術の研究を行なっている。本課題では、急速普及が広がる画像生成サービスや音声のボイスクローンサービスも考慮したフェイクメディア検知技術の基礎研究と応用研究を実施する。 |
申請課題名 | 人工知能とその応用に関する研究 |
利用課題概要 | 本課題は、人工知能の理論から多様な応用分野にわたる総合的な探求を目的とする。機械学習、深層学習、強化学習、自然言語処理などの人工知能技術を理論的に検討し、実世界の問題解決における応用を目指す。その研究内容は、全結合層や正規化層などの人工知能モデルの構成要素を改良および開発、転移学習に有効な事前学習に関する研究、より効果的な転移学習手法の開発及び実問題における検証、などを含む。 |
申請課題名 | 超流動ヘリウムにおける量子乱流の数値的研究 |
利用課題概要 | 超流動とは極低温で実現し得る非粘性の流れのことである.超流動の乱流状態は量子乱流ともよばれ,量子流体力学における重要な研究対象として盛んに研究されている.本課題では,超流動ヘリウム中の量子乱流の物理を探究する.数値計算を用いた量子乱流の研究では,大規模数値計算の実現がひとつの問題である.例えば,量子流体力学における大きな謎であるT1-T2遷移(超流動の二段階乱流遷移)の再現には大規模数値計算が必要だと考えられる.本課題では,TSUBAMEの性能を活用してそのような大規模数値計算を行い,量子乱流の重要な物理を解明することを主な目標とする. |
申請課題名 | 時空間並列アルゴリズムを用いた物理シミュレーョン |
利用課題概要 | 利用課題の一番の目的は、超並列GPUコンピュータ用の新しい時空間局所化アルゴリズムの開発することである。これまで我々のアルゴリズムはメモリバウンド物理シミュレーション問題に既に利用されており、これには、ステンシルスキームなどのローカル依存関係を持つ数値スキームを用いることで様々な課題を解決してきた。これをさらに進めるためには、計算が処理順序やデータアクセス局所性、メッセージ通過速度などの更に多くの要因を考慮し、アルゴリズムの改良、検討を行う必要がある。研究対象を拡大することでLRnLA法のアルゴリズムを改良していくことが我々の研究テーマである。 |
申請課題名 | TSUBAME 4.0におけるLAMMPSの性能評価 |
利用課題概要 | NVIDIA H100を搭載したスーパーコンピュータであるTSUBAME 4.0において、古典分子動力学法 (MD) の汎用シミュレーションコードであるLAMMPSの性能評価を行う。LAMMPSの開発者が公開しているベンチマークデータを主に用いて、MD計算の典型例に対する性能情報を調査する。特に、MD計算の典型的な高負荷部分である力場計算におけるGPU特性、データサイズ拡張によるスケーラビリティの調査に着目する。また、LAMMPSのCUDA対応で利用されるライブラリKokkosを含め、関連するライブラリやカーネルコードについても基礎性能を調査する。 |
申請課題名 | 量子アニーリングにおける近似的断熱ショートカット |
利用課題概要 | 量子アニーリングは,組合わせ最適化問題を解く手法や,量子状態準備の手法として近年大きな注目を集めている.量子アニーリング中における非断熱遷移は量子アニーリングの性能の低下を招く.そのため非断熱遷移を抑制するためには十分長い時間をかけ量子アニーリングを行う必要がある. 本研究課題では量子アニーリングにおいて非断熱遷移を抑制する近似的カウンター項の構成を行い,量子アニーリング時間を短縮させる手法を開発する. |
申請課題名 | 生体脂質膜環境下でのシグナルタンパク質の分子動力学シミュレーション |
利用課題概要 | ある条件下で集合し(膜ドメイン)、脂質と相互作用するシグナル分子を局在させる。本課題では、Gタンパク質共役受容体(GPCR)とその下流シグナルタンパク質に着目した研究を行う。まず、生体内の膜組成を再現した約100種の脂質分子を含む脂質二重膜とシグナルタンパク質の相互作用を粗視化シミュレーションによって観察する。シグナルタンパク質が膜ドメインに与える影響やその過程で起きる特定の脂質との相互作用を観察した後、全原子シミュレーションによってその脂質がシグナルタンパク質の活性化に与える詳細な影響を観察する。 |
申請課題名 | 生成型音声・画像AIのための学習アルゴリズムの開拓と自動機械学習の研究 |
利用課題概要 | 本課題では,実世界で人間と協調する次世代AI技術を確立するため,その効率的な学習方法の開拓とともに実応用で課題となる自動機械学習 (AutoML/AutoPEFT) に取り組む. 具体的には,音声・画像AIのためのスケーラブルな学習アルゴリズムの開拓,実世界データにおける性能評価ベンチマークの確立,学習時のハイパーパラメータ・アーキテクチャの自動探索および効率的な微調整の開拓,大規模言語モデル (LLM) を活用した学習後のゼロショット調整など,実世界を理解し人々と協調するAIに必要な要素技術の開拓を進める. |
申請課題名 | 極限環境構造材料の原子論解析に資する構造材料用ニューラルネットワーク原子間相互作用を用いた変形・破壊解析 |
利用課題概要 | 本課題では、大規模な第一原理計算、分子動力学法、モンテカルロ法などの原子論的手法を駆使し、実験・計測で取得困難な高圧水素環境、摩耗環境、高温・高圧環境下での構造材料内部の塑性変形、組織変化、破壊の各現象に関する定量データを創出することを目的とする。そのために、多元合金および水素環境下の合金材料に適用可能な高精度ニューラルネットワーク原子間相互作用を用いた変形、破壊解析を行い、極限環境下データの創出及び材料特性発現のメカニズム解明に取り組む。 |
申請課題名 | |
利用課題概要 |
申請課題名 | GPUクラスタを用いたミリ波帯大規模広帯域電波伝搬シミュレーション |
利用課題概要 | ミリ波帯における電波は他の周波数帯と⽐較して,電波の直進性が⼤きく,⾒通し伝搬の形態が多い。しかし,ひとたび電波伝搬のフレネルゾーン内に該当帯域電波の吸収体・散乱・反射体などが存在すると,受信電⼒の予測⼿法の複雑さが増⼤し,不確かさが⼤きくなる。そこで,本研究では,電波散乱シートの配置や⼤きさ等による受信電⼒への影響を調べるために、各パラメータを変化させた際のミリ波帯電波の受信電⼒を⾼精度に予測できる⼤規模電磁界シミュレーションを新たに開発する。 |
申請課題名 | マルチモーダル言語モデルの開発 |
利用課題概要 | 大規模言語モデルとCLIPなどの事前学習された画像モデルを組み合わせることで,効率的にマルチモーダル言語モデルを構築することができる.本研究課題では,画像とそのソースコードを対象としたマルチモーダルモデルの検証や,動画を対象としたマルチモーダルモデルの検証を行う. |
申請課題名 | 計算機の文章読解・生成能力向上に関する研究 |
利用課題概要 | 計算機の文章読解・生成能力向上を目的とし、大規模テキストコーパスからの大規模言語モデルの学習、および、それを用いた応用システムの研究開発を行う。まず、Wikipediaやウェブテキストなどの大規模テキストコーパスを用いて大規模言語モデルを構築する。次に、構築した大規模言語モデルをファインチューニングすることによって、言語処理応用システムを構築する。これらのモデル・システムの構築時に人手で作成された言語知識や世界知識の統合を検討する。これらのモデル・システムの訓練のために、TSUBAME 4.0の並列計算環境を利用する。 |
申請課題名 | 直接数値解析データを用いた非平衡壁面モデルの開発 |
利用課題概要 | 工学応用を見据えた壁モデルラージ・エディ・シミュレーションに組み合わせる汎用的な壁面モデルとして,薄層近似された運動量式を積分することで得られる非平衡代数壁モデルの開発を行う.高レイノルズ数におけるチャネル乱流の直接数値解析を実施し,壁面近傍の瞬間場を取得する.得られた瞬間場にフィルター平均を施し,モデル化されたフィルター平均運動量式を解析する.特に,局所的に生じる乱流の非平衡が運動量式内の渦粘性モデルにあたえる影響を機械学習によってモデル化し,これを非平衡モデルに組み込む. |
申請課題名 | 自然言語の非線形性の計算論モデル |
利用課題概要 | 深層学習技術により大規模言語モデル(LLM)が提案され、それは情報科学全域に新しい可能性をもたらしている。LLMの重要性が増せば増すほど、その技術的限界にも焦点が当たっている。これらの限界の一端は、機械学習が曖昧にしか捉えられない言語の「非線形」な特質として生じる。本研究では、自然言語の特質としての「非線形性」について、明らかにし、工学に寄与する計算可能なモデルを考察することにより、技術の限界を打開する方向性を見出すことが目的である。 |
申請課題名 | 大規模学術データ分析基盤の開発 |
利用課題概要 | 本研究課題では、国内外の学術データ(論文、特許、ウェブページなど)からの効率的な情報抽出を目的とし、データ整形などの前処理からモデル学習、諸タスクでの応用までのパイプラインを構築する。特に、テキストやグラフを入力とするニューラルネットワークを構築し、出力される特徴量によって論文、用語、研究者という異なるエンティティを表現する。得られた表現を論文や研究者などの検索・推薦タスクに応用する。また、学術ドメイン以外のデータにおいても性能を評価することで、提案手法の応用可能性を検証する。 |
申請課題名 | フェイクメディア生成と検出 |
利用課題概要 | 顔,音声,身体,自然言語などの多様なモダリティを対象とした,シンセティックメディアの生成手法,および不正な目的で生成されたシンセティックメディア(フェイクメディア)の検知手法の検討を行う.具体的には,複数の機械学習モデルを用いたシンセティックメディア生成,多様なリアルメディアとシンセティックメディアを分類する機械学習モデルの検討.シンセティックメディアの改ざん領域を可視化するローカライゼーションモデルの検討を行う.検討結果は,学術論文などで積極的に公開する. |
申請課題名 | TSUBAME4.0におけるAI環境の利用技術の習得 |
利用課題概要 | 近年、HPCIの資源提供機関においてもGPUを搭載したマシンが増えつつあり、AIを活用した業務や研究が盛んに行われている。またAI分野以外の既存プログラムのGPU化対応も進んでいる。そこで、最新のGPU(NVIDIA社製 H100)を搭載したスーパーコンピュータTSUBAME4.0において、AIフレームワーク(Pytorch、Tensorflow)やAIプログラム(Resnet等)の環境構築、性能分析、性能評価を行い、GPU利用技術を習得することを目的とする。併せてCUDAやOpenACCの利用技術の習得、GPU対応OSSの性能評価も行う。 |
申請課題名 | 大規模言語モデル(LLM)を活用した医薬品等の有効性・安全 性評価のためのアウトカム抽出の方法論の確立に向けた研究 |
利用課題概要 | 大規模言語モデル(LLM)を用いて、多施設から収集した電子カルテ内の非構造化テキスト情報から医薬品の有効性と安全性評価に資するアウトカムを抽出する方法論を開発することを目的とする。この取り組みにより、医薬品評価プロセスを革新的に効率化し、患者ケアの質の向上を目指す。 現在の法制度における実現可能性も検討し、最終的に、この研究は医薬品開発と医療サービス提供のプロセスを効率化し、患者の安全と福祉の向上に資することを目指す。 |
申請課題名 | 大規模マルチモーダルモデルの研究開発および応用 |
利用課題概要 | 言語モデルの推論機構をマルチモーダルデータ・実世界データ(テキストに加えて動画・音声・センサデータ、図表を含む文書データ、構造化テキストデータなど)と組み合わせることで、実世界の情報を理解したマルチモーダルモデルを研究する。マルチモーダルモデルの性能評価に加えて、実世界でのデータへのファインてューニング・推論を実施する。特に、既存のテキスト・画像両面の出力データを利用することで、統合的に実世界の情報を認識し推論するモデルを作成する。加えて、学習・推論したマルチモーダルモデルのロボティクスなどへの応用も検討している。 |
申請課題名 | データの倫理問題を根本解決するテキストからの画像生成モデル構築 |
利用課題概要 | 本研究では、(1)数式など生成規則から自動生成された擬似画像・テキストによる一段階目の事前学習、(2)権利関係トレース可能な教師ラベル付実画像のみを用いた二段階目の継続事前学習により、データの倫理問題を根本解決するテキストからの画像生成モデルを構築する。昨今ではWEBをソースとして収集された画像・テキストデータが倫理面で害悪なデータを含み、倫理審査が入り、データのみならず学習済みモデルが公開停止の危機に追い込まれているが、本研究ではAI分野における倫理問題の根本解決を試みる。 |
申請課題名 | 次世代医療創出のための疾患・創薬研究 |
利用課題概要 | 我々は数理モデリング及びAIを統合し、特にがん・感染症の制圧を目指している。本プロジェクトにおいては、実験から得られたオミクスデータを機械学習により解析し治療標的を定め、その標的に対して我々のグループが独自開発したAI創薬手法を用いて疾病の制圧を施行した治療法開発を行っていく。具体的には分子動力学計算や量子化学計算、およびバイオインフォマティクス解析やMATLABによる数値シミュレーションデータ、我々が生命科学実験で取得したデータを入力とし、GPUを併用させたグラフ畳み込みニューラルネットワーク、基盤モデル、分子生成AI等の出力を得て次の仮説・解析をしていく。 |
申請課題名 | 医薬プロセス最適化と新薬開発を効率化・加速する製剤処方設計AIの開発 |
利用課題概要 | 本研究課題では、タンパク質やケミカルバイオロジーのマルチモーダルデータおよび創薬に関連する臨床データを活用した新しい創薬モデルの開発を行う。具体的には、これらのマルチモーダルなデータを統合し、AIと機械学習技術を用いた化合物の創薬・製薬上の有効性や安全性の予測を行う。特に、タンパク質の構造情報や化学的性質、バイオロジカルな作用機序データおよび臨床データを組み合わせ、精度の高い創薬予測モデルを構築する。最終的には、このモデルを用いて従来のシングルモダリティでは見つけにくい新規治療薬の発見を目指す。 |
申請課題名 | 現実世界の逐次的環境変化に適応するマルチモーダル自然言語理解モデル |
利用課題概要 | 大規模言語モデルは、静的(static)な知識が必要になる既存のベンチマークタスクにおいて成果をあげている一方、現実世界のように動的 (dynamic)に絶えず変化する文脈情報が重要なタスクには適応できていない。本研究では、現実世界のように文脈が常に変化する環境において、言語情報だけでなく、視覚 (動画)を統合的に学習するマルチモーダルモデル、具体的にはVision encoderとLLMにAdapterを追加したvision and language modelを用いて最適なモデル構成を探る。 |
申請課題名 | 地理空間データ解析のための大規模マルチモーダルモデルの研究開発 |
利用課題概要 | 地球観測システムの急速な発展に伴い、大量の地理空間データ(リモートセンシング画像、地点情報、地域気候帯、土壌タイプなど)が日々取得されている。このような異種データから有用な意味知識を効果的に抽出・構成するためには、国連が掲げる持続可能な開発とデジタルシティの目標に合致した、環境モニタリングと都市管理を協調的に行うための大規模なマルチモーダルモデルを開発する必要がある。我々は、日本全国を出発点として、スーパーコンピューティング資源を活用し、サブメータの土地被覆マッピング、都市計画指導、農業管理を自動的に実現する大規模マルチモーダルモデルを開発する。 |
申請課題名 | オープンソースかつ日本語に強い大規模言語モデルの構築 |
利用課題概要 | 公開されている英語中心のコーパスで学習済みの大規模言語モデルをベースに、日本語コーパスに加え、日英対訳データ、プログラミングコード、数学問題テキスト、技術文書などのデータを用いて継続事前学習を行い、日本語に強い大規模言語モデルを構築すると同時に前述各データが大規模言語モデルの性能に与える影響について分析する。また、構築した大規模言語モデルについて、質問応答タスク、翻訳タスク、文章読解タスクを含む多数のタスクにおける精度を分析することで、推論能力、知識、言語能力など様々な観点から性能評価を行う。 |
申請課題名 | |
利用課題概要 |
申請課題名 | |
利用課題概要 |
申請課題名 | 効率的な感染症制御に資するバイオインフォマティクス研究 |
利用課題概要 | COVID-19パンデミックを皮切りに、ウイルス感染症研究はビッグデータの時代に突入した。感染症研究を実施するにあたり要求される計算資源は増大している。現代の感染症研究は、次世代シーケンサーから得られる大量のシーケンスデータ、SARS-CoV-2のゲノム疫学データ、航空機ネットワークの人流データといったビッグデータの活用が不可欠である。本研究ではより効率的な感染症制御法の確立に向けて、これらのビッグデータからウイルスの流行と進化パターンを抽出し、さらには予測するための手法の開発に取り組む。 |
申請課題名 | 深層学習に基づく小惑星上のボルダー検知技術の研究開発 |
利用課題概要 | 近年のサンプルリターンミッション「はやぶさ2」や「OSIRIS-Rex」などの接近画像から、小惑星の形成史の理解に役立つ岩塊の形状分布について比較研究が可能なデータセットが実現している。例えばBennuとRyuguでは、一見すると2つの天体は非常に共通点が多く、リターンサンプルでもCI的な特徴を共通して持つが、詳細にはボルダー形状やサイズ分布、方位の特性に違いが認められ、これは起源の違いや母天体形成中の不均質の違いを示唆する。このような議論には多数の小惑星画像から数万~数十万の岩塊の計測が求められ、人の目での数え上げは実質的に困難であることから、本研究ではInstance segmentationに基づく高効率、かつ高精度なボルダー検出手法の開発に取り組む。 |
申請課題名 | 直接数値解析による非相似伝熱制御の検討 |
利用課題概要 | ケルビンヘルムホルツ不安定波に起因する大規模渦を誘起することで,流動抵抗の増加を押さえつつ高い伝熱促進効果をもたらす非相似伝熱制御の検討を行う.本研究では,ケルビンヘルムホルツ不安定性に起因する大規模渦を誘起するために,主流方向に並ぶリブ列を用いる.数値解析手法には密度分布関数とエネルギ分布関数の2つの分布関数を解く格子ボルツマン法を用いる.リブ列の間隔を変えた複数のケースに対して,直接数値解析を実施することで,大規模渦の特性や,運動量・熱輸送の非相似的な挙動について議論を深める. |
申請課題名 | 無機有機ハイブリッド結晶の格子欠陥計算に関する研究 |
利用課題概要 | 無機有機ハイブリッド結晶の一種である多孔性金属錯体(MOF)は、金属イオンと配位子からなる錯体ユニットが連続的に結合することで、2次元や3次元の高次構造を形成する。均一な微細孔をもつことが特徴で、分離・貯蔵・吸着・変換など様々な機能を示す。MOFの結晶格子には、全無機化合物と同様に原子の配列乱れや欠陥の存在が示唆されているが、どのような構造の欠陥が存在するかや、格子欠陥が材料物性に及ぼす影響はよく分かっていない。そこで本課題は、ギ酸分子アニオンと三価金属イオンが三次元配列した化合物の欠陥構造をDFT計算を用いてモデル化し、実験データと組みあわせて欠陥構造や材料物性との関係を明らかにする。 |
申請課題名 | 深層学習を用いた文書画像解析手法の評価 |
利用課題概要 | 本プロジェクトでは文書画像処理の基盤技術の研究開発を行い、開発手法の評価を行う。具体的には、人間のように必要な情報を柔軟に学習する文書画像処理の実現を目指し、生成モデルを用いた人工学習データの構築手法について開発と評価を実施する。特に、本研究課題では、テキスト領域をターゲットとするマスク画像のモデリングを活用した事前学習手法を開発し評価する。また、テキスト領域に特化したマスク生成器を持つ階層エンコーダ・デコーダアーキテクチャを利用し、マスクされた画素値の再構成することも検討する。様々なベンチマークにおいて開発手法の有効性を検証する。 |
申請課題名 | 多言語マルチモーダル大規模言語モデルに関する研究 |
利用課題概要 | 画像やテキストを統合的に利活用するマルチモーダルな大規模多言語言語モデルに関する研究を行います。特に画像やテキストの意味理解と生成に焦点を当て、どのような画像やテキストが人間に好まれるのか、という評価の研究に取り組みます。また、日本語や英語、中国語など様々な自然言語およびプログラミング言語を含む人工言語を用いて事前学習・指示チューニングされた大規模言語モデルがどのような特性を持つのかについても分析を行います。 |
申請課題名 | 計算資源が限られた状況下における Low-Rank Adapter Fine-Tuning に関する研究 |
利用課題概要 | 言語モデルは大規模化によって飛躍的な性能の向上を実現した一方で,学習・推論時に求められる計算コストの肥大化が課題となっている.これに対処するために,低い計算コストで言語モデルの微調整が可能な Low-Rank Adapter Fine-Tuning(LoRA-FT)と,モデルのパラメータをより少ないビット数で表現することで軽量化を図る量子化を組み合わせた技術が存在する.本課題では学習時と推論時で求められる計算資源に差異がある状況を想定し,いくつかのケースにおける量子化と LoRA-FT の効果的な適用方法について検討する. |
申請課題名 | MDシミュレーションを用いた医薬品等の分子設計 |
利用課題概要 | 本研究では、MDシミュレーションを用いて医薬品などの分子設計をおこなう。まず、量子化学計算によって得られた高精度の電子構造情報を基に力場を構築し、分子間相互作用を詳細に評価する。TSUBAMEの大規模計算資源を活用し、多様な分子系に対する物性予測や最適化を行い、新規医薬品創製につながる設計指針を確立することを目的とする。研究成果は効率的な医薬品開発の効率化や副作用リスク低減にも寄与すると期待される。 |
利用課題概要(産業)
申請課題名 | 日本語特化の音声生成モデル |
利用課題概要 | AI分野では、テキストや画像などの情報を高い質で生成することができる生成AIが分野を席巻している。生成AIの成功に共通して見られるアプローチは、大量の計算資源を活用して、膨大な量のデータを、End-to-End (入力から出力までの学習と推論を一つのモデルで行う)のAIモデルに学習させる事によって、幅広いタスクやドメインに活用できる汎用性を習得させる事である。当社が注力する音声の分野では、このような生成AI的なアプローチがまだ黎明期の段階にある。当社では、End-to-Endモデルに裏付けされた、音声生成や音声タスクで高い汎用性を持つ音声基盤モデルの開発に取り組んでいる。当社では、初期のステップとして、人間らしい自然な発話を、ユーザーが指定したPromptに基づいて生成する事のできる音声生成モデルの開発を行っている。これはユーザー指定のテキストや音声などの入力に応じ、モデルが発話のスタイル・内容などを柔軟に変えて出力できるEnd-to-Endなモデルである。当社での初期開発は、英語のドメインでは既に一定の成果が出ており、日本語でも初期の開発が完了している (参照: Kotoba-1)。本課題では、弊社の音声生成モデルの開発を日本語に特化させ、更に加速させる。 |
申請課題名 | マルチモーダル基盤モデルとモデル間連携技術の研究開発 |
利用課題概要 | 現在、基盤モデルの研究開発は大規模言語モデルを中心に進んでいますが、他のデータ種類、たとえば画像や音声などのデータを扱う能力も、今後の社会実装において重要な役割を担うことが想定されます。そのため、これらのデータも高度に処理できるマルチモーダル基盤モデルを開発する手法を確立します。 この実現を目指し、既存の基盤モデルを活用し、それらを連携させることにより、効率的に新たな基盤モデルを構築する技術を確立することを目指します。 上記の成果をもとに、既存の大規模言語モデルを活用することで新たな基盤モデル(別の大規模言語モデルやマルチモーダル基盤モデル)の効率的な開発を目指します。 |
申請課題名 | GPUの産業分野の流体解析(車両空力、ファン騒音、建築物風荷重)への適応検討 |
利用課題概要 | 各産業分野で精度向上と解析時間が課題となっている大規模非定常流体計算(自動車の車両空力、ファン騒音、建築物風荷重計算)に対して、GPUを適応することで精度向上と解析時間の短縮が図れるかを検討する。 |
申請課題名 | 深層強化学習を用いた超人間級AI運転技術の研究 |
利用課題概要 | 本課題では、画像を扱えるように拡張された大規模言語モデルである「視覚言語モデル(VLM)」の学習と運転ドメインへの適合を行う。具体的には、事前学習済みの大規模言語モデルと画像エンコーダを「アダプター」で繋いだVLMを、画像-日本語テキストペアのデータセットおよびテキストを付与した走行データで学習し、質の良い視覚言語モデルの構築と運転タスクへの適合を目指す。 代表的なVLMとして、 LLaVAやIdefics-2などの高性能な大規模視覚言語モデルは、アダプターに加えてLLMや画像エンコーダ自体も学習の対象としてファインチューニングしている。しかしながら、国内で学習・公開されているVLMの構築においては、言語モデルと画像エンコーダを繋ぐアダプターのみを学習対象にした学習方法が広く採用されている。そのため、大規模言語モデルや画像エンコーダの学習が不十分で、性能を引き出せていない可能性がある。 そこで本課題では、LLMを含む全パラメータを学習対象にしたファインチューニングを複数の条件で実施することにより、運転ドメインに特化した大規模VLMの学習方法論の確立を目指す。 |
申請課題名 | プラントによる気象変化究明 |
利用課題概要 | 東工大、JAMSTEC及び早稲田大が中心となって開発を続けるマルチスケール気象モデルを用いた高解像度気象シミュレーションを行うことで、プラントが局所の気象および気候に与える影響を解明する。持続可能な社会の実現に向けて、気候変動への対応は世界的な課題となっている。日揮グループはマテリアリティとして「環境調和型社会」を掲げ、事業活動を通じ気候変動への対応を図るとともに、気候関連財務情報開示タスクフォース(TCFD)による提言のシナリオ分析などを踏まえて事業戦略を検討・策定し、実行している。プラントや工場を運用するにあたって、天候などの自然現象からの影響を受けることは避けて通れない。プラントによる気象変化のメカニズムを究明し、メカニズムに基づいた影響低減策の策定を目指している。 |
申請課題名 | クモ胚に基づく発生-進化の数理解析 |
利用課題概要 | 節足動物では多様な種が進化してきた。本研究課題では、節足動物の進化・多様化の過程を理解するために、クモ胚に基づいて独自に構築した多細胞体数理モデルを用いて、「節足動物らしさ」の基盤となる体軸と反復パターンを生む発生過程と進化過程のシミュレーション解析を行う。多細胞体モデルでは、細胞力学に基づいて細胞が振る舞い、遺伝子ネットワークの作用で細胞場にパターンが生じる。各世代の多数個体の遺伝子ネットワークに変異を与え、表現型としての形態とパターンに基づいて各個体の次世代への生き残りが決まる。シミュレーション解析に加え、ゲノムに基づくインフォマティクス解析も合わせて、発生と進化の関係を探究する。 |
申請課題名 | 自動運転AIの研究開発 |
利用課題概要 | 車載AIプロセッサは電力・演算性能が限られることから軽量なDNNモデルが求められる.一方で,近年の高精度なAIはモデルサイズが拡大し演算量が増加する傾向にあるが,半導体プロセスの微細化による低電力化は限界に近づきつつある.そこで,低ビット化(少ないビット数で値を表現すること)やスパース化(要素の多くを0すること)など,H/WとS/Wの協調設計により演算コストを低減するアプローチが着目されてきている.本プロジェクトでは、高度な車載AIを実現するため極低ビット(2bit/1bit)への量子化技術,重みのスパース化や行列分解による積和演算回数の削減技術、特徴MAP技術を使った入力依存重み合成による精度向上技術など、DNN圧縮のための要素技術や、それらを組み合わせる際のレイヤ毎の最適なハイパーパラメタを探索する技術など、低演算量かつ高精度な車載AIを実現するためのモデル圧縮技術について検討する. |
申請課題名 | EEGを用いた発話解読AIの開発 |
利用課題概要 | 本課題は、大規模脳・生体データから、言語を解読するBrain Machine Interface (speech BMI) の研究開発を行う。speech BMIは意思疎通に困難のある方々の支援技術として開発が進んでいる。これまで手術による電極埋設が必要な侵襲脳計測による開発が進められており、90%を超える発話解読精度の達成が報告されている。しかし侵襲計測は負担が高く、ユーザーが限定される。普及に向けて脳波などの負担が少ない非侵襲脳計測によるspeech BMIが期待されているが、実用に足る精度が出ないことが知られている。一方、深層学習モデルはデータ量とともに精度が向上する傾向があるが、脳波を用いたspeech BMI開発はほとんどが小規模のデータセットを用いており、大規模データでの精度向上については未解明である。これに対して本研究は、これまで蓄積してきた発話中脳波の大規模データを用いて、発話解読のデータに対するスケーリング則の存在を検証しつつ、高精度speech BMIに必要なデータ量の推定を行うことで、非侵襲speech BMIの実現可能性を探索する。 |
申請課題名 | 特定領域に対する特化型日本語LLMの研究 |
利用課題概要 | 近年、大規模言語モデル (Large Language Model, LLM) を特定領域に対して継続事前学習 (continual pre-training) することにより、当該領域に適応したLLMが学習可能であることが示されている。また、領域適応されたLLMを当該領域に関する下流タスクへ教師ありFine-tuningすることにより、下流タスクにおいて高い精度が得られることが知られている。しかし、LLMの領域適応を成功させるために必要な要素 (データ量/品質/ドメイン/モデルサイズ等) について、詳細な分析は行われていない。本課題では、これら複数の要素を制御した上でLLMを特定領域に対して継続事前学習し、その下流タスクの精度を比較する。実験/分析を通して領域適応成功の鍵となる要素を調査する。 |
申請課題名 | 深層学習を用いたリアルタイムAI音声合成プラットフォームの技術開発 |
利用課題概要 | 日本語で収録した音声を英語や中国語などの多言語のAI音声に翻訳するための大規模な機械学習モデルを構築する。また短時間の収録によりリアルタイムで10000種類以上の個人の声や有名人の声で話せるようになるAI音声プラットフォームの開発も行う。そして、既存の合成音声やボイスチェンジャーにありがちなロボット感をできる限り感じさせない設AI音声が自然で独特なサウンドを維持できるような音声変換ソフトを開発する。またAPI連携や既存音源からのAI音声作成を行うことでテレビのナレーションや対話型のAIサービスの提供を通じて法人へも活用の幅を広げる。 |
申請課題名 | 基盤モデルの進化的構築技術の確立 |
利用課題概要 | 大規模言語モデル(LLM)に代表される基盤モデルは、今や多様な分野で活用され始め、工学の問題解決の方法論を一変させるパラダイムシフトをもたらしている。しかしながら、優れた基盤モデルを構築するための系統的な方法論はいまだになく、研究開発者の経験や試行錯誤、暗黙知に頼らざるを得ない部分が大きい。このボトルネックを解消するために、本課題では進化計算を代表とする進化的手法を基盤モデル構築に応用することで、基盤モデルを効率的かつ効果的に自動構築する方法論の確立を目指す。また、得られた知見を公開することで、本分野の発展に貢献する。 |
申請課題名 | LLMエージェントの研究開発 |
利用課題概要 | 本課題の目的は、大規模言語モデルを用いた自律エージェント(LLMエージェント)を開発することである。LLMが持つ自然言語処理能力を活かして、様々なタスクを自律的に遂行できることを目指す。具体的には、既存の学習済みLLMの性能評価と選定を行い、選定モデルを基に学習を行うことでエージェントのタスク適応力の強化を図る。また、エージェントが異なる環境においても一貫した性能を発揮できるよう、トレーニングデータやテストシナリオを多様化することにも取り組む。最終的には、LLMエージェントが高い汎用性を持ち、実世界と同等な環境でも高い精度と信頼性を発揮することを目標としている。 |
申請課題名 | IT創薬向け並列計算化学シミュレーション手法の開発 |
利用課題概要 | 東工大発ベンチャー第92号のアヘッド・バイオコンピューティング株式会社は、高度な情報工学技術に基づく創薬及び生命科学研究の支援を事業の核としており、東工大からの技術移転等により先端的な技術開発を進めている。なかでも特に、低分子創薬のための分子設計、環状ペプチド創薬のためのペプチド物性予測シミュレーション等の技術に優位性を持つ。本利用課題では、H100GPUを活用した新たな分子設計・シミュレーション技術の研究開発を行う。具体的には、分子動力学法に基づく自由エネルギー摂動法(FEP)計算と環状ペプチド膜透過レプリカ交換シミュレーションに関する技術を開発する。 |
申請課題名 | 有機高分子材料の量子化学的研究 |
利用課題概要 | 2022年に我々が提案した、ビニルモノマーのラジカル共重合反応の反応性比を予測できる固有Q-eスキームは、1947年にAlfrey-Priceが提案して以来長年使用されてきたQ-eスキームを初めて改良することに成功した理論であり、高い反応性比予測精度と、ポリマーラジカルとモノマーのQ-e値を個別に計算できることが特徴である。本課題では、Q-e値の予測を目指したDFT計算を試み、得られた結果を記述子とした機械学習についても検討する予定である。これにより、目的の共重合体を構成するモノマー設計が可能になる。また、DFT計算を行う上で、汎関数と基底関数の選択は計算結果を支配するため重要であることから、ポリシランのらせん構造に対してベンチマーク計算を行う予定である。 |