科学技術機械学習幾何学的深層学習その他のテーマ

その他のテーマ

深層学習の構造や学習法に対して,適切な制約や補助を与える研究をさまざまに実施しています.

深層生成モデルは,データ間の因果関係や依存関係をベイジアンネットワークというグラフ形式で表し,その関係を深層学習で実装したものです. 出力結果の根拠の可視化,意思決定の信頼性(不確実性)の定量化,小規模データの効率的な解析などが可能になります. また生成AIの基盤技術の一部でもあります.

その他のテーマ

深層生成モデル

脳機能画像解析による医療診断のための深層生成モデル

脳機能画像は問診による精神疾患診断を補佐し,客観的・定量的基準を与えると期待されます. しかし,データ収集には莫大なコストがかかり,通常の深層学習に必要な程度のデータセットはほとんど存在しません. さらに,年齢や性別といった個人差は病気に関連する活動パターンより顕著であり,適切な処理を行わなければ,男女で発症率の異なる疾患の特徴と身体的な性差を混同するなどの問題が生じます. また病院ごとの撮影機材の差も大きな混乱を招きます. そこで深層生成モデルを用いてベイジアンネットワークを構成し,精神疾患に関連する活動パターンと,年齢・性別などの個人差や機材差とを同時にモデル化します. 疾患や個人差は変化しないため,どの要因がどの情報を生むかを自動で学習し,精神疾患と個人差・環境差を高精度に区別できるようになります. これによって,複数の小規模データを集めて大規模データのように解析することが可能になり,性別・年齢に対して堅牢な高い精度での疾患の診断や,原因部位の可視化が可能になります.

  • Takashi Matsubara, Koki Kusano, Tetsuo Tashiro, Ken'ya Ukai, and Kuniaki Uehara, "Deep Generative Model of Individual Variability in fMRI Images of Psychiatric Patients," IEEE Transactions on Biomedical Engineering, vol. 68, no. 2, pp. 592-605, 2021.
    IEEE
  • Koki Kusano, Tetsuo Tashiro, Takashi Matsubara, and Kuniaki Uehara, "Deep Generative State-Space Modeling of FMRI Images for Psychiatric Disorder Diagnosis," The 2019 International Joint Conference on Neural Networks (IJCNN2019), Budapest, Jul. 2019.
    Paper Slide
  • Takashi Matsubara, Tetsuo Tashiro, and Kuniaki Uehara, "Deep Neural Generative Model of Functional MRI Images for Psychiatric Disorder Diagnosis," IEEE Transactions on Biomedical Engineering, vol. 66, no. 10, pp. 2768-2779, 2019.
    IEEE arXiv
  • Takashi Matsubara, Tetsuo Tashiro, and Kuniaki Uehara, "Structured Deep Generative Model of FMRI Signals for Mental Disorder Diagnosis," The 21st International Conference on Medical Image Computing and Computer Assisted Intervention (MICCAI2018), Granada, Sep. 2018, pp. 258-266.
    Paper
  • Tetsuo Tashiro, Takashi Matsubara, and Kuniaki Uehara, "Deep Neural Generative Model for fMRI Image Based Diagnosis of Mental Disorder," The 2017 International Symposium on Nonlinear Theory and its Applications (NOLTA2017), Cancun, Dec. 2017, pp. 700-703, 5169.

言語情報の深層生成モデルを用いた株価動向推定

本研究では,深層生成モデルを用いてニュース記事から株価動向の日次予測を行う手法を提案する.複数ニュースそれぞれが持つ影響の大きさを考慮する.まずニュース記事が持つ情報を固定長のベクトルで表現するために,Paragraph Vectorと呼ばれる手法を用いる.これにより言語が持つ情報を十分に表現できる.次に株価情報と言語情報が持つ関係性を深層生成モデルで表現し,分散表現を基にパラメータを学習する.生成モデルを用いることにより,ニュース記事を生成する潜在変数や確率過程を表現でき,その表現に必要なパラメータの過学習を抑えることができる.実際に,日本市場とアメリカ市場の2市場を対象に,株価動向の2値分類を行い,本手法の有効性を示した.

  • Takashi Matsubara, Ryo Akita, and Kuniaki Uehara, "Stock Price Prediction by Deep Neural Generative Model of News Articles," IEICE Transactions on Information and Systems, Vol.E101-D, No.4, pp.901-908, 2018.
    J-STAGE Slide
  • Ryo Akita, Akira Yoshihara, Takashi Matsubara, and Kuniaki Uehara, "Deep Learning for Stock Prediction Using Numerical and Textual Information," the 15th IEEE/ACIS International Conference on Computer and Information Science (ICIS 2016), Okayama, Jun. 2016, pp. 945-950.
    IEEE

多様な仮想空間を構築するための画像モダリティ変換

深層学習の自動運転やロボット制御への応用研究が活発化しています. これらの実問題には膨大で多様な現データが必要ですが,夜間や雨天など多様な環境データを集めるには大きなコストがかかります. 環境シミュレータを構築してデータを得る方法もありますが,実環境との差が性能の劣化を招きかねず,高精度なシミュレータの開発にも大きなコストがかかります. そこで本研究では昼と夜など実データのモダリティを変換することで,学習データを水増しする方法を開発しました. 本研究は株式会社豊田中央研究所ト様との共同研究の一環として実施しました.

  • 益田慎太, 松原崇, 上原邦昭, "多様な仮想空間を構築するための画像モダリティ変換," 2018年度第32回人工知能学会全国大会(JSAI2018), 4M1-04, 鹿児島, 6月, 2018.
    Slide

不確実性定量化

グループデータ生成モデルを用いたFew-shot異常検知

「異常検出」は画像分析で重要なタスクで,不良品検査や医療画像診断などに応用されます. 深層生成モデルを用いることで,画像など高次元の実データの尤度を推定でき,異常品のような数少ないデータは尤度が低いので,それをもって異常検出を実現できます. しかし,新製品など学習データに含まれない正常品も当然尤度が低くなり,異常品として検出されます. そこで製品グループごとに固有の特徴と,個々の製品に固有の特徴に分離する深層生成モデルを提案し,既存製品で学習したモデルを活用して少数の新製品データの異常品を発見する「few-shot異常検出」を実現しました. 本研究は株式会社地球快適化インスティテュート様との共同研究の一環として実施しました.

  • Kazuki Sato, Satoshi Nakata, Takashi Matsubara, and Kuniaki Uehara, "Few-shot Anomaly Detection using Deep Generative Models for Grouped Data," IEICE Transactions on Information and Systems, vol.E105-D, no.2, pp.436-440, 2022.
    J-STAGE Slide

深層生成モデルによる非正則化異常度を用いた異常検知

一般的に異常検出は,大量のデータから頻度が低いものを「異常」とみなします. 深層生成モデルは画像などを圧縮・復元するため,典型的なデータを優先的に学習し,復元できなかったものを異常と見なすことで異常検出を実現します. しかし,復元の失敗には「経験的不確実性(学習不足によるもの)」と「偶然的不確実性(ノイズや形状の複雑さによるもの)」があり,後者が高い部分(例:ネジ穴など)は正常でも誤検出が起こります. そこで,深層生成モデルの尤度を分解し,経験的不確実性に相当する項(非正則化異常度)のみを異常検出に使う手法を提案しました. これにより見た目の複雑さに惑わされずに異常を検知し,高精度化を実現しました. 本研究はアイシン・エィ・ダブリュ株式会社様との共同研究の一環として実施しました.

Qiitaに解説記事を書いてくださった方がいらっしゃいました.ありがとうございます.

  • Takashi Matsubara, Kazuki Sato, Kenta Hama, Ryosuke Tachibana, and Kuniaki Uehara, "Deep Generative Model using Unregularized Score for Anomaly Detection with Heterogeneous Complexity," IEEE Transactions on Cybernetics, vol. 52, no. 6, pp. 5161-5173, 2022.
    arXiv IEEE
  • Takashi Matsubara, Ryosuke Tachibana, and Kuniaki Uehara, "Anomaly Machine Component Detection by Deep Generative Model with Unregularized Score," The 2018 International Joint Conference on Neural Networks (IJCNN2018), Rio de Janeiro, Jul. 2018, pp.4067-4074.
    IEEE

ベイズ的深層学習を用いた画像テキスト検索における信頼性評価

機械学習アルゴリズムで出力結果の信頼性をいかにして評価するかは大きな課題です. 分類問題・回帰問題においては,ベイジアンニューラルネットワークの出力の不確実性によって信頼性を評価する方法が提案されていますが,そのままでは画像テキスト検索には使えません. 本研究では画像テキスト検索を分類問題としての解釈(事後分布の不確実性),回帰問題としての解釈(埋め込み点の不確実性)により二つの不確実性を定義しました. その結果,分類問題としての解釈の方がより適切に信頼性を評価できていることを確認しました.

  • Kenta Hama, Takashi Matsubara, Kuniaki Uehara, and Jianfei Cai, "Exploring Uncertainty Measures for Image-Caption Embedding-and-Retrieval Task," ACM Transactions on Multimedia Computing, Communications, and Applications , vol. 17, no. 2, article no. 46, 2021.
    arXiv
  • Kenta Hama, Takashi Matsubara, and Kuniaki Uehara, "Image-Caption Retrieval with Evaluating Uncertainties," The 7th Japan-Korea Joint Workshop on Complex Communication Sciences (JKCCS), Pyengonchang, Jan. 2019.

ハイパーネットによる畳み込みニューラルネットワークの暗黙的事後分布推定

ニューラルネットワークは複雑な表現を学習することができ,様々なタスクで高い性能を示している.しかし,学習に利用できるデータは限られているため,過学習を起こしやすい.過学習を防ぐためにニューラルネットワークの学習を正則化することは,最も重要な課題の1つである.本研究では,大規模な畳み込みニューラルネットワークを対象とし,ハイパーネットを用いて,パラメータの事後分布を暗黙的に推定することで学習を正則化する.また,パラメータの分布が学習されることから,モデル平均化により識別精度を向上させることができる.

  • Kenya Ukai, Takashi Matsubara, and Kuniaki Uehara, "Bayesian Estimation and Model Averaging of Convolutional Neural Networks by Hypernetwork," Nonlinear Theory and Its Applications, IEICE, Vol.E10-N, No.1, 2019.
    J-STAGE Slide
  • Kenya Ukai, Takashi Matsubara, and Kuniaki Uehara, "Hypernetwork-based Implicit Posterior Estimation and Model Averaging of Convolutional Neural Networks," The 10th Asian Conference on Machine Learning (ACML2018), Beijing, Nov. 2018, pp. 176-191.
    Paper

注意機構を持った深層ニューラルネットワークの勾配探索

ニューラルネットワークのアーキテクチャ設計には専門知識と多大な労力が必要です. しかし,ニューラルアーキテクチャ探索(NAS)の発展により,画像分類タスクで効率よく高精度アーキテクチャを得ることが可能となりました. 画像分類には一般的に畳み込みニューラルネットワーク(CNN)が使われ,主要な演算は畳み込みとpoolingです. 従来のNAS手法ではこれらの演算のみを選択肢としていましたが,最近ではCNNに注意機構を追加することで,表現力を高めながら精度向上とパラメータ数の増加を抑えることができます. そこでこの研究では,注意機構を組み込んだCNNの設計方法を提案しました.

  • Kohei Nakai, Takashi Matsubara, and Kuniaki Uehara, "Neural Architecture Search for Convolutional Neural Networks with Attention," IEICE Transactions on Information and Systems, vol. E104.D, no. 2, 2021. J-STAGE
  • Kohei Nakai, Takashi Matsubara, and Kuniaki Uehara, "Att-DARTS: Differentiable Neural Architecture Search for Attention," The 2020 International Joint Conference on Neural Networks (IJCNN2020), Glasgow (Online), Jul. 2020.
    Slide Code

その他

ランダムな画像切り抜きと貼り付けを用いたデータ拡張

膨大なパラメータを持つ深層畳み込みニューラルネットワーク(CNN)が,画像処理の分野において大きな成果をあげています. しかし,学習データに対して膨大すぎるパラメータを持つ深層CNNは,常に過学習を起こすリスクがあります. この問題を解決するために,学習データの擬似的な水増しを行う,data augmentationの手法が広く提案されてきました. 特に画像反転,くり抜き,拡大縮小や色彩情報の変換などのdata augmentationは,深層CNNの高性能化に貢献しています. 本研究では,これらをさらに発展させ,4枚の異なる画像をそれぞれランダムにくり抜き,それらを貼り合わせて新たな学習画像を構成するdata augmentationの手法を提案し,画像処理の更なる高精度化を実現しました.

Qiitaにて紹介や検証の記事を書いていただいています.

  • Ryo Takahashi, Takashi Matsubara, and Kuniaki Uehara, "Data Augmentation using Random Image Cropping and Patching for Deep CNNs," IEEE Transactions on Circuits and Systems for Video Technology, vol. 30, no. 9, pp. 2917-2931, 2020.
    IEEE arXiv
  • Ryo Takahashi, Takashi Matsubara, and Kuniaki Uehara, "RICAP: Random Image Cropping and Patching Data Augmentation for Deep CNNs," The 10th Asian Conference on Machine Learning (ACML2018), Beijing, Nov. 2018, pp. 786-798. (acceptance rate 57/230=0.248)
    Paper Slide Code

強化学習と模倣学習の融合による人間らしいエージェント

強化学習エージェントは,囲碁や自動運転,テレビゲームなど様々な課題を解決する能力があります. 強化学習は報酬を最大化するようにエージェントを訓練する方法であるが,実用化を考えると性能以外の要素も考慮する必要があります. 例えば,あまりに強すぎるエージェントは,テレビゲームではプレイヤーの楽しみを奪いますし,自動運転では過度な加減速によってユーザに不安を与える恐れがあります. そのため,人間らしいエージェントの設計が求められます. 模倣学習は人間エキスパートの方策を学習し人間らしい行動が期待できますが,エキスパートを超える性能は出ません. 本研究では強化学習と模倣学習を融合し,両者の長所を活かしたモデルを提案しました. 提案したモデルは,Atariゲームや運転シミュレータTorcsに適用して実験を行い,性能評価および感性試験を実施した結果,模倣学習エージェントを上回る性能と人間らしい振る舞いを示しました. 本研究は株式会社エクォス・リサーチ様との共同研究の一環として実施しました.

  • Rousslan Fernand Julien Dossa, Xinyu Lian, Hirokazu Nomoto, Takashi Matsubara, and Kuniaki Uehara, "Hybrid of Reinforcement and Imitation Learning for Human-Like Agents," IEICE Transactions on Information and Systems, vol. E103.D, no. 9, pp. 1960-1970, 2020.
    J-STAGE
  • Rousslan Fernand Julien Dossa, Xinyu Lian, Hirokazu Nomoto, Takashi Matsubara, and Kuniaki Uehara, "A Human-Like Agent Based on a Hybrid of Reinforcement and Imitation Learning," The 2019 International Joint Conference on Neural Networks (IJCNN2019) , Budapest, Jul. 2019.
    IEEE Slide

くもろぐ~全天球画像のデータ収集と雲形と状態判定

海上気象観測は安全な航海に不可欠であり,日本では一般船舶にも観測結果を気象庁へ報告する義務があります. しかし,従来の気象測器では雲形(雲の種類)や雲量を判別できず,目視に頼らざるを得ません. 海外には雲形自動判断の研究がありますが,日本の気象環境や報告内容に完全には対応していない例も多く,日本向けのシステム開発が望まれています. そこで本研究では,全天球画像を撮影するデバイスを開発し,船舶に搭載して中規模データを収集し,雲の下層・中層・上層ごとに雲形と状態をラベリングしました. 深層畳み込みニューラルネットワークで学習した結果,雲形と状態のいずれも精度0.9を超えることを確認しました. 本研究はスカパーJSAT株式会社様,バニヤン・パートナーズ株式会社様,株式会社神戸デジタル・ラボ様,神戸大学 大学院海事科学研究科 大澤教授との共同研究のとして実施しました.

また本研究成果の一部はiOS及びAndroid用アプリ『くもろぐ』としてリリースしました App Store Google Playにてダウンロード可能. 神戸大学プレスリリースNHK WEB NEWS朝日新聞日刊工業新聞にも取り上げられました.

  • 森川優, 中西波瑠, 稲村直樹, 近藤伸明, 小渕浩希, 大澤輝夫, 松原崇, 申吉浩, 大島裕明, 上原邦昭, "船舶における全天球画像のデータ収集と雲形・状態・全雲量の自動判定の試み," 日本気象学会機関誌「天気」, vol. 70, no. 12, pp. 577-692, 2023.
  • 稲村直樹, 藤原宏太, 天方貴久, 釣文男, 中西波瑠, 小渕浩希, 大澤輝夫, 松原崇, 上原邦昭, "全天球画像と日射量データによる太陽光発電量予測," 2020年度 第34回人工知能学会全国大会(JSAI2020), 熊本, 6月, 2020.
  • 森川 優, 中西 波瑠, 稲村 直樹, 近藤 伸明, 小渕 浩希, 大澤 輝夫, 松原 崇, 上原 邦昭, "全天球画像のデータ収集と雲形と状態判定," 2018年度 第32回人工知能学会全国大会(JSAI2018), 2A4-01, 鹿児島, 6月, 2018.