2024年2月9日
立教大学大学院、新しい画像認識手法がAI世界最高峰の国際会議「AAAI-24」に採択
立教大学は6日、立教大学大学院人工知能科学研究科の博士後期課程2年次の立浪祐貴氏(AnyTech勤務)と瀧雅人准教授がフーリエ変換を使った新しい画像認識手法を開発し、この研究成果が人工知能分野の国際会議の一つである「AAAI-24」(The 38th Annual AAAI Conference on Artificial Intelligence)に採択されたことを発表した。
「AAAI Conference on Artificial Intelligence」はアメリカ人工知能学会が主催する人工知能分野の世界トップレベルの国際会議。今年は査読された9862件の論文の中から、2342件(全体の23.75%)の論文が採択されている。
深層学習において、注意機構は長距離の依存関係を学習するのに適している技術。注意機構は、モデルが広範な範囲から重要な情報に焦点を当て、その情報に適切に注目することを可能にする。コンピュータビジョンにおいては、モデルが画像内の関連性が高い領域に注目することで、モデルが物体やパターンをより正確に認識できるようになると考えられている。
ところが注意機構は大量のメモリを必要とする問題を孕んでいる。注意機構では、入力するすべての要素に対して個別の重み付けを計算し、その結果をメモリ内に保持する。この仕組みが、特に高解像度画像を扱うコンピュータビジョンモデルにおいては深刻な問題を引き起こす。画像の解像度が増えると、入力する要素の数が大きくなるため、膨大なメモリが必要となり、計算時間も急激に増えてしまう。したがって、モデルが高解像度の画像を扱う場合、物理的リソースの制約から高価なハードウエアが必要となり、経済的負担を生む可能性がある。
近年、この問題を回避できる手法として、注意機構に代わる高速フーリエ変換ベースの仕組みであるグローバルフィルタが提案されている。グローバルフィルタは注意機構と同様に長距離の空間依存性を学習することができる。この手法は、高速フーリエ変換、周波数領域における要素ごとの掛け算、逆高速フーリエ変換で構成されている。シンプルなこの手法は注意機構とは異なり、解像度が増えても大量のメモリを必要とすることもなく、計算量も穏やかに増加するのみ。しかし、グローバルフィルタは最先端の性能を達成しているとは言い難い現状があった。
本研究では、グローバルフィルタと注意機構の隔たりに注目し、その隔たりを埋めた動的フィルタを提案しました。グローバルフィルタはデータとパラメータを掛け合わせるため、データに依存しない演算です。対照的に、注意機構は個別の重み付けを計算するため、データに依存する演算です。このように、グローバルフィルタと注意機構にはデータに依存するか否かの差分があります。
そこで、データに掛け合わせるフィルタを動的に生成する仕組み「動的フィルタ」を導入した。動的フィルタは、データに応じて重みを計算し、その重みと少数の基底フィルタから、データに応じたフィルタを生成する。このような方法を採用することで、グローバルフィルタの利点を享受したまま、注意機構のようなデータ依存性を実現できる。
次に、提案手法の動的フィルタを取り入れたDFFormerと、動的フィルタと畳み込みニューラルネットを併用したCDFFormerという新たな画像認識モデルを提案した。グローバルフィルタと注意機構の間には、そのものの差だけでなく、それらを採用しているよりマクロなアーキテクチャの間にも差があった。この差を埋めるために、最先端の精度を達成したアーキテクチャの上に動的フィルタを搭載し、フェアな比較の下で動的フィルタの有用性を確認した。
これらのモデルは注意機構を利用しない先端的な画像認識モデルに対して、競争的な精度を達成している。そして注意機構を使用する最先端のモデルに対しては、従来よりも精度が近づいており、先述の注意機構に関する問題を克服している。つまり高解像度の画像認識において、グローバルフィルタと同様に、提案手法は相対的に少ないメモリ消費や計算時間で済むという特長を有している。
論文概要
論文タイトル:FFT-based Dynamic Token Mixer for Vision
著者:Yuki Tatsunami, Masato Taki
関連URL
最新ニュース
- 2025年度(令和7年度)大学入学共通テスト 問題・回答速報・解説サイト情報サイト情報(ベネッセ/駿台・東進・河合塾・朝日新聞・中日進学ナビ)(2025年1月11日)
- 教育ネット、徳島県立全学校に「おたすけ学校AI」を実証導入(2025年1月10日)
- コドモン、岩手県奥州市の保育所7施設にICTサービス「CoDMON」導入(2025年1月10日)
- 約4割の学生が「5社以上」のインターンシップなどに参加 =学情調べ=(2025年1月10日)
- タイパ・コスパの高い「オンライン学習塾」が共働き家庭の支えに =オンライン指導塾そら塾調べ=(2025年1月10日)
- 受験は親にとっても大きな挑戦、受験生の負担を気遣う親が行う「見えない応援」とは =ジョンソン調べ=(2025年1月10日)
- リスキリング支援サービス「Reskilling Camp」、企業におけるリスキリング施策の実態調査(2025年1月10日)
- 社会構想大学院大学、「教育CIO養成課程」を2月に開講 ICTを活用した教育改革のリーダーを育成(2025年1月10日)
- アイディア高等学院、「個性に合わせた能力向上」をめざした教育を開始(2025年1月10日)
- 三信電気、日建学院の出席確認システムに顔認証の仕組みを導入(2025年1月10日)