月別アーカイブ: 2025年1月

HSRMamba: Contextual Spatial-Spectral State Space Model for Single Hyperspectral Super-Resolution

要約 Mambaは、強力なグローバルモデリング機能と線形計算の複雑さにより、視覚 … 続きを読む

カテゴリー: cs.CV, eess.IV | HSRMamba: Contextual Spatial-Spectral State Space Model for Single Hyperspectral Super-Resolution はコメントを受け付けていません

CLEAR: Cue Learning using Evolution for Accurate Recognition Applied to Sustainability Data Extraction

要約 大規模な言語モデル(LLM)画像認識は、画像からデータを抽出するための強力 … 続きを読む

カテゴリー: 68T07, 68W50, cs.AI, cs.CV, cs.NE, G.1.6 | CLEAR: Cue Learning using Evolution for Accurate Recognition Applied to Sustainability Data Extraction はコメントを受け付けていません

Bayesian Neural Networks for One-to-Many Mapping in Image Enhancement

要約 低光および水中画像の強化などの画像強化タスクでは、劣化した画像は、照明の変 … 続きを読む

カテゴリー: cs.CV | Bayesian Neural Networks for One-to-Many Mapping in Image Enhancement はコメントを受け付けていません

Deconstruct Complexity (DeComplex): A Novel Perspective on Tackling Dense Action Detection

要約 高密度のアクション検出には、トリミングされていないビデオで複数の共起アクシ … 続きを読む

カテゴリー: cs.CV | Deconstruct Complexity (DeComplex): A Novel Perspective on Tackling Dense Action Detection はコメントを受け付けていません

Integrating Spatial and Frequency Information for Under-Display Camera Image Restoration

要約 アンダーディスプレイカメラ(UDC)には、ディスプレイパネルの下にデジタル … 続きを読む

カテゴリー: cs.CV | Integrating Spatial and Frequency Information for Under-Display Camera Image Restoration はコメントを受け付けていません

LLaRA: Supercharging Robot Learning Data for Vision-Language Policy

要約 ビジョン言語モデル(VLM)は最近、ロボットアクションを生成するために活用 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | LLaRA: Supercharging Robot Learning Data for Vision-Language Policy はコメントを受け付けていません

Temporal Preference Optimization for Long-Form Video Understanding

要約 ビデオの大規模なマルチモーダルモデル(ビデオLMMS)の大幅な進歩にもかか … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | Temporal Preference Optimization for Long-Form Video Understanding はコメントを受け付けていません

Rethinking Bottlenecks in Safety Fine-Tuning of Vision Language Models

要約 大規模なビジョン言語モデル(VLM)は、幅広いタスクで顕著なパフォーマンス … 続きを読む

カテゴリー: cs.CL, cs.CR, cs.CV | Rethinking Bottlenecks in Safety Fine-Tuning of Vision Language Models はコメントを受け付けていません

Mini-ResEmoteNet: Leveraging Knowledge Distillation for Human-Centered Design

要約 顔の感情認識は、ユーザーエクスペリエンスのドメイン、特に最新のユーザビリテ … 続きを読む

カテゴリー: cs.CV | Mini-ResEmoteNet: Leveraging Knowledge Distillation for Human-Centered Design はコメントを受け付けていません

Learning Priors of Human Motion With Vision Transformers

要約 人間がシナリオのどこに移動するか、通常のパスと速度、そして停止する場所を明 … 続きを読む

カテゴリー: cs.CV, cs.RO | Learning Priors of Human Motion With Vision Transformers はコメントを受け付けていません