投稿者「jarxiv」のアーカイブ

Track-On: Transformer-based Online Point Tracking with Memory

投稿日: 2025年1月31日作成者: jarxiv

要約この論文では、外観、照明、視点、および閉塞の変化にもかかわらず、ビデオ内の … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Runway vs. Taxiway: Challenges in Automated Line Identification and Notation Approaches

投稿日: 2025年1月31日作成者: jarxiv

要約自律システムの複雑さの増加により、運用上の安全性を確保するために、滑走路と … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

HSRMamba: Contextual Spatial-Spectral State Space Model for Single Hyperspectral Super-Resolution

投稿日: 2025年1月31日作成者: jarxiv

要約 Mambaは、強力なグローバルモデリング機能と線形計算の複雑さにより、視覚 … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

CLEAR: Cue Learning using Evolution for Accurate Recognition Applied to Sustainability Data Extraction

投稿日: 2025年1月31日作成者: jarxiv

要約大規模な言語モデル（LLM）画像認識は、画像からデータを抽出するための強力 … 続きを読む →

カテゴリー: 68T07, 68W50, cs.AI, cs.CV, cs.NE, G.1.6 | コメントを受け付けていません

Bayesian Neural Networks for One-to-Many Mapping in Image Enhancement

投稿日: 2025年1月31日作成者: jarxiv

要約低光および水中画像の強化などの画像強化タスクでは、劣化した画像は、照明の変 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Deconstruct Complexity (DeComplex): A Novel Perspective on Tackling Dense Action Detection

投稿日: 2025年1月31日作成者: jarxiv

要約高密度のアクション検出には、トリミングされていないビデオで複数の共起アクシ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Integrating Spatial and Frequency Information for Under-Display Camera Image Restoration

投稿日: 2025年1月31日作成者: jarxiv

要約アンダーディスプレイカメラ（UDC）には、ディスプレイパネルの下にデジタル … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

LLaRA: Supercharging Robot Learning Data for Vision-Language Policy

投稿日: 2025年1月31日作成者: jarxiv

要約ビジョン言語モデル（VLM）は最近、ロボットアクションを生成するために活用 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

Temporal Preference Optimization for Long-Form Video Understanding

投稿日: 2025年1月31日作成者: jarxiv

要約ビデオの大規模なマルチモーダルモデル（ビデオLMMS）の大幅な進歩にもかか … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

Rethinking Bottlenecks in Safety Fine-Tuning of Vision Language Models

投稿日: 2025年1月31日作成者: jarxiv

要約大規模なビジョン言語モデル（VLM）は、幅広いタスクで顕著なパフォーマンス … 続きを読む →

カテゴリー: cs.CL, cs.CR, cs.CV | コメントを受け付けていません

投稿者「jarxiv」のアーカイブ

Track-On: Transformer-based Online Point Tracking with Memory

Runway vs. Taxiway: Challenges in Automated Line Identification and Notation Approaches

HSRMamba: Contextual Spatial-Spectral State Space Model for Single Hyperspectral Super-Resolution

CLEAR: Cue Learning using Evolution for Accurate Recognition Applied to Sustainability Data Extraction

Bayesian Neural Networks for One-to-Many Mapping in Image Enhancement

Deconstruct Complexity (DeComplex): A Novel Perspective on Tackling Dense Action Detection

Integrating Spatial and Frequency Information for Under-Display Camera Image Restoration

LLaRA: Supercharging Robot Learning Data for Vision-Language Policy

Temporal Preference Optimization for Long-Form Video Understanding

Rethinking Bottlenecks in Safety Fine-Tuning of Vision Language Models

最近の投稿

最近のコメント

アーカイブ

カテゴリー