「cs.CV」カテゴリーアーカイブ

Near-infrared Image Deblurring and Event Denoising with Synergistic Neuromorphic Imaging

投稿日: 2025年3月6日作成者: jarxiv

要約夜間のダイナミックおよびその他の非常に暗い条件におけるイメージングの分野は … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

ArcPro: Architectural Programs for Structured 3D Abstraction of Sparse Points

投稿日: 2025年3月6日作成者: jarxiv

要約アーキテクチャプログラムに基づいて構築された新しい学習フレームワークである … 続きを読む →

カテゴリー: cs.CV, cs.GR, cs.LG | コメントを受け付けていません

Unified Video Action Model

投稿日: 2025年3月5日作成者: jarxiv

要約統一されたビデオとアクションモデルは、動画がアクション予測のための豊富なシ … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

OpenFly: A Versatile Toolchain and Large-scale Benchmark for Aerial Vision-Language Navigation

投稿日: 2025年3月5日作成者: jarxiv

要約 Vision-Language Navigation（VLN）は、言語の指 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

ROCKET-2: Steering Visuomotor Policy via Cross-View Goal Alignment

投稿日: 2025年3月5日作成者: jarxiv

要約私たちは、人間のユーザーが具体化された環境でエージェントの相互作用を導くた … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

A Multi-Sensor Fusion Approach for Rapid Orthoimage Generation in Large-Scale UAV Mapping

投稿日: 2025年3月5日作成者: jarxiv

要約無人航空機（UAV）からの大規模なオルソイメージの急速な生成は、航空マッピ … 続きを読む →

カテゴリー: cs.CV, cs.RO, eess.IV | コメントを受け付けていません

TS-CGNet: Temporal-Spatial Fusion Meets Centerline-Guided Diffusion for BEV Mapping

投稿日: 2025年3月5日作成者: jarxiv

要約バードアイビュー（BEV）知覚テクノロジーは、環境認識、ナビゲーション、意 … 続きを読む →

カテゴリー: cs.CV, cs.RO, eess.IV | コメントを受け付けていません

Unveiling the Potential of Segment Anything Model 2 for RGB-Thermal Semantic Segmentation with Language Guidance

投稿日: 2025年3月5日作成者: jarxiv

要約ロボットシステムの認識能力は、データセットの豊富さに依存しています。大規 … 続きを読む →

カテゴリー: cs.CV, cs.RO, eess.IV | コメントを受け付けていません

StageDesigner: Artistic Stage Generation for Scenography via Theater Scripts

投稿日: 2025年3月5日作成者: jarxiv

要約この作業では、レイアウト制御拡散モデルと組み合わせた大規模な言語モデルを使 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Seeing is Understanding: Unlocking Causal Attention into Modality-Mutual Attention for Multimodal LLMs

投稿日: 2025年3月5日作成者: jarxiv

要約最近のマルチモーダル大手言語モデル（MLLMS）は、マルチモーダルの問い合 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

Near-infrared Image Deblurring and Event Denoising with Synergistic Neuromorphic Imaging

ArcPro: Architectural Programs for Structured 3D Abstraction of Sparse Points

Unified Video Action Model

OpenFly: A Versatile Toolchain and Large-scale Benchmark for Aerial Vision-Language Navigation

ROCKET-2: Steering Visuomotor Policy via Cross-View Goal Alignment

A Multi-Sensor Fusion Approach for Rapid Orthoimage Generation in Large-Scale UAV Mapping

TS-CGNet: Temporal-Spatial Fusion Meets Centerline-Guided Diffusion for BEV Mapping

Unveiling the Potential of Segment Anything Model 2 for RGB-Thermal Semantic Segmentation with Language Guidance

StageDesigner: Artistic Stage Generation for Scenography via Theater Scripts

Seeing is Understanding: Unlocking Causal Attention into Modality-Mutual Attention for Multimodal LLMs

最近の投稿

最近のコメント

アーカイブ

カテゴリー