cs.CV」カテゴリーアーカイブ

A Multi-Sensor Fusion Approach for Rapid Orthoimage Generation in Large-Scale UAV Mapping

要約 無人航空機(UAV)からの大規模なオルソイメージの急速な生成は、航空マッピ … 続きを読む

カテゴリー: cs.CV, cs.RO, eess.IV | コメントする

TS-CGNet: Temporal-Spatial Fusion Meets Centerline-Guided Diffusion for BEV Mapping

要約 バードアイビュー(BEV)知覚テクノロジーは、環境認識、ナビゲーション、意 … 続きを読む

カテゴリー: cs.CV, cs.RO, eess.IV | コメントする

Unveiling the Potential of Segment Anything Model 2 for RGB-Thermal Semantic Segmentation with Language Guidance

要約 ロボットシステムの認識能力は、データセットの豊富さに依存しています。 大規 … 続きを読む

カテゴリー: cs.CV, cs.RO, eess.IV | コメントする

StageDesigner: Artistic Stage Generation for Scenography via Theater Scripts

要約 この作業では、レイアウト制御拡散モデルと組み合わせた大規模な言語モデルを使 … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする

Seeing is Understanding: Unlocking Causal Attention into Modality-Mutual Attention for Multimodal LLMs

要約 最近のマルチモーダル大手言語モデル(MLLMS)は、マルチモーダルの問い合 … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする

Resource-Efficient Affordance Grounding with Complementary Depth and Semantic Prompts

要約 アフォーダンスとは、エージェントが環境から認識し、利用する機能特性を指し、 … 続きを読む

カテゴリー: cs.CV, cs.RO, eess.IV | コメントする

ARC-Flow : Articulated, Resolution-Agnostic, Correspondence-Free Matching and Interpolation of 3D Shapes Under Flow Fields

要約 この作業は、2つの3Dの明確な形状とそれらの間の密な対応の自動推定の間の物 … 続きを読む

カテゴリー: cs.CV | コメントする

Smoothing the Shift: Towards Stable Test-Time Adaptation under Complex Multimodal Noises

要約 テスト時間適応(TTA)は、ソースデータにアクセスせずに、無ー化されたテス … 続きを読む

カテゴリー: cs.CV, cs.LG | コメントする

ZAPBench: A Benchmark for Whole-Brain Activity Prediction in Zebrafish

要約 データ駆動型のベンチマークは、気象や構造生物学を含む主要な科学モデリングド … 続きを読む

カテゴリー: cs.CV, cs.LG, q-bio.NC | コメントする

XFMamba: Cross-Fusion Mamba for Multi-View Medical Image Classification

要約 シングルビューの医療画像分類と比較して、複数のビューを使用すると、ビュー間 … 続きを読む

カテゴリー: cs.CV | コメントする