cs.CV」カテゴリーアーカイブ

Streamline Without Sacrifice — Squeeze out Computation Redundancy in LMM

要約 大規模なマルチモーダルモデルはマルチモーダルタスクに優れていますが、視覚ト … 続きを読む

カテゴリー: cs.CV | Streamline Without Sacrifice — Squeeze out Computation Redundancy in LMM はコメントを受け付けていません

InstructSAM: A Training-Free Framework for Instruction-Oriented Remote Sensing Object Recognition

要約 リモートセンシング画像における言語誘導オブジェクト認識は、大規模なマッピン … 続きを読む

カテゴリー: cs.CV | InstructSAM: A Training-Free Framework for Instruction-Oriented Remote Sensing Object Recognition はコメントを受け付けていません

Sparc3D: Sparse Representation and Construction for High-Resolution 3D Shapes Modeling

要約 高忠実度の3Dオブジェクト合成は、メッシュデータの構造化されていない性質と … 続きを読む

カテゴリー: cs.CV | Sparc3D: Sparse Representation and Construction for High-Resolution 3D Shapes Modeling はコメントを受け付けていません

RoCoDA: Counterfactual Data Augmentation for Data-Efficient Robot Learning from Demonstrations

要約 ロボット工学の模倣学習は、ロボット環境の複雑さとデータ収集のコストが高いた … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | RoCoDA: Counterfactual Data Augmentation for Data-Efficient Robot Learning from Demonstrations はコメントを受け付けていません

4D-ROLLS: 4D Radar Occupancy Learning via LiDAR Supervision

要約 3Dシーンの包括的な理解は自動運転車(AVS)に不可欠であり、さまざまな知 … 続きを読む

カテゴリー: cs.CV, cs.RO | 4D-ROLLS: 4D Radar Occupancy Learning via LiDAR Supervision はコメントを受け付けていません

M3Depth: Wavelet-Enhanced Depth Estimation on Mars via Mutual Boosting of Dual-Modal Data

要約 深さの推定は、さらに火星探査ミッションの障害回避とナビゲーションに大きな潜 … 続きを読む

カテゴリー: cs.CV, cs.RO | M3Depth: Wavelet-Enhanced Depth Estimation on Mars via Mutual Boosting of Dual-Modal Data はコメントを受け付けていません

Does Acceleration Cause Hidden Instability in Vision Language Models? Uncovering Instance-Level Divergence Through a Large-Scale Empirical Study

要約 Vision-Language Models(VLMS)は、広範囲にわたる … 続きを読む

カテゴリー: cs.CL, cs.CV | Does Acceleration Cause Hidden Instability in Vision Language Models? Uncovering Instance-Level Divergence Through a Large-Scale Empirical Study はコメントを受け付けていません

IP-Prompter: Training-Free Theme-Specific Image Generation via Dynamic Visual Prompting

要約 私たちが成長するにつれて私たちを魅了する物語とキャラクターは、ユニークなフ … 続きを読む

カテゴリー: cs.CV | IP-Prompter: Training-Free Theme-Specific Image Generation via Dynamic Visual Prompting はコメントを受け付けていません

Generalized Few-shot 3D Point Cloud Segmentation with Vision-Language Model

要約 一般化された少数のショット3Dポイントクラウドセグメンテーション(GFS- … 続きを読む

カテゴリー: cs.CV | Generalized Few-shot 3D Point Cloud Segmentation with Vision-Language Model はコメントを受け付けていません

Online Iterative Self-Alignment for Radiology Report Generation

要約 Radiology Report Generation(RRG)は、放射線 … 続きを読む

カテゴリー: cs.AI, cs.CV | Online Iterative Self-Alignment for Radiology Report Generation はコメントを受け付けていません