「cs.CV」カテゴリーアーカイブ

Streamline Without Sacrifice — Squeeze out Computation Redundancy in LMM

投稿日: 2025年5月22日作成者: jarxiv

要約大規模なマルチモーダルモデルはマルチモーダルタスクに優れていますが、視覚ト … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

InstructSAM: A Training-Free Framework for Instruction-Oriented Remote Sensing Object Recognition

投稿日: 2025年5月22日作成者: jarxiv

要約リモートセンシング画像における言語誘導オブジェクト認識は、大規模なマッピン … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Sparc3D: Sparse Representation and Construction for High-Resolution 3D Shapes Modeling

投稿日: 2025年5月22日作成者: jarxiv

要約高忠実度の3Dオブジェクト合成は、メッシュデータの構造化されていない性質と … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

RoCoDA: Counterfactual Data Augmentation for Data-Efficient Robot Learning from Demonstrations

投稿日: 2025年5月21日作成者: jarxiv

要約ロボット工学の模倣学習は、ロボット環境の複雑さとデータ収集のコストが高いた … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

4D-ROLLS: 4D Radar Occupancy Learning via LiDAR Supervision

投稿日: 2025年5月21日作成者: jarxiv

要約 3Dシーンの包括的な理解は自動運転車（AVS）に不可欠であり、さまざまな知 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

M3Depth: Wavelet-Enhanced Depth Estimation on Mars via Mutual Boosting of Dual-Modal Data

投稿日: 2025年5月21日作成者: jarxiv

要約深さの推定は、さらに火星探査ミッションの障害回避とナビゲーションに大きな潜 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Does Acceleration Cause Hidden Instability in Vision Language Models? Uncovering Instance-Level Divergence Through a Large-Scale Empirical Study

投稿日: 2025年5月21日作成者: jarxiv

要約 Vision-Language Models（VLMS）は、広範囲にわたる … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

IP-Prompter: Training-Free Theme-Specific Image Generation via Dynamic Visual Prompting

投稿日: 2025年5月21日作成者: jarxiv

要約私たちが成長するにつれて私たちを魅了する物語とキャラクターは、ユニークなフ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Generalized Few-shot 3D Point Cloud Segmentation with Vision-Language Model

投稿日: 2025年5月21日作成者: jarxiv

要約一般化された少数のショット3Dポイントクラウドセグメンテーション（GFS- … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Online Iterative Self-Alignment for Radiology Report Generation

投稿日: 2025年5月21日作成者: jarxiv

要約 Radiology Report Generation（RRG）は、放射線 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

Streamline Without Sacrifice — Squeeze out Computation Redundancy in LMM

InstructSAM: A Training-Free Framework for Instruction-Oriented Remote Sensing Object Recognition

Sparc3D: Sparse Representation and Construction for High-Resolution 3D Shapes Modeling

RoCoDA: Counterfactual Data Augmentation for Data-Efficient Robot Learning from Demonstrations

4D-ROLLS: 4D Radar Occupancy Learning via LiDAR Supervision

M3Depth: Wavelet-Enhanced Depth Estimation on Mars via Mutual Boosting of Dual-Modal Data

Does Acceleration Cause Hidden Instability in Vision Language Models? Uncovering Instance-Level Divergence Through a Large-Scale Empirical Study

IP-Prompter: Training-Free Theme-Specific Image Generation via Dynamic Visual Prompting

Generalized Few-shot 3D Point Cloud Segmentation with Vision-Language Model

Online Iterative Self-Alignment for Radiology Report Generation

最近の投稿

最近のコメント

アーカイブ

カテゴリー