-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Streamline Without Sacrifice — Squeeze out Computation Redundancy in LMM
要約 大規模なマルチモーダルモデルはマルチモーダルタスクに優れていますが、視覚ト … 続きを読む
カテゴリー: cs.CV
Streamline Without Sacrifice — Squeeze out Computation Redundancy in LMM はコメントを受け付けていません
InstructSAM: A Training-Free Framework for Instruction-Oriented Remote Sensing Object Recognition
要約 リモートセンシング画像における言語誘導オブジェクト認識は、大規模なマッピン … 続きを読む
カテゴリー: cs.CV
InstructSAM: A Training-Free Framework for Instruction-Oriented Remote Sensing Object Recognition はコメントを受け付けていません
Sparc3D: Sparse Representation and Construction for High-Resolution 3D Shapes Modeling
要約 高忠実度の3Dオブジェクト合成は、メッシュデータの構造化されていない性質と … 続きを読む
カテゴリー: cs.CV
Sparc3D: Sparse Representation and Construction for High-Resolution 3D Shapes Modeling はコメントを受け付けていません
RoCoDA: Counterfactual Data Augmentation for Data-Efficient Robot Learning from Demonstrations
要約 ロボット工学の模倣学習は、ロボット環境の複雑さとデータ収集のコストが高いた … 続きを読む
4D-ROLLS: 4D Radar Occupancy Learning via LiDAR Supervision
要約 3Dシーンの包括的な理解は自動運転車(AVS)に不可欠であり、さまざまな知 … 続きを読む
M3Depth: Wavelet-Enhanced Depth Estimation on Mars via Mutual Boosting of Dual-Modal Data
要約 深さの推定は、さらに火星探査ミッションの障害回避とナビゲーションに大きな潜 … 続きを読む
Does Acceleration Cause Hidden Instability in Vision Language Models? Uncovering Instance-Level Divergence Through a Large-Scale Empirical Study
要約 Vision-Language Models(VLMS)は、広範囲にわたる … 続きを読む
IP-Prompter: Training-Free Theme-Specific Image Generation via Dynamic Visual Prompting
要約 私たちが成長するにつれて私たちを魅了する物語とキャラクターは、ユニークなフ … 続きを読む
カテゴリー: cs.CV
IP-Prompter: Training-Free Theme-Specific Image Generation via Dynamic Visual Prompting はコメントを受け付けていません
Generalized Few-shot 3D Point Cloud Segmentation with Vision-Language Model
要約 一般化された少数のショット3Dポイントクラウドセグメンテーション(GFS- … 続きを読む
カテゴリー: cs.CV
Generalized Few-shot 3D Point Cloud Segmentation with Vision-Language Model はコメントを受け付けていません
Online Iterative Self-Alignment for Radiology Report Generation
要約 Radiology Report Generation(RRG)は、放射線 … 続きを読む