-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
A Review on Geometry and Surface Inspection in 3D Concrete Printing
要約 建設中の添加剤の使用(AMC)の使用の大幅な成長を考えると、従来の製造され … 続きを読む
SOGS: Second-Order Anchor for Advanced 3D Gaussian Splatting
要約 アンカーベースの3Dガウススプラッティング(3D-GS)は、3Dガウス予測 … 続きを読む
カテゴリー: cs.CV
SOGS: Second-Order Anchor for Advanced 3D Gaussian Splatting はコメントを受け付けていません
VLRMBench: A Comprehensive and Challenging Benchmark for Vision-Language Reward Models
要約 大規模な視覚言語モデル(LVLMS)は、マルチモーダルタスクで強力なパフォ … 続きを読む
カテゴリー: cs.CV
VLRMBench: A Comprehensive and Challenging Benchmark for Vision-Language Reward Models はコメントを受け付けていません
Chameleon: Fast-slow Neuro-symbolic Lane Topology Extraction
要約 レーントポロジ抽出には、車線と交通要素を検出し、その関係を決定することが含 … 続きを読む
カテゴリー: cs.CV
Chameleon: Fast-slow Neuro-symbolic Lane Topology Extraction はコメントを受け付けていません
LLaVA-RadZ: Can Multimodal Large Language Models Effectively Tackle Zero-shot Radiology Recognition?
要約 最近、マルチモーダル大規模モデル(MLLM)は、さまざまなビジョン言語タス … 続きを読む
カテゴリー: cs.CV
LLaVA-RadZ: Can Multimodal Large Language Models Effectively Tackle Zero-shot Radiology Recognition? はコメントを受け付けていません
Vulnerabilities in AI-generated Image Detection: The Challenge of Adversarial Attacks
要約 特にGANおよび拡散モデルの出現による画像統合の最近の進歩は、偽情報の普及 … 続きを読む
GoalFlow: Goal-Driven Flow Matching for Multimodal Trajectories Generation in End-to-End Autonomous Driving
要約 高品質のマルチモーダル軌道を生成するためのエンドツーエンドの自律運転方法で … 続きを読む
カテゴリー: cs.CV
GoalFlow: Goal-Driven Flow Matching for Multimodal Trajectories Generation in End-to-End Autonomous Driving はコメントを受け付けていません
PseudoTouch: Efficiently Imaging the Surface Feel of Objects for Robotic Manipulation
要約 触覚センシングは、人間の器用な操作に不可欠ですが、ロボット工学では広く使用 … 続きを読む
METDrive: Multi-modal End-to-end Autonomous Driving with Temporal Guidance
要約 マルチモーダルエンドツーエンドの自律運転は、最近の研究で有望な進歩を示して … 続きを読む
Bridging Text and Vision: A Multi-View Text-Vision Registration Approach for Cross-Modal Place Recognition
要約 モバイルロボットは、場所を正確に識別し、パッケージ配信などのタスクを実行す … 続きを読む