-
最近の投稿
- Physical Reservoir Computing in Hook-Shaped Rover Wheel Spokes for Real-Time Terrain Identification
- Chain-of-Modality: Learning Manipulation Programs from Multimodal Human Videos with Vision-Language-Models
- Multi-Sensor Fusion-Based Mobile Manipulator Remote Control for Intelligent Smart Home Assistance
- Integration of a Graph-Based Path Planner and Mixed-Integer MPC for Robot Navigation in Cluttered Environments
- Demonstrating CavePI: Autonomous Exploration of Underwater Caves by Semantic Guidance
-
最近のコメント
表示できるコメントはありません。 cs.AI (36829) cs.CL (27883) cs.CV (42623) cs.HC (2814) cs.LG (41781) cs.RO (21795) cs.SY (3320) eess.IV (4979) eess.SY (3312) stat.ML (5469)
月別アーカイブ: 2025年4月
DenSe-AdViT: A novel Vision Transformer for Dense SAR Object Detection
要約 視覚変圧器(VIT)は、グローバルな特徴を抽出する特別な能力により、合成開 … 続きを読む
AnomalyControl: Learning Cross-modal Semantic Features for Controllable Anomaly Synthesis
要約 異常合成は、異常検査を進めるための異常なデータを増強するための重要なアプロ … 続きを読む
The Mirage of Performance Gains: Why Contrastive Decoding Fails to Address Multimodal Hallucination
要約 対照的なデコード戦略は、マルチモーダルの大手言語モデル(MLLM)の幻覚を … 続きを読む
IReNe: Instant Recoloring of Neural Radiance Fields
要約 NERFの進歩により、3Dシーンの再構築と新しいビューの合成が可能になりま … 続きを読む
LeOCLR: Leveraging Original Images for Contrastive Learning of Visual Representations
要約 対照的なインスタンス識別方法は、画像分類やオブジェクト検出などの下流タ … 続きを読む
DialogGen: Multi-modal Interactive Dialogue System for Multi-turn Text-to-Image Generation
要約 テキストからイメージ(T2I)生成モデルは、近年大幅に進歩しています。 た … 続きを読む
Efficient Parameter Adaptation for Multi-Modal Medical Image Segmentation and Prognosis
要約 がんの検出と予後は、医療イメージング、特にCTとPETスキャンに大きく依存 … 続きを読む
Lightweight LiDAR-Camera 3D Dynamic Object Detection and Multi-Class Trajectory Prediction
要約 多くの場合、サービスモバイルロボットは、タスクを実行しながら動的なオブジェ … 続きを読む
Enhancing Pothole Detection and Characterization: Integrated Segmentation and Depth Estimation in Road Anomaly Systems
要約 道路の異常検出は、道路のメンテナンスとドライバーと車両の両方の安全性を高め … 続きを読む