-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
投稿者「jarxiv」のアーカイブ
Explainable embeddings with Distance Explainer
要約 説明可能なAI(XAI)は大幅に進歩していますが、寸法が複雑な抽象化を表す … 続きを読む
Detection of Underwater Multi-Targets Based on Self-Supervised Learning and Deformable Path Aggregation Feature Pyramid Network
要約 水中環境の制約を克服し、水中ターゲット検出モデルの精度と堅牢性を向上させる … 続きを読む
カテゴリー: cs.CV
Detection of Underwater Multi-Targets Based on Self-Supervised Learning and Deformable Path Aggregation Feature Pyramid Network はコメントを受け付けていません
PlantDreamer: Achieving Realistic 3D Plant Models with Diffusion-Guided Gaussian Splatting
要約 近年、AIを使用して合成3Dオブジェクトを生成する能力が大幅に改善されてい … 続きを読む
Clapper: Compact Learning and Video Representation in VLMs
要約 現在のビジョン言語モデル(VLM)は、多様なビデオ理解アプリケーション全体 … 続きを読む
カテゴリー: cs.CV
Clapper: Compact Learning and Video Representation in VLMs はコメントを受け付けていません
CAV-MAE Sync: Improving Contrastive Audio-Visual Mask Autoencoders via Fine-Grained Alignment
要約 視聴覚学習の最近の進歩により、モダリティ全体の学習表現における有望な結果が … 続きを読む
Convolutional Long Short-Term Memory Neural Networks Based Numerical Simulation of Flow Field
要約 計算流体力学(CFD)は、流れ場を分析するための主なアプローチです。 ただ … 続きを読む
カテゴリー: cs.CV
Convolutional Long Short-Term Memory Neural Networks Based Numerical Simulation of Flow Field はコメントを受け付けていません
seg_3D_by_PC2D: Multi-View Projection for Domain Generalization and Adaptation in 3D Semantic Segmentation
要約 3Dセマンティックセグメンテーションは、自律運転および道路インフラストラク … 続きを読む
カテゴリー: cs.CV
seg_3D_by_PC2D: Multi-View Projection for Domain Generalization and Adaptation in 3D Semantic Segmentation はコメントを受け付けていません
M3TR: A Generalist Model for Real-World HD Map Completion
要約 自動運転車は操作のためにHDマップに依存していますが、オフラインのHDマッ … 続きを読む
TinyDrive: Multiscale Visual Question Answering with Selective Token Routing for Autonomous Driving
要約 自律運転で視覚的な質問回答(VQA)に採用されたビジョン言語モデル(VLM … 続きを読む
カテゴリー: cs.CV
TinyDrive: Multiscale Visual Question Answering with Selective Token Routing for Autonomous Driving はコメントを受け付けていません