-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年3月
GIVT: Generative Infinite-Vocabulary Transformers
要約 有限語彙からの離散トークンの代わりに、実数値エントリを含むベクトル シーケ … 続きを読む
カテゴリー: cs.CV
GIVT: Generative Infinite-Vocabulary Transformers はコメントを受け付けていません
MULDE: Multiscale Log-Density Estimation via Denoising Score Matching for Video Anomaly Detection
要約 私たちは、ビデオの異常検出に対する新しいアプローチを提案します。ビデオから … 続きを読む
カテゴリー: cs.CV
MULDE: Multiscale Log-Density Estimation via Denoising Score Matching for Video Anomaly Detection はコメントを受け付けていません
Denoising Diffusion Models for 3D Healthy Brain Tissue Inpainting
要約 脳の構造的完全性に影響を与える疾患をモニタリングするには、体積変化の評価な … 続きを読む
Ins-HOI: Instance Aware Human-Object Interactions Recovery
要約 人間や手と物体との間の詳細な相互作用を正確にモデル化することは、魅力的では … 続きを読む
カテゴリー: cs.CV
Ins-HOI: Instance Aware Human-Object Interactions Recovery はコメントを受け付けていません
T-MAE: Temporal Masked Autoencoders for Point Cloud Representation Learning
要約 LiDAR 点群理解における注釈付きデータの不足は、効果的な表現学習の妨げ … 続きを読む
カテゴリー: cs.CV
T-MAE: Temporal Masked Autoencoders for Point Cloud Representation Learning はコメントを受け付けていません
View-decoupled Transformer for Person Re-identification under Aerial-ground Camera Network
要約 既存の人物再識別方法は、地面と地面の照合など、同種のカメラ全体での外観ベー … 続きを読む
カテゴリー: cs.CV
View-decoupled Transformer for Person Re-identification under Aerial-ground Camera Network はコメントを受け付けていません
Learning a Depth Covariance Function
要約 幾何学的視覚タスクへの応用による深度共分散関数の学習を提案します。 RGB … 続きを読む
Neural Radiance Fields in Medical Imaging: Challenges and Next Steps
要約 Neural Radiance Fields (NeRF) は、コンピュー … 続きを読む
Cobra: Extending Mamba to Multi-Modal Large Language Model for Efficient Inference
要約 近年、さまざまな分野でマルチモーダル大規模言語モデル (MLLM) の適用 … 続きを読む
カテゴリー: cs.CV
Cobra: Extending Mamba to Multi-Modal Large Language Model for Efficient Inference はコメントを受け付けていません
Invisible Needle Detection in Ultrasound: Leveraging Mechanism-Induced Vibration
要約 超音波ガイド下介入を伴う臨床応用では、急な挿入や、スペックルノイズや解剖学 … 続きを読む