-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
COSMO: Combination of Selective Memorization for Low-cost Vision-and-Language Navigation
要約 ビジョンと言語のナビゲーション(VLN)タスクは、ホームアシスタントのよう … 続きを読む
From Colors to Classes: Emergence of Concepts in Vision Transformers
要約 ビジョントランス(VITS)は、強力な表現能力により、さまざまなコンピュー … 続きを読む
MoMuSE: Momentum Multi-modal Target Speaker Extraction for Real-time Scenarios with Impaired Visual Cues
要約 オーディオビジュアルターゲットスピーカー抽出(AV-TSE)は、時間同期さ … 続きを読む
DH-Mamba: Exploring Dual-domain Hierarchical State Space Models for MRI Reconstruction
要約 加速されたMRI再構成は、Kスペースの著しいアンダーサンプリングのために、 … 続きを読む
A Plasticity-Aware Method for Continual Self-Supervised Learning in Remote Sensing
要約 継続的な自己学習学習(CSSL)方法は、非標識データの連続ストリームから新 … 続きを読む
カテゴリー: cs.CV
A Plasticity-Aware Method for Continual Self-Supervised Learning in Remote Sensing はコメントを受け付けていません
Gen3DSR: Generalizable 3D Scene Reconstruction via Divide and Conquer from a Single View
要約 シングルビュー3D再構成は現在、2つの支配的な観点からアプローチされていま … 続きを読む
カテゴリー: cs.CV
Gen3DSR: Generalizable 3D Scene Reconstruction via Divide and Conquer from a Single View はコメントを受け付けていません
4D mmWave Radar in Adverse Environments for Autonomous Driving: A Survey
要約 自律運転システムには、正確で信頼できる認識が必要です。 ただし、雨、雪、霧 … 続きを読む
カテゴリー: cs.CV
4D mmWave Radar in Adverse Environments for Autonomous Driving: A Survey はコメントを受け付けていません
DANTE-AD: Dual-Vision Attention Network for Long-Term Audio Description
要約 オーディオの説明は、ビデオの重要な視覚要素を知覚する際にビジョン障害のある … 続きを読む
カテゴリー: cs.CV
DANTE-AD: Dual-Vision Attention Network for Long-Term Audio Description はコメントを受け付けていません
PolypSegTrack: Unified Foundation Model for Colonoscopy Video Analysis
要約 大腸内視鏡検査中のポリープの早期発見、正確なセグメンテーション、分類、追跡 … 続きを読む
IMPACT: A Generic Semantic Loss for Multimodal Medical Image Registration
要約 画像登録は医療イメージングの基本であり、診断、治療計画、画像誘導治療、また … 続きを読む