-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年5月
Provably Robust Conformal Prediction with Improved Efficiency
要約 等角予測は、トレーニング データとテスト データが i.i.d. であると … 続きを読む
VimTS: A Unified Video and Image Text Spotter for Enhancing the Cross-domain Generalization
要約 画像またはビデオシーケンスからテキスト情報を抽出するタスクであるテキストス … 続きを読む
Masked Multi-Query Slot Attention for Unsupervised Object Discovery
要約 教師なし物体発見は、セマンティック セグメンテーションや物体検出など、画像 … 続きを読む
Enhancing Lip Reading with Multi-Scale Video and Multi-Encoder
要約 自動読唇術 (ALR) は、ビデオにキャプチャされた話者の無言の唇の動きか … 続きを読む
カテゴリー: cs.CV
Enhancing Lip Reading with Multi-Scale Video and Multi-Encoder はコメントを受け付けていません
Towards Scenario- and Capability-Driven Dataset Development and Evaluation: An Approach in the Context of Mapless Automated Driving
要約 深層学習モデルの機能を定義する際のデータセットの基本的な役割により、その急 … 続きを読む
カテゴリー: cs.CV
Towards Scenario- and Capability-Driven Dataset Development and Evaluation: An Approach in the Context of Mapless Automated Driving はコメントを受け付けていません
Test-Time Adaptation with SaLIP: A Cascade of SAM and CLIP for Zero shot Medical Image Segmentation
要約 Segment Anything Model (SAM) と CLIP は … 続きを読む
Beyond MOS: Subjective Image Quality Score Preprocessing Method Based on Perceptual Similarity
要約 画質評価は主観的な実験で被験者によって提供された生の意見スコアに依存するこ … 続きを読む
SwipeGANSpace: Swipe-to-Compare Image Generation via Efficient Latent Space Exploration
要約 敵対的生成ネットワーク (GAN) を使用して優先画像を生成することは、潜 … 続きを読む
Naturally Supervised 3D Visual Grounding with Language-Regularized Concept Learners
要約 3D 視覚的グラウンディングは、多くの場合、直接的かつ綿密な監視、特にシー … 続きを読む
GS-LRM: Large Reconstruction Model for 3D Gaussian Splatting
要約 我々は、単一の A100 GPU で 2 ~ 4 枚のポーズをとったスパー … 続きを読む
カテゴリー: cs.CV
GS-LRM: Large Reconstruction Model for 3D Gaussian Splatting はコメントを受け付けていません