-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年1月
ClawMachine: Learning to Fetch Visual Tokens for Referential Comprehension
要約 視覚と言語の概念をより細かいレベルで調整することは、特に参照やグラウンディ … 続きを読む
カテゴリー: cs.CV
ClawMachine: Learning to Fetch Visual Tokens for Referential Comprehension はコメントを受け付けていません
You Only Crash Once v2: Perceptually Consistent Strong Features for One-Stage Domain Adaptive Detection of Space Terrain
要約 惑星、月、および小体の表面地形の現場検出は、学習ベースのコンピュータービジ … 続きを読む
Is Large-Scale Pretraining the Secret to Good Domain Generalization?
要約 マルチソースドメイン一般化(DG)は、複数のソースドメインでトレーニングし … 続きを読む
On Disentangled Training for Nonlinear Transform in Learned Image Compression
要約 学習済み画像圧縮 (LIC) は、従来のコーデックと比較して優れたレート歪 … 続きを読む
Solving the long-tailed distribution problem by exploiting the synergies and balance of different techniques
要約 現実世界のデータでは、ロングテールのデータ分布が一般的であるため、経験に基 … 続きを読む
Invariance Principle Meets Vicinal Risk Minimization
要約 深層学習モデルはコンピューター ビジョン タスクでは優れていますが、多くの … 続きを読む
カテゴリー: cs.CV
Invariance Principle Meets Vicinal Risk Minimization はコメントを受け付けていません
How to Efficiently Annotate Images for Best-Performing Deep Learning Based Segmentation Models: An Empirical Study with Weak and Noisy Annotations and Segment Anything Model
要約 ディープ ニューラル ネットワーク (DNN) は、さまざまな画像セグメン … 続きを読む
カテゴリー: cs.CV
How to Efficiently Annotate Images for Best-Performing Deep Learning Based Segmentation Models: An Empirical Study with Weak and Noisy Annotations and Segment Anything Model はコメントを受け付けていません
Training-Free Zero-Shot Temporal Action Detection with Vision-Language Models
要約 既存のゼロショット時間的アクション検出(ZSTAD)メソッドは、目に見えな … 続きを読む
カテゴリー: cs.CV
Training-Free Zero-Shot Temporal Action Detection with Vision-Language Models はコメントを受け付けていません
PromptMono: Cross Prompting Attention for Self-Supervised Monocular Depth Estimation in Challenging Environments
要約 理想的な条件下での単眼深度の推定を改善するためにかなりの努力が払われていま … 続きを読む
カテゴリー: cs.CV
PromptMono: Cross Prompting Attention for Self-Supervised Monocular Depth Estimation in Challenging Environments はコメントを受け付けていません
3DGSR: Implicit Surface Reconstruction with 3D Gaussian Splatting
要約 この論文では、3D ガウス スプラッティング (3DGS) を使用した陰的 … 続きを読む