-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
NaturalBench: Evaluating Vision-Language Models on Natural Adversarial Samples
要約 視覚言語モデル (VLM) は、複雑な視覚言語推論を評価する最近の視覚質問 … 続きを読む
AlphaChimp: Tracking and Behavior Recognition of Chimpanzees
要約 ヒト以外の霊長類の行動を理解することは、動物福祉を改善し、社会的行動をモデ … 続きを読む
カテゴリー: cs.CV
AlphaChimp: Tracking and Behavior Recognition of Chimpanzees はコメントを受け付けていません
Oryx MLLM: On-Demand Spatial-Temporal Understanding at Arbitrary Resolution
要約 ビジュアル データは、わずか数ピクセルの小さなアイコンから数時間にわたる長 … 続きを読む
カテゴリー: cs.CV
Oryx MLLM: On-Demand Spatial-Temporal Understanding at Arbitrary Resolution はコメントを受け付けていません
YOLO-TS: Real-Time Traffic Sign Detection with Enhanced Accuracy Using Optimized Receptive Fields and Anchor-Free Fusion
要約 自動運転と先進運転支援システム (ADAS) の両方における安全性の確保は … 続きを読む
カテゴリー: cs.CV
YOLO-TS: Real-Time Traffic Sign Detection with Enhanced Accuracy Using Optimized Receptive Fields and Anchor-Free Fusion はコメントを受け付けていません
LiNeS: Post-training Layer Scaling Prevents Forgetting and Enhances Model Merging
要約 大規模な事前トレーニング済みモデルは、さまざまなタスクにわたって優れたゼロ … 続きを読む
Are Visual-Language Models Effective in Action Recognition? A Comparative Study
要約 CLIP などの現在のビジョン言語基盤モデルは、最近、さまざまな下流タスク … 続きを読む
カテゴリー: cs.CV
Are Visual-Language Models Effective in Action Recognition? A Comparative Study はコメントを受け付けていません
KANICE: Kolmogorov-Arnold Networks with Interactive Convolutional Elements
要約 畳み込みニューラル ネットワーク (CNN) とコルモゴロフ アーノルド … 続きを読む
AIM 2024 Challenge on Compressed Video Quality Assessment: Methods and Results
要約 ビデオ品質評価 (VQA) は、視聴者のエクスペリエンスに直接影響を与える … 続きを読む
Emphasizing Discriminative Features for Dataset Distillation in Complex Scenarios
要約 データセットの蒸留は、CIFAR、MNIST、TinyImageNet な … 続きを読む
EPContrast: Effective Point-level Contrastive Learning for Large-scale Point Cloud Understanding
要約 点レベルの対比学習による帰納的バイアスの獲得は、点群の事前トレーニングにお … 続きを読む
カテゴリー: cs.CV
EPContrast: Effective Point-level Contrastive Learning for Large-scale Point Cloud Understanding はコメントを受け付けていません