-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
ODE: Open-Set Evaluation of Hallucinations in Multimodal Large Language Models
要約 幻覚は、マルチモーダル大規模言語モデル (MLLM) に永続的な課題をもた … 続きを読む
AIM: Adaptive Inference of Multi-Modal LLMs via Token Merging and Pruning
要約 大規模言語モデル (LLM) により、画像やビデオなどの視覚データの強力な … 続きを読む
A Spatio-Temporal Representation Learning as an Alternative to Traditional Glosses in Sign Language Translation and Production
要約 この研究では、手話翻訳 (SLT) と手話制作 (SLP) の両方における … 続きを読む
OpenDriver: An Open-Road Driver State Detection Dataset
要約 ドライバーの状態検出に関する数多くの研究の中で、ウェアラブル生理学的測定は … 続きを読む
DIVE: Taming DINO for Subject-Driven Video Editing
要約 画像の生成と編集における普及モデルの成功に基づいて、ビデオ編集が最近大きな … 続きを読む
Intuitive Axial Augmentation Using Polar-Sine-Based Piecewise Distortion for Medical Slice-Wise Segmentation
要約 医療画像分析用のデータ駆動型モデルのほとんどは、パフォーマンスを向上させる … 続きを読む
Mapping using Transformers for Volumes — Network for Super-Resolution with Long-Range Interactions
要約 これまで、2D 超解像度に見られるトランスベースのモデルの最近の進歩を体積 … 続きを読む
Functionality understanding and segmentation in 3D scenes
要約 3D シーンの機能を理解するには、自然言語の説明を解釈して、ハンドルやボタ … 続きを読む
カテゴリー: cs.CV
Functionality understanding and segmentation in 3D scenes はコメントを受け付けていません
LLM as a Complementary Optimizer to Gradient Descent: A Case Study in Prompt Tuning
要約 スキルを習得するには、一般に、実践者による実践的な経験と、メンターによる洞 … 続きを読む
Defending Against Repetitive Backdoor Attacks on Semi-supervised Learning through Lens of Rate-Distortion-Perception Trade-off
要約 半教師あり学習 (SSL) は、インターネットからの大量のラベルなしデータ … 続きを読む
カテゴリー: cs.CV
Defending Against Repetitive Backdoor Attacks on Semi-supervised Learning through Lens of Rate-Distortion-Perception Trade-off はコメントを受け付けていません