cs.CV」カテゴリーアーカイブ

ODE: Open-Set Evaluation of Hallucinations in Multimodal Large Language Models

要約 幻覚は、マルチモーダル大規模言語モデル (MLLM) に永続的な課題をもた … 続きを読む

カテゴリー: cs.CL, cs.CV | ODE: Open-Set Evaluation of Hallucinations in Multimodal Large Language Models はコメントを受け付けていません

AIM: Adaptive Inference of Multi-Modal LLMs via Token Merging and Pruning

要約 大規模言語モデル (LLM) により、画像やビデオなどの視覚データの強力な … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | AIM: Adaptive Inference of Multi-Modal LLMs via Token Merging and Pruning はコメントを受け付けていません

A Spatio-Temporal Representation Learning as an Alternative to Traditional Glosses in Sign Language Translation and Production

要約 この研究では、手話翻訳 (SLT) と手話制作 (SLP) の両方における … 続きを読む

カテゴリー: cs.CL, cs.CV | A Spatio-Temporal Representation Learning as an Alternative to Traditional Glosses in Sign Language Translation and Production はコメントを受け付けていません

OpenDriver: An Open-Road Driver State Detection Dataset

要約 ドライバーの状態検出に関する数多くの研究の中で、ウェアラブル生理学的測定は … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.HC, cs.LG | OpenDriver: An Open-Road Driver State Detection Dataset はコメントを受け付けていません

DIVE: Taming DINO for Subject-Driven Video Editing

要約 画像の生成と編集における普及モデルの成功に基づいて、ビデオ編集が最近大きな … 続きを読む

カテゴリー: cs.AI, cs.CV | DIVE: Taming DINO for Subject-Driven Video Editing はコメントを受け付けていません

Intuitive Axial Augmentation Using Polar-Sine-Based Piecewise Distortion for Medical Slice-Wise Segmentation

要約 医療画像分析用のデータ駆動型モデルのほとんどは、パフォーマンスを向上させる … 続きを読む

カテゴリー: cs.AI, cs.CV | Intuitive Axial Augmentation Using Polar-Sine-Based Piecewise Distortion for Medical Slice-Wise Segmentation はコメントを受け付けていません

Mapping using Transformers for Volumes — Network for Super-Resolution with Long-Range Interactions

要約 これまで、2D 超解像度に見られるトランスベースのモデルの最近の進歩を体積 … 続きを読む

カテゴリー: cs.CV, eess.IV | Mapping using Transformers for Volumes — Network for Super-Resolution with Long-Range Interactions はコメントを受け付けていません

Functionality understanding and segmentation in 3D scenes

要約 3D シーンの機能を理解するには、自然言語の説明を解釈して、ハンドルやボタ … 続きを読む

カテゴリー: cs.CV | Functionality understanding and segmentation in 3D scenes はコメントを受け付けていません

LLM as a Complementary Optimizer to Gradient Descent: A Case Study in Prompt Tuning

要約 スキルを習得するには、一般に、実践者による実践的な経験と、メンターによる洞 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | LLM as a Complementary Optimizer to Gradient Descent: A Case Study in Prompt Tuning はコメントを受け付けていません

Defending Against Repetitive Backdoor Attacks on Semi-supervised Learning through Lens of Rate-Distortion-Perception Trade-off

要約 半教師あり学習 (SSL) は、インターネットからの大量のラベルなしデータ … 続きを読む

カテゴリー: cs.CV | Defending Against Repetitive Backdoor Attacks on Semi-supervised Learning through Lens of Rate-Distortion-Perception Trade-off はコメントを受け付けていません