cs.LG」カテゴリーアーカイブ

Augmentation-aware Self-supervised Learning with Conditioned Projector

要約 自己教師あり学習 (SSL) は、ラベルのないデータから学習するための強力 … 続きを読む

カテゴリー: cs.CV, cs.LG | Augmentation-aware Self-supervised Learning with Conditioned Projector はコメントを受け付けていません

MLLM can see? Dynamic Correction Decoding for Hallucination Mitigation

要約 マルチモーダル大規模言語モデル (MLLM) は頻繁に幻覚現象を示しますが … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MM | MLLM can see? Dynamic Correction Decoding for Hallucination Mitigation はコメントを受け付けていません

OKAMI: Teaching Humanoid Robots Manipulation Skills through Single Video Imitation

要約 私たちは、単一のビデオデモンストレーションを模倣して人型ロボットの操作スキ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | OKAMI: Teaching Humanoid Robots Manipulation Skills through Single Video Imitation はコメントを受け付けていません

Active Label Refinement for Robust Training of Imbalanced Medical Image Classification Tasks in the Presence of High Label Noise

要約 教師あり深層学習ベースの医用画像分類の堅牢性は、ラベル ノイズによって大幅 … 続きを読む

カテゴリー: cs.CV, cs.LG | Active Label Refinement for Robust Training of Imbalanced Medical Image Classification Tasks in the Presence of High Label Noise はコメントを受け付けていません

Improving Long-Text Alignment for Text-to-Image Diffusion Models

要約 テキストから画像への (T2I) 拡散モデルの急速な進歩により、与えられた … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.MM | Improving Long-Text Alignment for Text-to-Image Diffusion Models はコメントを受け付けていません

MoH: Multi-Head Attention as Mixture-of-Head Attention

要約 この作業では、Transformer モデルの中核であるマルチヘッド アテ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | MoH: Multi-Head Attention as Mixture-of-Head Attention はコメントを受け付けていません

TemporalBench: Benchmarking Fine-grained Temporal Understanding for Multimodal Video Models

要約 マルチモーダルビデオの理解と生成には、きめの細かい時間ダイナミクスを理解す … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | TemporalBench: Benchmarking Fine-grained Temporal Understanding for Multimodal Video Models はコメントを受け付けていません

MoVEInt: Mixture of Variational Experts for Learning Human-Robot Interactions from Demonstrations

要約 共有ダイナミクス モデルは、ヒューマン ロボット インタラクション (HR … 続きを読む

カテゴリー: cs.HC, cs.LG, cs.RO | MoVEInt: Mixture of Variational Experts for Learning Human-Robot Interactions from Demonstrations はコメントを受け付けていません

Make the Pertinent Salient: Task-Relevant Reconstruction for Visual Control with Distractions

要約 モデルベース強化学習 (MBRL) の最近の進歩により、MBRL は視覚的 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Make the Pertinent Salient: Task-Relevant Reconstruction for Visual Control with Distractions はコメントを受け付けていません

Input-to-State Stable Coupled Oscillator Networks for Closed-form Model-based Control in Latent Space

要約 文献ではさまざまな方法が提案されていますが、物理システムの効率的かつ効果的 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO, cs.SY, eess.SY | Input-to-State Stable Coupled Oscillator Networks for Closed-form Model-based Control in Latent Space はコメントを受け付けていません