月別アーカイブ: 2024年3月

Cobra: Extending Mamba to Multi-Modal Large Language Model for Efficient Inference

要約 近年、さまざまな分野でマルチモーダル大規模言語モデル (MLLM) の適用 … 続きを読む

カテゴリー: cs.CV | Cobra: Extending Mamba to Multi-Modal Large Language Model for Efficient Inference はコメントを受け付けていません

Videoshop: Localized Semantic Video Editing with Noise-Extrapolated Diffusion Inversion

要約 ローカライズされたセマンティック編集のためのトレーニング不要のビデオ編集ア … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Videoshop: Localized Semantic Video Editing with Noise-Extrapolated Diffusion Inversion はコメントを受け付けていません

LaMI: Large Language Models for Multi-Modal Human-Robot Interaction

要約 この論文では、マルチモーダルなヒューマン ロボット インタラクション (H … 続きを読む

カテゴリー: cs.HC, cs.RO | LaMI: Large Language Models for Multi-Modal Human-Robot Interaction はコメントを受け付けていません

Unimodal Multi-Task Fusion for Emotional Mimicry Prediction

要約 この研究では、第 6 回ワークショップおよび野外での感情行動分析に関するコ … 続きを読む

カテゴリー: cs.AI, cs.SD, eess.AS | Unimodal Multi-Task Fusion for Emotional Mimicry Prediction はコメントを受け付けていません

Instance-aware Exploration-Verification-Exploitation for Instance ImageGoal Navigation

要約 新しい具体化されたビジョン タスクとして、インスタンス イメージゴール ナ … 続きを読む

カテゴリー: cs.CV, cs.RO | Instance-aware Exploration-Verification-Exploitation for Instance ImageGoal Navigation はコメントを受け付けていません

Learning Hierarchical Control For Multi-Agent Capacity-Constrained Systems

要約 この論文では、反復環境で非線形で容量に制約のある自律エージェント群を管理す … 続きを読む

カテゴリー: cs.RO, cs.SY, eess.SY | Learning Hierarchical Control For Multi-Agent Capacity-Constrained Systems はコメントを受け付けていません

AnyV2V: A Plug-and-Play Framework For Any Video-to-Video Editing Tasks

要約 ビデオ間の編集には、ソース ビデオを追加のコントロール (テキスト プロン … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | AnyV2V: A Plug-and-Play Framework For Any Video-to-Video Editing Tasks はコメントを受け付けていません

Don’t Explain Noise: Robust Counterfactuals for Randomized Ensembles

要約 反事実の説明では、トレーニングされた分類器の結果を反転するために特徴ベクト … 続きを読む

カテゴリー: cs.LG, math.OC | Don’t Explain Noise: Robust Counterfactuals for Randomized Ensembles はコメントを受け付けていません

Knowledge-Enhanced Recommendation with User-Centric Subgraph Network

要約 レコメンデーション システムは、現在さまざまなプラットフォームで広く実装さ … 続きを読む

カテゴリー: cs.AI, cs.IR, cs.LG | Knowledge-Enhanced Recommendation with User-Centric Subgraph Network はコメントを受け付けていません

CryCeleb: A Speaker Verification Dataset Based on Infant Cry Sounds

要約 この論文では、乳児の泣き声にラベルを付けたコレクションである Ubenwa … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS | CryCeleb: A Speaker Verification Dataset Based on Infant Cry Sounds はコメントを受け付けていません