月別アーカイブ: 2025年3月

DSO: Aligning 3D Generators with Simulation Feedback for Physical Soundness

投稿日: 2025年3月31日作成者: jarxiv

要約ほとんどの3Dオブジェクトジェネレーターは、美的品質に焦点を当てており、ア … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Q-Insight: Understanding Image Quality via Visual Reinforcement Learning

投稿日: 2025年3月31日作成者: jarxiv

要約画像品質評価（IQA）は、画像の知覚的な視覚品質に焦点を当て、画像の再構築 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Outlier dimensions favor frequent tokens in language models

投稿日: 2025年3月31日作成者: jarxiv

要約最後の層の外れ値の寸法、つまり、大部分の入力に対して極端な活性化を示す寸法 … 続きを読む →

カテゴリー: cs.AI, cs.CL, I.2.7 | コメントを受け付けていません

OmniVox: Zero-Shot Emotion Recognition with Omni-LLMs

投稿日: 2025年3月31日作成者: jarxiv

要約特に音声を含むマルチモーダル認知状態タスクでは、OMNI-LLMS（入力と … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

LOCATEdit: Graph Laplacian Optimized Cross Attention for Localized Text-Guided Image Editing

投稿日: 2025年3月31日作成者: jarxiv

要約テキスト誘導画像編集は、一般的な構造と背景の忠実度を維持しながら、自然言語 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

LaMOuR: Leveraging Language Models for Out-of-Distribution Recovery in Reinforcement Learning

投稿日: 2025年3月31日作成者: jarxiv

要約 Deep Renection Learning（DRL）は、ロボット制御に … 続きを読む →

カテゴリー: cs.AI, cs.RO | コメントを受け付けていません

AcL: Action Learner for Fault-Tolerant Quadruped Locomotion Control

投稿日: 2025年3月31日作成者: jarxiv

要約四葉型ロボットは多目的な移動スキルを学ぶことができますが、1つ以上のジョイ … 続きを読む →

カテゴリー: cs.LG, cs.RO, cs.SY, eess.SY | コメントを受け付けていません

Generalizable Prompt Learning of CLIP: A Brief Overview

投稿日: 2025年3月31日作成者: jarxiv

要約クリップなどの既存のビジョン言語モデル（VLM）は、さまざまな下流タスクに … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

Unified Multimodal Discrete Diffusion

投稿日: 2025年3月28日作成者: jarxiv

要約複数のモダリティにわたって理解して生成できるマルチモーダル生成モデルは、左 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

A Study of Perceived Safety for Soft Robotics in Caregiving Tasks

投稿日: 2025年3月28日作成者: jarxiv

要約このプロジェクトでは、皮膚に力をかける必要があるため、身体的接触が避けられ … 続きを読む →

カテゴリー: cs.HC, cs.RO | コメントを受け付けていません

月別アーカイブ: 2025年3月

DSO: Aligning 3D Generators with Simulation Feedback for Physical Soundness

Q-Insight: Understanding Image Quality via Visual Reinforcement Learning

Outlier dimensions favor frequent tokens in language models

OmniVox: Zero-Shot Emotion Recognition with Omni-LLMs

LOCATEdit: Graph Laplacian Optimized Cross Attention for Localized Text-Guided Image Editing

LaMOuR: Leveraging Language Models for Out-of-Distribution Recovery in Reinforcement Learning

AcL: Action Learner for Fault-Tolerant Quadruped Locomotion Control

Generalizable Prompt Learning of CLIP: A Brief Overview

Unified Multimodal Discrete Diffusion

A Study of Perceived Safety for Soft Robotics in Caregiving Tasks

最近の投稿

最近のコメント

アーカイブ

カテゴリー