cs.AI」カテゴリーアーカイブ

Sharpness-Aware Minimization with Z-Score Gradient Filtering for Neural Networks

要約 Sharpness-Aware Minimization(SAM)は、パラ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.IT, cs.LG, cs.NE, math.IT | Sharpness-Aware Minimization with Z-Score Gradient Filtering for Neural Networks はコメントを受け付けていません

Question-Answering Dense Video Events

要約 このペーパーでは、密集したビデオイベントに関する質問を提示します。これは、 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | Question-Answering Dense Video Events はコメントを受け付けていません

Efficient Flow Matching using Latent Variables

要約 フローマッチングモデルは、確率的生成モデルの間で画像生成タスクに大きな可能 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Efficient Flow Matching using Latent Variables はコメントを受け付けていません

‘I Can See Forever!’: Evaluating Real-time VideoLLMs for Assisting Individuals with Visual Impairments

要約 視覚障害のある人口、特に重度の視覚障害者は現在大きく、日々の活動は彼らにと … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.HC, cs.MM | ‘I Can See Forever!’: Evaluating Real-time VideoLLMs for Assisting Individuals with Visual Impairments はコメントを受け付けていません

Defining and Quantifying Creative Behavior in Popular Image Generators

要約 生成AIモデルの創造性は、決定的な答えなしに、過去数年間で科学的議論の対象 … 続きを読む

カテゴリー: cs.AI, cs.CV, I.2.m | Defining and Quantifying Creative Behavior in Popular Image Generators はコメントを受け付けていません

DFVO: Learning Darkness-free Visible and Infrared Image Disentanglement and Fusion All at Once

要約 可視および赤外線融合は、画像融合の分野で最も重要なタスクの1つであり、高レ … 続きを読む

カテゴリー: cs.AI, cs.CV | DFVO: Learning Darkness-free Visible and Infrared Image Disentanglement and Fusion All at Once はコメントを受け付けていません

EchoInk-R1: Exploring Audio-Visual Reasoning in Multimodal LLMs via Reinforcement Learning

要約 マルチモーダル大手言語モデル(MLLM)は、テキスト、ビジョン、オーディオ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM, cs.SD, eess.AS | EchoInk-R1: Exploring Audio-Visual Reasoning in Multimodal LLMs via Reinforcement Learning はコメントを受け付けていません

Absolute Zero: Reinforced Self-play Reasoning with Zero Data

要約 検証可能な報酬(RLVR)による強化学習は、結果ベースの報酬から直接学習す … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Absolute Zero: Reinforced Self-play Reasoning with Zero Data はコメントを受け付けていません

Capability-Driven Skill Generation with LLMs: A RAG-Based Approach for Reusing Existing Libraries and Interfaces

要約 最新の自動化システムは、1つのソリューションとしての機能とスキルをアプロー … 続きを読む

カテゴリー: cs.AI, cs.RO, cs.SE | Capability-Driven Skill Generation with LLMs: A RAG-Based Approach for Reusing Existing Libraries and Interfaces はコメントを受け付けていません

The Unreasonable Effectiveness of Discrete-Time Gaussian Process Mixtures for Robot Policy Learning

要約 ロボット操作における柔軟なポリシー表現と模倣学習のための新しいアプローチで … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | The Unreasonable Effectiveness of Discrete-Time Gaussian Process Mixtures for Robot Policy Learning はコメントを受け付けていません