「cs.AI」カテゴリーアーカイブ

Sharpness-Aware Minimization with Z-Score Gradient Filtering for Neural Networks

投稿日: 2025年5月8日作成者: jarxiv

要約 Sharpness-Aware Minimization（SAM）は、パラ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.IT, cs.LG, cs.NE, math.IT | コメントを受け付けていません

Question-Answering Dense Video Events

投稿日: 2025年5月8日作成者: jarxiv

要約このペーパーでは、密集したビデオイベントに関する質問を提示します。これは、 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.MM | コメントを受け付けていません

Efficient Flow Matching using Latent Variables

投稿日: 2025年5月8日作成者: jarxiv

要約フローマッチングモデルは、確率的生成モデルの間で画像生成タスクに大きな可能 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

‘I Can See Forever!’: Evaluating Real-time VideoLLMs for Assisting Individuals with Visual Impairments

投稿日: 2025年5月8日作成者: jarxiv

要約視覚障害のある人口、特に重度の視覚障害者は現在大きく、日々の活動は彼らにと … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.HC, cs.MM | コメントを受け付けていません

Defining and Quantifying Creative Behavior in Popular Image Generators

投稿日: 2025年5月8日作成者: jarxiv

要約生成AIモデルの創造性は、決定的な答えなしに、過去数年間で科学的議論の対象 … 続きを読む →

カテゴリー: cs.AI, cs.CV, I.2.m | コメントを受け付けていません

DFVO: Learning Darkness-free Visible and Infrared Image Disentanglement and Fusion All at Once

投稿日: 2025年5月8日作成者: jarxiv

要約可視および赤外線融合は、画像融合の分野で最も重要なタスクの1つであり、高レ … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

EchoInk-R1: Exploring Audio-Visual Reasoning in Multimodal LLMs via Reinforcement Learning

投稿日: 2025年5月8日作成者: jarxiv

要約マルチモーダル大手言語モデル（MLLM）は、テキスト、ビジョン、オーディオ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

Absolute Zero: Reinforced Self-play Reasoning with Zero Data

投稿日: 2025年5月8日作成者: jarxiv

要約検証可能な報酬（RLVR）による強化学習は、結果ベースの報酬から直接学習す … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Capability-Driven Skill Generation with LLMs: A RAG-Based Approach for Reusing Existing Libraries and Interfaces

投稿日: 2025年5月7日作成者: jarxiv

要約最新の自動化システムは、1つのソリューションとしての機能とスキルをアプロー … 続きを読む →

カテゴリー: cs.AI, cs.RO, cs.SE | コメントを受け付けていません

The Unreasonable Effectiveness of Discrete-Time Gaussian Process Mixtures for Robot Policy Learning

投稿日: 2025年5月7日作成者: jarxiv

要約ロボット操作における柔軟なポリシー表現と模倣学習のための新しいアプローチで … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.RO | コメントを受け付けていません

「cs.AI」カテゴリーアーカイブ

Sharpness-Aware Minimization with Z-Score Gradient Filtering for Neural Networks

Question-Answering Dense Video Events

Efficient Flow Matching using Latent Variables

‘I Can See Forever!’: Evaluating Real-time VideoLLMs for Assisting Individuals with Visual Impairments

Defining and Quantifying Creative Behavior in Popular Image Generators

DFVO: Learning Darkness-free Visible and Infrared Image Disentanglement and Fusion All at Once

EchoInk-R1: Exploring Audio-Visual Reasoning in Multimodal LLMs via Reinforcement Learning

Absolute Zero: Reinforced Self-play Reasoning with Zero Data

Capability-Driven Skill Generation with LLMs: A RAG-Based Approach for Reusing Existing Libraries and Interfaces

The Unreasonable Effectiveness of Discrete-Time Gaussian Process Mixtures for Robot Policy Learning

最近の投稿

最近のコメント

アーカイブ

カテゴリー