投稿者「jarxiv」のアーカイブ

Gaussian Mixture Flow Matching Models

要約 Diffusion models approximate the deno … 続きを読む

カテゴリー: cs.CV, cs.LG | Gaussian Mixture Flow Matching Models はコメントを受け付けていません

URECA: Unique Region Caption Anything

要約 Region-level captioning aims to gener … 続きを読む

カテゴリー: cs.AI, cs.CV | URECA: Unique Region Caption Anything はコメントを受け付けていません

CREA: A Collaborative Multi-Agent Framework for Creative Content Generation with Diffusion Models

要約 AIイメージの創造性は依然として基本的な課題であり、視覚的に説得力のあるコ … 続きを読む

カテゴリー: cs.CV | CREA: A Collaborative Multi-Agent Framework for Creative Content Generation with Diffusion Models はコメントを受け付けていません

Explain with Visual Keypoints Like a Real Mentor! A Benchmark for Multimodal Solution Explanation

要約 大規模な言語モデル(LLMS)における数学的推論能力の急速な進歩により、A … 続きを読む

カテゴリー: cs.CL | Explain with Visual Keypoints Like a Real Mentor! A Benchmark for Multimodal Solution Explanation はコメントを受け付けていません

MME-Unify: A Comprehensive Benchmark for Unified Multimodal Understanding and Generation Models

要約 既存のMLLMベンチマークは、次のために統一されたMLLM(U-MLLM) … 続きを読む

カテゴリー: cs.CV | MME-Unify: A Comprehensive Benchmark for Unified Multimodal Understanding and Generation Models はコメントを受け付けていません

PaperBench: Evaluating AI’s Ability to Replicate AI Research

要約 AIエージェントが最先端のAI研究を再現する能力を評価するベンチマークであ … 続きを読む

カテゴリー: cs.AI, cs.CL | PaperBench: Evaluating AI’s Ability to Replicate AI Research はコメントを受け付けていません

ZFusion: An Effective Fuser of Camera and 4D Radar for 3D Object Perception in Autonomous Driving

要約 信頼できる3Dオブジェクトの知覚は、自律運転に不可欠です。 すべての気象条 … 続きを読む

カテゴリー: cs.CV | ZFusion: An Effective Fuser of Camera and 4D Radar for 3D Object Perception in Autonomous Driving はコメントを受け付けていません

Hybrid Real- and Complex-valued Neural Network Architecture

要約 \ emphing {hybrid} Real-およびcomplex-va … 続きを読む

カテゴリー: cs.LG | Hybrid Real- and Complex-valued Neural Network Architecture はコメントを受け付けていません

Optimal Embedding Guided Negative Sample Generation for Knowledge Graph Link Prediction

要約 ナレッジグラフ埋め込み(KGE)モデルは、知識グラフの構造情報を新しいリン … 続きを読む

カテゴリー: cs.CL, cs.IR, cs.LG | Optimal Embedding Guided Negative Sample Generation for Knowledge Graph Link Prediction はコメントを受け付けていません

HumanDreamer-X: Photorealistic Single-image Human Avatars Reconstruction via Gaussian Restoration

要約 シングルイメージの人間の再構築は、デジタルヒューマンモデリングアプリケーシ … 続きを読む

カテゴリー: cs.CV | HumanDreamer-X: Photorealistic Single-image Human Avatars Reconstruction via Gaussian Restoration はコメントを受け付けていません