投稿者「jarxiv」のアーカイブ

Gaussian Mixture Flow Matching Models

投稿日: 2025年4月8日作成者: jarxiv

要約 Diffusion models approximate the deno … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

URECA: Unique Region Caption Anything

投稿日: 2025年4月8日作成者: jarxiv

要約 Region-level captioning aims to gener … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

CREA: A Collaborative Multi-Agent Framework for Creative Content Generation with Diffusion Models

投稿日: 2025年4月8日作成者: jarxiv

要約 AIイメージの創造性は依然として基本的な課題であり、視覚的に説得力のあるコ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Explain with Visual Keypoints Like a Real Mentor! A Benchmark for Multimodal Solution Explanation

投稿日: 2025年4月8日作成者: jarxiv

要約大規模な言語モデル（LLMS）における数学的推論能力の急速な進歩により、A … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

MME-Unify: A Comprehensive Benchmark for Unified Multimodal Understanding and Generation Models

投稿日: 2025年4月8日作成者: jarxiv

要約既存のMLLMベンチマークは、次のために統一されたMLLM（U-MLLM） … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

PaperBench: Evaluating AI’s Ability to Replicate AI Research

投稿日: 2025年4月8日作成者: jarxiv

要約 AIエージェントが最先端のAI研究を再現する能力を評価するベンチマークであ … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

ZFusion: An Effective Fuser of Camera and 4D Radar for 3D Object Perception in Autonomous Driving

投稿日: 2025年4月8日作成者: jarxiv

要約信頼できる3Dオブジェクトの知覚は、自律運転に不可欠です。すべての気象条 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Hybrid Real- and Complex-valued Neural Network Architecture

投稿日: 2025年4月7日作成者: jarxiv

要約 \ emphing {hybrid} Real-およびcomplex-va … 続きを読む →

カテゴリー: cs.LG | コメントを受け付けていません

Optimal Embedding Guided Negative Sample Generation for Knowledge Graph Link Prediction

投稿日: 2025年4月7日作成者: jarxiv

要約ナレッジグラフ埋め込み（KGE）モデルは、知識グラフの構造情報を新しいリン … 続きを読む →

カテゴリー: cs.CL, cs.IR, cs.LG | コメントを受け付けていません

HumanDreamer-X: Photorealistic Single-image Human Avatars Reconstruction via Gaussian Restoration

投稿日: 2025年4月7日作成者: jarxiv

要約シングルイメージの人間の再構築は、デジタルヒューマンモデリングアプリケーシ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

投稿者「jarxiv」のアーカイブ

Gaussian Mixture Flow Matching Models

URECA: Unique Region Caption Anything

CREA: A Collaborative Multi-Agent Framework for Creative Content Generation with Diffusion Models

Explain with Visual Keypoints Like a Real Mentor! A Benchmark for Multimodal Solution Explanation

MME-Unify: A Comprehensive Benchmark for Unified Multimodal Understanding and Generation Models

PaperBench: Evaluating AI’s Ability to Replicate AI Research

ZFusion: An Effective Fuser of Camera and 4D Radar for 3D Object Perception in Autonomous Driving

Hybrid Real- and Complex-valued Neural Network Architecture

Optimal Embedding Guided Negative Sample Generation for Knowledge Graph Link Prediction

HumanDreamer-X: Photorealistic Single-image Human Avatars Reconstruction via Gaussian Restoration

最近の投稿

最近のコメント

アーカイブ

カテゴリー