月別アーカイブ: 2025年4月

S^4M: Boosting Semi-Supervised Instance Segmentation with SAM

要約 半監視インスタンスセグメンテーションは、ラベル付きデータが限られているため … 続きを読む

カテゴリー: cs.CV | S^4M: Boosting Semi-Supervised Instance Segmentation with SAM はコメントを受け付けていません

InteractVLM: 3D Interaction Reasoning from 2D Foundational Models

要約 3Dでの正確なヒトオブジェクトジョイント再構成を可能にする、単一のワイルド … 続きを読む

カテゴリー: cs.CV | InteractVLM: 3D Interaction Reasoning from 2D Foundational Models はコメントを受け付けていません

Gaussian Mixture Flow Matching Models

要約 Diffusion models approximate the deno … 続きを読む

カテゴリー: cs.CV, cs.LG | Gaussian Mixture Flow Matching Models はコメントを受け付けていません

URECA: Unique Region Caption Anything

要約 Region-level captioning aims to gener … 続きを読む

カテゴリー: cs.AI, cs.CV | URECA: Unique Region Caption Anything はコメントを受け付けていません

CREA: A Collaborative Multi-Agent Framework for Creative Content Generation with Diffusion Models

要約 AIイメージの創造性は依然として基本的な課題であり、視覚的に説得力のあるコ … 続きを読む

カテゴリー: cs.CV | CREA: A Collaborative Multi-Agent Framework for Creative Content Generation with Diffusion Models はコメントを受け付けていません

Explain with Visual Keypoints Like a Real Mentor! A Benchmark for Multimodal Solution Explanation

要約 大規模な言語モデル(LLMS)における数学的推論能力の急速な進歩により、A … 続きを読む

カテゴリー: cs.CL | Explain with Visual Keypoints Like a Real Mentor! A Benchmark for Multimodal Solution Explanation はコメントを受け付けていません

MME-Unify: A Comprehensive Benchmark for Unified Multimodal Understanding and Generation Models

要約 既存のMLLMベンチマークは、次のために統一されたMLLM(U-MLLM) … 続きを読む

カテゴリー: cs.CV | MME-Unify: A Comprehensive Benchmark for Unified Multimodal Understanding and Generation Models はコメントを受け付けていません

PaperBench: Evaluating AI’s Ability to Replicate AI Research

要約 AIエージェントが最先端のAI研究を再現する能力を評価するベンチマークであ … 続きを読む

カテゴリー: cs.AI, cs.CL | PaperBench: Evaluating AI’s Ability to Replicate AI Research はコメントを受け付けていません

ZFusion: An Effective Fuser of Camera and 4D Radar for 3D Object Perception in Autonomous Driving

要約 信頼できる3Dオブジェクトの知覚は、自律運転に不可欠です。 すべての気象条 … 続きを読む

カテゴリー: cs.CV | ZFusion: An Effective Fuser of Camera and 4D Radar for 3D Object Perception in Autonomous Driving はコメントを受け付けていません

Hybrid Real- and Complex-valued Neural Network Architecture

要約 \ emphing {hybrid} Real-およびcomplex-va … 続きを読む

カテゴリー: cs.LG | Hybrid Real- and Complex-valued Neural Network Architecture はコメントを受け付けていません