月別アーカイブ: 2025年4月

S^4M: Boosting Semi-Supervised Instance Segmentation with SAM

投稿日: 2025年4月8日作成者: jarxiv

要約半監視インスタンスセグメンテーションは、ラベル付きデータが限られているため … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

InteractVLM: 3D Interaction Reasoning from 2D Foundational Models

投稿日: 2025年4月8日作成者: jarxiv

要約 3Dでの正確なヒトオブジェクトジョイント再構成を可能にする、単一のワイルド … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Gaussian Mixture Flow Matching Models

投稿日: 2025年4月8日作成者: jarxiv

要約 Diffusion models approximate the deno … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

URECA: Unique Region Caption Anything

投稿日: 2025年4月8日作成者: jarxiv

要約 Region-level captioning aims to gener … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

CREA: A Collaborative Multi-Agent Framework for Creative Content Generation with Diffusion Models

投稿日: 2025年4月8日作成者: jarxiv

要約 AIイメージの創造性は依然として基本的な課題であり、視覚的に説得力のあるコ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Explain with Visual Keypoints Like a Real Mentor! A Benchmark for Multimodal Solution Explanation

投稿日: 2025年4月8日作成者: jarxiv

要約大規模な言語モデル（LLMS）における数学的推論能力の急速な進歩により、A … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

MME-Unify: A Comprehensive Benchmark for Unified Multimodal Understanding and Generation Models

投稿日: 2025年4月8日作成者: jarxiv

要約既存のMLLMベンチマークは、次のために統一されたMLLM（U-MLLM） … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

PaperBench: Evaluating AI’s Ability to Replicate AI Research

投稿日: 2025年4月8日作成者: jarxiv

要約 AIエージェントが最先端のAI研究を再現する能力を評価するベンチマークであ … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

ZFusion: An Effective Fuser of Camera and 4D Radar for 3D Object Perception in Autonomous Driving

投稿日: 2025年4月8日作成者: jarxiv

要約信頼できる3Dオブジェクトの知覚は、自律運転に不可欠です。すべての気象条 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Hybrid Real- and Complex-valued Neural Network Architecture

投稿日: 2025年4月7日作成者: jarxiv

要約 \ emphing {hybrid} Real-およびcomplex-va … 続きを読む →

カテゴリー: cs.LG | コメントを受け付けていません

月別アーカイブ: 2025年4月

S^4M: Boosting Semi-Supervised Instance Segmentation with SAM

InteractVLM: 3D Interaction Reasoning from 2D Foundational Models

Gaussian Mixture Flow Matching Models

URECA: Unique Region Caption Anything

CREA: A Collaborative Multi-Agent Framework for Creative Content Generation with Diffusion Models

Explain with Visual Keypoints Like a Real Mentor! A Benchmark for Multimodal Solution Explanation

MME-Unify: A Comprehensive Benchmark for Unified Multimodal Understanding and Generation Models

PaperBench: Evaluating AI’s Ability to Replicate AI Research

ZFusion: An Effective Fuser of Camera and 4D Radar for 3D Object Perception in Autonomous Driving

Hybrid Real- and Complex-valued Neural Network Architecture

最近の投稿

最近のコメント

アーカイブ

カテゴリー