月別アーカイブ: 2025年3月

3DSwapping: Texture Swapping For 3D Object From Single Reference Image

要約 3Dテクスチャスワッピングにより、3Dオブジェクトテクスチャのカスタマイズ … 続きを読む

カテゴリー: cs.CV | 3DSwapping: Texture Swapping For 3D Object From Single Reference Image はコメントを受け付けていません

MC-LLaVA: Multi-Concept Personalized Vision-Language Model

要約 現在のビジョン言語モデル(VLM)は、視覚的な質問応答など、さまざまなタス … 続きを読む

カテゴリー: cs.AI, cs.CV | MC-LLaVA: Multi-Concept Personalized Vision-Language Model はコメントを受け付けていません

STEVE: A Step Verification Pipeline for Computer-use Agent Training

要約 グラフィカルユーザーインターフェイスを自律的に操作するためにAIエージェン … 続きを読む

カテゴリー: cs.AI, cs.CV | STEVE: A Step Verification Pipeline for Computer-use Agent Training はコメントを受け付けていません

PRISM: Privacy-Preserving Improved Stochastic Masking for Federated Generative Models

要約 連邦学習(FL)の最近の進歩にもかかわらず、FLへの生成モデルの統合は、高 … 続きを読む

カテゴリー: cs.CR, cs.CV, cs.LG | PRISM: Privacy-Preserving Improved Stochastic Masking for Federated Generative Models はコメントを受け付けていません

Visual Position Prompt for MLLM based Visual Grounding

要約 マルチモーダルの大手言語モデル(MLLM)は、さまざまな画像関連のタスクに … 続きを読む

カテゴリー: cs.AI, cs.CV | Visual Position Prompt for MLLM based Visual Grounding はコメントを受け付けていません

HunyuanPortrait: Implicit Condition Control for Enhanced Portrait Animation

要約 Hunyuanportraitを紹介します。これは、非常に制御可能でリアル … 続きを読む

カテゴリー: cs.CV | HunyuanPortrait: Implicit Condition Control for Enhanced Portrait Animation はコメントを受け付けていません

Exploring the Integration of Key-Value Attention Into Pure and Hybrid Transformers for Semantic Segmentation

要約 CNNは長い間画像処理の最先端と見なされていましたが、トランスアーキテクチ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Exploring the Integration of Key-Value Attention Into Pure and Hybrid Transformers for Semantic Segmentation はコメントを受け付けていません

Dora: Sampling and Benchmarking for 3D Shape Variational Auto-Encoders

要約 最近の3Dコンテンツ生成パイプラインは、一般に変分自動エンコーダー(VAE … 続きを読む

カテゴリー: cs.CV | Dora: Sampling and Benchmarking for 3D Shape Variational Auto-Encoders はコメントを受け付けていません

MotionMap: Representing Multimodality in Human Pose Forecasting

要約 人間のポーズ予測は、観測されたポーズシーケンスのために複数の先物が存在する … 続きを読む

カテゴリー: cs.CV, eess.IV | MotionMap: Representing Multimodality in Human Pose Forecasting はコメントを受け付けていません

Curriculum Coarse-to-Fine Selection for High-IPC Dataset Distillation

要約 データセット蒸留(DD)は、クラスあたりの少数の画像(IPC)の合成に優れ … 続きを読む

カテゴリー: cs.CV | Curriculum Coarse-to-Fine Selection for High-IPC Dataset Distillation はコメントを受け付けていません