投稿者「jarxiv」のアーカイブ

OneIG-Bench: Omni-dimensional Nuanced Evaluation for Image Generation

投稿日: 2025年6月10日作成者: jarxiv

要約テキストツーイメージ（T2I）モデルは、テキストプロンプトに沿った高品質の … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Real-time Localization of a Soccer Ball from a Single Camera

投稿日: 2025年6月10日作成者: jarxiv

要約単一のブロードキャストカメラからのリアルタイムの3次元フットボール軌道再構 … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

CXR-LT 2024: A MICCAI challenge on long-tailed, multi-label, and zero-shot disease classification from chest X-ray

投稿日: 2025年6月10日作成者: jarxiv

要約 CXR-LTシリーズは、胸部X線（CXR）を使用した肺疾患の分類を強化する … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Rethinking Crowd-Sourced Evaluation of Neuron Explanations

投稿日: 2025年6月10日作成者: jarxiv

要約アクティベーションの個々のニューロンまたは方向の解釈空間は、機械的解釈可能 … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Rethinking Cross-Modal Interaction in Multimodal Diffusion Transformers

投稿日: 2025年6月10日作成者: jarxiv

要約マルチモーダル拡散トランス（MM-DITS）は、テキスト駆動型の視覚生成に … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

PairEdit: Learning Semantic Variations for Exemplar-based Image Editing

投稿日: 2025年6月10日作成者: jarxiv

要約テキスト誘導画像編集における最近の進歩は、微調整されたセマンティックコント … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

UA-Pose: Uncertainty-Aware 6D Object Pose Estimation and Online Object Completion with Partial References

投稿日: 2025年6月10日作成者: jarxiv

要約 6Dオブジェクトのポーズ推定により、新しいオブジェクトが強力な一般化可能性 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Generative Modeling of Weights: Generalization or Memorization?

投稿日: 2025年6月10日作成者: jarxiv

要約イメージとビデオ生成に成功した生成モデルは、効果的なニューラルネットワーク … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

MADFormer: Mixed Autoregressive and Diffusion Transformers for Continuous Image Generation

投稿日: 2025年6月10日作成者: jarxiv

要約マルチモーダル生成の最近の進歩により、自己回帰（AR）と拡散ベースのアプロ … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

E3D-Bench: A Benchmark for End-to-End 3D Geometric Foundation Models

投稿日: 2025年6月10日作成者: jarxiv

要約 3D再構成、知覚、および推論を含む空間インテリジェンスは、ロボット工学、空 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

投稿者「jarxiv」のアーカイブ

OneIG-Bench: Omni-dimensional Nuanced Evaluation for Image Generation

Real-time Localization of a Soccer Ball from a Single Camera

CXR-LT 2024: A MICCAI challenge on long-tailed, multi-label, and zero-shot disease classification from chest X-ray

Rethinking Crowd-Sourced Evaluation of Neuron Explanations

Rethinking Cross-Modal Interaction in Multimodal Diffusion Transformers

PairEdit: Learning Semantic Variations for Exemplar-based Image Editing

UA-Pose: Uncertainty-Aware 6D Object Pose Estimation and Online Object Completion with Partial References

Generative Modeling of Weights: Generalization or Memorization?

MADFormer: Mixed Autoregressive and Diffusion Transformers for Continuous Image Generation

E3D-Bench: A Benchmark for End-to-End 3D Geometric Foundation Models

最近の投稿

最近のコメント

アーカイブ

カテゴリー