「cs.LG」カテゴリーアーカイブ

Diffuse Everything: Multimodal Diffusion Models on Arbitrary State Spaces

投稿日: 2025年6月10日作成者: jarxiv

要約拡散モデルは、画像、ビデオ、テキスト生成など、さまざまなタスクで単峰性デー … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

A Comparative Study of U-Net Architectures for Change Detection in Satellite Images

投稿日: 2025年6月10日作成者: jarxiv

要約リモートセンシングの変化の検出は、地球の絶えず変化する風景を監視するために … 続きを読む →

カテゴリー: cs.CV, cs.LG, eess.IV | コメントを受け付けていません

Squeeze3D: Your 3D Generation Model is Secretly an Extreme Neural Compressor

投稿日: 2025年6月10日作成者: jarxiv

要約 Squeeze3Dを提案します。これは、非常に高い圧縮比で3Dデータを圧縮 … 続きを読む →

カテゴリー: cs.CV, cs.GR, cs.LG | コメントを受け付けていません

Mimicking or Reasoning: Rethinking Multi-Modal In-Context Learning in Vision-Language Models

投稿日: 2025年6月10日作成者: jarxiv

要約ビジョン言語モデル（VLM）は、言語のみの対応物の特性と同様の特性であるコ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

Real-time Localization of a Soccer Ball from a Single Camera

投稿日: 2025年6月10日作成者: jarxiv

要約単一のブロードキャストカメラからのリアルタイムの3次元フットボール軌道再構 … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

CXR-LT 2024: A MICCAI challenge on long-tailed, multi-label, and zero-shot disease classification from chest X-ray

投稿日: 2025年6月10日作成者: jarxiv

要約 CXR-LTシリーズは、胸部X線（CXR）を使用した肺疾患の分類を強化する … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Rethinking Crowd-Sourced Evaluation of Neuron Explanations

投稿日: 2025年6月10日作成者: jarxiv

要約アクティベーションの個々のニューロンまたは方向の解釈空間は、機械的解釈可能 … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Generative Modeling of Weights: Generalization or Memorization?

投稿日: 2025年6月10日作成者: jarxiv

要約イメージとビデオ生成に成功した生成モデルは、効果的なニューラルネットワーク … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

MADFormer: Mixed Autoregressive and Diffusion Transformers for Continuous Image Generation

投稿日: 2025年6月10日作成者: jarxiv

要約マルチモーダル生成の最近の進歩により、自己回帰（AR）と拡散ベースのアプロ … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Hidden in plain sight: VLMs overlook their visual representations

投稿日: 2025年6月10日作成者: jarxiv

要約言語は、視覚タスクのパフォーマンスを指定および評価するための自然なインター … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません