月別アーカイブ: 2025年3月

MindGYM: Enhancing Vision-Language Models via Synthetic Self-Challenging Questions

要約 大規模なビジョン言語モデル(VLM)は、労働集約型のマニュアル指導データセ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | MindGYM: Enhancing Vision-Language Models via Synthetic Self-Challenging Questions はコメントを受け付けていません

Double-Stage Feature-Level Clustering-Based Mixture of Experts Framework

要約 Experts(MOE)の混合モデルは、深い学習(DL)に成功しました。 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.LO | Double-Stage Feature-Level Clustering-Based Mixture of Experts Framework はコメントを受け付けていません

ViM-VQ: Efficient Post-Training Vector Quantization for Visual Mamba

要約 Visual Mamba Networks(VIMS)は、選択的宇宙状態モ … 続きを読む

カテゴリー: cs.CV | ViM-VQ: Efficient Post-Training Vector Quantization for Visual Mamba はコメントを受け付けていません

CM-Diff: A Single Generative Network for Bidirectional Cross-Modality Translation Diffusion Model Between Infrared and Visible Images

要約 画像翻訳方法は、赤外線および目に見えるモダリティの情報欠陥を緩和するための … 続きを読む

カテゴリー: cs.CV | CM-Diff: A Single Generative Network for Bidirectional Cross-Modality Translation Diffusion Model Between Infrared and Visible Images はコメントを受け付けていません

MaskFlow: Discrete Flows For Flexible and Efficient Long Video Generation

要約 空間的および時間的ダイナミクスとハードウェアの制限の複雑な相互作用により、 … 続きを読む

カテゴリー: cs.CV | MaskFlow: Discrete Flows For Flexible and Efficient Long Video Generation はコメントを受け付けていません

Patch-Wise Hypergraph Contrastive Learning with Dual Normal Distribution Weighting for Multi-Domain Stain Transfer

要約 仮想染色転送は、コンピューター支援技術を活用して、組織サンプルの組織化学染 … 続きを読む

カテゴリー: cs.CV | Patch-Wise Hypergraph Contrastive Learning with Dual Normal Distribution Weighting for Multi-Domain Stain Transfer はコメントを受け付けていません

CombatVLA: An Efficient Vision-Language-Action Model for Combat Tasks in 3D Action Role-Playing Games

要約 ビジョン言語アクションモデル(VLA)の最近の進歩により、具体化された知性 … 続きを読む

カテゴリー: cs.AI, cs.CV | CombatVLA: An Efficient Vision-Language-Action Model for Combat Tasks in 3D Action Role-Playing Games はコメントを受け付けていません

Evaluating Visual Explanations of Attention Maps for Transformer-based Medical Imaging

要約 視覚変圧器(VITS)は最近、医療画像の問題で優れた性能を示していますが、 … 続きを読む

カテゴリー: cs.AI, cs.CV | Evaluating Visual Explanations of Attention Maps for Transformer-based Medical Imaging はコメントを受け付けていません

GenHPE: Generative Counterfactuals for 3D Human Pose Estimation with Radio Frequency Signals

要約 人間のポーズ推定(HPE)は、さまざまな用途の人体関節の位置を検出します。 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM, eess.SP | GenHPE: Generative Counterfactuals for 3D Human Pose Estimation with Radio Frequency Signals はコメントを受け付けていません

Grounding Video Models to Actions through Goal Conditioned Exploration

要約 大量のインターネットビデオで事前に処理された大規模なビデオモデルは、オブジ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Grounding Video Models to Actions through Goal Conditioned Exploration はコメントを受け付けていません