cs.AI」カテゴリーアーカイブ

CombatVLA: An Efficient Vision-Language-Action Model for Combat Tasks in 3D Action Role-Playing Games

要約 ビジョン言語アクションモデル(VLA)の最近の進歩により、具体化された知性 … 続きを読む

カテゴリー: cs.AI, cs.CV | CombatVLA: An Efficient Vision-Language-Action Model for Combat Tasks in 3D Action Role-Playing Games はコメントを受け付けていません

Evaluating Visual Explanations of Attention Maps for Transformer-based Medical Imaging

要約 視覚変圧器(VITS)は最近、医療画像の問題で優れた性能を示していますが、 … 続きを読む

カテゴリー: cs.AI, cs.CV | Evaluating Visual Explanations of Attention Maps for Transformer-based Medical Imaging はコメントを受け付けていません

GenHPE: Generative Counterfactuals for 3D Human Pose Estimation with Radio Frequency Signals

要約 人間のポーズ推定(HPE)は、さまざまな用途の人体関節の位置を検出します。 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM, eess.SP | GenHPE: Generative Counterfactuals for 3D Human Pose Estimation with Radio Frequency Signals はコメントを受け付けていません

Grounding Video Models to Actions through Goal Conditioned Exploration

要約 大量のインターネットビデオで事前に処理された大規模なビデオモデルは、オブジ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Grounding Video Models to Actions through Goal Conditioned Exploration はコメントを受け付けていません

DAWN-FM: Data-Aware and Noise-Informed Flow Matching for Solving Inverse Problems

要約 不完全または騒々しい観察からのパラメーターの推定を含む逆問題は、医療イメー … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, eess.IV | DAWN-FM: Data-Aware and Noise-Informed Flow Matching for Solving Inverse Problems はコメントを受け付けていません

Detect, Investigate, Judge and Determine: A Knowledge-guided Framework for Few-shot Fake News Detection

要約 いくつかのショットの偽のニュース検出(FS-FND)は、非常に低いリソース … 続きを読む

カテゴリー: cs.AI, cs.CL | Detect, Investigate, Judge and Determine: A Knowledge-guided Framework for Few-shot Fake News Detection はコメントを受け付けていません

A Unified Framework for Motion Reasoning and Generation in Human Interaction

要約 大規模な言語モデル(LLMS)の最近の進歩により、自然で文脈的に関連するテ … 続きを読む

カテゴリー: cs.AI | A Unified Framework for Motion Reasoning and Generation in Human Interaction はコメントを受け付けていません

MsaMIL-Net: An End-to-End Multi-Scale Aware Multiple Instance Learning Network for Efficient Whole Slide Image Classification

要約 バッグベースの複数インスタンス学習(MIL)アプローチは、スライド画像全体 … 続きを読む

カテゴリー: cs.AI, cs.CV | MsaMIL-Net: An End-to-End Multi-Scale Aware Multiple Instance Learning Network for Efficient Whole Slide Image Classification はコメントを受け付けていません

HASARD: A Benchmark for Vision-Based Safe Reinforcement Learning in Embodied Agents

要約 強化学習(RL)を通じて安全な自律システムを進めるには、パフォーマンスを評 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | HASARD: A Benchmark for Vision-Based Safe Reinforcement Learning in Embodied Agents はコメントを受け付けていません

DexGrasp Anything: Towards Universal Robotic Dexterous Grasping with Physics Awareness

要約 あらゆるオブジェクトをつかむことができる器用な手は、汎用具体化されたインテ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | DexGrasp Anything: Towards Universal Robotic Dexterous Grasping with Physics Awareness はコメントを受け付けていません