cs.CV」カテゴリーアーカイブ

AOR: Anatomical Ontology-Guided Reasoning for Medical Large Multimodal Model in Chest X-Ray Interpretation

要約 胸部 X 線(CXR)は臨床現場で最も頻繁に行われる画像検査である。最近の … 続きを読む

カテゴリー: cs.CL, cs.CV | AOR: Anatomical Ontology-Guided Reasoning for Medical Large Multimodal Model in Chest X-Ray Interpretation はコメントを受け付けていません

No Other Representation Component Is Needed: Diffusion Transformers Can Provide Representation Guidance by Themselves

要約 最近の研究では、意味のある内部表現を学習することで、生成学習を高速化し、拡 … 続きを読む

カテゴリー: cs.CV | No Other Representation Component Is Needed: Diffusion Transformers Can Provide Representation Guidance by Themselves はコメントを受け付けていません

TWIST: Teleoperated Whole-Body Imitation System

要約 ヒューマノイドロボットを全身で遠隔操作することは、汎用的なロボット知能を開 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | TWIST: Teleoperated Whole-Body Imitation System はコメントを受け付けていません

R1-Reward: Training Multimodal Reward Model Through Stable Reinforcement Learning

要約 マルチモーダル報酬モデル(MRM)は、マルチモーダル大規模言語モデル(ML … 続きを読む

カテゴリー: cs.CL, cs.CV | R1-Reward: Training Multimodal Reward Model Through Stable Reinforcement Learning はコメントを受け付けていません

Scenethesis: A Language and Vision Agentic Framework for 3D Scene Generation

要約 テキストからインタラクティブな3Dシーンを合成することは、ゲーム、バーチャ … 続きを読む

カテゴリー: cs.CV | Scenethesis: A Language and Vision Agentic Framework for 3D Scene Generation はコメントを受け付けていません

TSTMotion: Training-free Scene-aware Text-to-motion Generation

要約 テキスト-トゥ-モーション生成は、最近、主に空白の背景における人間の動きシ … 続きを読む

カテゴリー: cs.AI, cs.CV | TSTMotion: Training-free Scene-aware Text-to-motion Generation はコメントを受け付けていません

Autonomous Embodied Agents: When Robotics Meets Deep Learning Reasoning

要約 利用可能な計算能力の向上とディープラーニング革命により、人工知能研究におけ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Autonomous Embodied Agents: When Robotics Meets Deep Learning Reasoning はコメントを受け付けていません

DriveGPT: Scaling Autoregressive Behavior Models for Driving

要約 我々は、自律走行のためのスケーラブルな行動モデルであるDriveGPTを発 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | DriveGPT: Scaling Autoregressive Behavior Models for Driving はコメントを受け付けていません

Optimizing Indoor Farm Monitoring Efficiency Using UAV: Yield Estimation in a GNSS-Denied Cherry Tomato Greenhouse

要約 農業従事者の減少や人件費の高騰に伴い、ロボットによる収穫量推定の重要性が増 … 続きを読む

カテゴリー: cs.CV, cs.RO | Optimizing Indoor Farm Monitoring Efficiency Using UAV: Yield Estimation in a GNSS-Denied Cherry Tomato Greenhouse はコメントを受け付けていません

Towards the Resistance of Neural Network Watermarking to Fine-tuning

要約 本稿では、ディープニューラルネットワーク(DNN)に所有者情報を埋め込むた … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Towards the Resistance of Neural Network Watermarking to Fine-tuning はコメントを受け付けていません