月別アーカイブ: 2025年4月

GUI-R1 : A Generalist R1-Style Vision-Language Action Model For GUI Agents

要約 グラフィカルユーザーインターフェイス(GUI)エージェントの構築における既 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.HC | GUI-R1 : A Generalist R1-Style Vision-Language Action Model For GUI Agents はコメントを受け付けていません

High-Resolution Frame Interpolation with Patch-based Cascaded Diffusion

要約 最近の進歩にもかかわらず、既存のフレーム補間方法は、非常に高解像度の入力の … 続きを読む

カテゴリー: cs.CV | High-Resolution Frame Interpolation with Patch-based Cascaded Diffusion はコメントを受け付けていません

CheXWorld: Exploring Image World Modeling for Radiograph Representation Learning

要約 人間は、常識的な知識をコードする内部の世界モデルを開発し、世界がどのように … 続きを読む

カテゴリー: cs.CV | CheXWorld: Exploring Image World Modeling for Radiograph Representation Learning はコメントを受け付けていません

Outlier-Robust Multi-Model Fitting on Quantum Annealers

要約 マルチモデルフィッティング(MMF)は、特にその組み合わせの性質により、コ … 続きを読む

カテゴリー: cs.CV | Outlier-Robust Multi-Model Fitting on Quantum Annealers はコメントを受け付けていません

Does Reinforcement Learning Really Incentivize Reasoning Capacity in LLMs Beyond the Base Model?

要約 検証可能な報酬(RLVR)による強化学習は最近、特に数学やプログラミングタ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Does Reinforcement Learning Really Incentivize Reasoning Capacity in LLMs Beyond the Base Model? はコメントを受け付けていません

Transferrable Surrogates in Expressive Neural Architecture Search Spaces

要約 ニューラルアーキテクチャ検索(NAS)は、そのようなスペースを効果的に検索 … 続きを読む

カテゴリー: cs.AI, cs.LG | Transferrable Surrogates in Expressive Neural Architecture Search Spaces はコメントを受け付けていません

ODHSR: Online Dense 3D Reconstruction of Humans and Scenes from Monocular Videos

要約 人間中心の3D世界の認識において、単一の単眼内の野生のビデオフィギュアから … 続きを読む

カテゴリー: cs.CV, I.4.5 | ODHSR: Online Dense 3D Reconstruction of Humans and Scenes from Monocular Videos はコメントを受け付けていません

Force and Speed in a Soft Stewart Platform

要約 多くのソフトロボットは、高速で大きな変位で動的な動きを生成するのに苦労して … 続きを読む

カテゴリー: cs.RO | Force and Speed in a Soft Stewart Platform はコメントを受け付けていません

Towards Cardiac MRI Foundation Models: Comprehensive Visual-Tabular Representations for Whole-Heart Assessment and Beyond

要約 心臓磁気共鳴画像法は、非侵襲的心臓評価のゴールドスタンダードであり、心臓の … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | Towards Cardiac MRI Foundation Models: Comprehensive Visual-Tabular Representations for Whole-Heart Assessment and Beyond はコメントを受け付けていません

SkyReels-V2: Infinite-length Film Generative Model

要約 ビデオ生成の最近の進歩は、拡散モデルと自己回帰フレームワークによって推進さ … 続きを読む

カテゴリー: cs.CV | SkyReels-V2: Infinite-length Film Generative Model はコメントを受け付けていません