月別アーカイブ: 2025年4月

GUI-R1 : A Generalist R1-Style Vision-Language Action Model For GUI Agents

投稿日: 2025年4月21日作成者: jarxiv

要約グラフィカルユーザーインターフェイス（GUI）エージェントの構築における既 … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.HC | コメントを受け付けていません

High-Resolution Frame Interpolation with Patch-based Cascaded Diffusion

投稿日: 2025年4月21日作成者: jarxiv

要約最近の進歩にもかかわらず、既存のフレーム補間方法は、非常に高解像度の入力の … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

CheXWorld: Exploring Image World Modeling for Radiograph Representation Learning

投稿日: 2025年4月21日作成者: jarxiv

要約人間は、常識的な知識をコードする内部の世界モデルを開発し、世界がどのように … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Outlier-Robust Multi-Model Fitting on Quantum Annealers

投稿日: 2025年4月21日作成者: jarxiv

要約マルチモデルフィッティング（MMF）は、特にその組み合わせの性質により、コ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Does Reinforcement Learning Really Incentivize Reasoning Capacity in LLMs Beyond the Base Model?

投稿日: 2025年4月21日作成者: jarxiv

要約検証可能な報酬（RLVR）による強化学習は最近、特に数学やプログラミングタ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

Transferrable Surrogates in Expressive Neural Architecture Search Spaces

投稿日: 2025年4月21日作成者: jarxiv

要約ニューラルアーキテクチャ検索（NAS）は、そのようなスペースを効果的に検索 … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

ODHSR: Online Dense 3D Reconstruction of Humans and Scenes from Monocular Videos

投稿日: 2025年4月21日作成者: jarxiv

要約人間中心の3D世界の認識において、単一の単眼内の野生のビデオフィギュアから … 続きを読む →

カテゴリー: cs.CV, I.4.5 | コメントを受け付けていません

Force and Speed in a Soft Stewart Platform

投稿日: 2025年4月21日作成者: jarxiv

要約多くのソフトロボットは、高速で大きな変位で動的な動きを生成するのに苦労して … 続きを読む →

カテゴリー: cs.RO | コメントを受け付けていません

Towards Cardiac MRI Foundation Models: Comprehensive Visual-Tabular Representations for Whole-Heart Assessment and Beyond

投稿日: 2025年4月21日作成者: jarxiv

要約心臓磁気共鳴画像法は、非侵襲的心臓評価のゴールドスタンダードであり、心臓の … 続きを読む →

カテゴリー: cs.AI, cs.CV, eess.IV | コメントを受け付けていません

SkyReels-V2: Infinite-length Film Generative Model

投稿日: 2025年4月21日作成者: jarxiv

要約ビデオ生成の最近の進歩は、拡散モデルと自己回帰フレームワークによって推進さ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

月別アーカイブ: 2025年4月

GUI-R1 : A Generalist R1-Style Vision-Language Action Model For GUI Agents

High-Resolution Frame Interpolation with Patch-based Cascaded Diffusion

CheXWorld: Exploring Image World Modeling for Radiograph Representation Learning

Outlier-Robust Multi-Model Fitting on Quantum Annealers

Does Reinforcement Learning Really Incentivize Reasoning Capacity in LLMs Beyond the Base Model?

Transferrable Surrogates in Expressive Neural Architecture Search Spaces

ODHSR: Online Dense 3D Reconstruction of Humans and Scenes from Monocular Videos

Force and Speed in a Soft Stewart Platform

Towards Cardiac MRI Foundation Models: Comprehensive Visual-Tabular Representations for Whole-Heart Assessment and Beyond

SkyReels-V2: Infinite-length Film Generative Model

最近の投稿

最近のコメント

アーカイブ

カテゴリー