投稿者「jarxiv」のアーカイブ

Can Test-Time Scaling Improve World Foundation Model?

投稿日: 2025年4月1日作成者: jarxiv

要約現在の観測と入力から将来の状態を予測することにより物理的世界をシミュレート … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Self-Supervised Pretraining for Aerial Road Extraction

投稿日: 2025年4月1日作成者: jarxiv

要約航空画像セグメンテーションのための深いニューラルネットワークには、大量のラ … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

PathOrchestra: A Comprehensive Foundation Model for Computational Pathology with Over 100 Diverse Clinical-Grade Tasks

投稿日: 2025年4月1日作成者: jarxiv

要約高解像度の病理学的画像に固有の複雑さと変動性は、計算病理学に重要な課題をも … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

ORAL: Prompting Your Large-Scale LoRAs via Conditional Recurrent Diffusion

投稿日: 2025年4月1日作成者: jarxiv

要約パラメーター生成は、ニューラルネットワーク開発の新しいパラダイムとして浮上 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

InstructRestore: Region-Customized Image Restoration with Human Instructions

投稿日: 2025年4月1日作成者: jarxiv

要約拡散前ベースの画像修復の大幅な進歩にもかかわらず、ほとんどの既存の方法は画 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

StochasticSplats: Stochastic Rasterization for Sorting-Free 3D Gaussian Splatting

投稿日: 2025年4月1日作成者: jarxiv

要約 3D Gaussian Splatting（3DGS）は、多くのアプリケー … 続きを読む →

カテゴリー: cs.CV, cs.GR | コメントを受け付けていません

Adapting Vision Foundation Models for Real-time Ultrasound Image Segmentation

投稿日: 2025年4月1日作成者: jarxiv

要約リアルタイムの超音波画像セグメンテーションのために階層ビジョンファンデーシ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

ERUPT: Efficient Rendering with Unposed Patch Transformer

投稿日: 2025年4月1日作成者: jarxiv

要約この作品は、RGB画像の小さなコレクションからの多様なシーンでの新しいビュ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Exploring the Effect of Reinforcement Learning on Video Understanding: Insights from SEED-Bench-R1

投稿日: 2025年4月1日作成者: jarxiv

要約 Chain of Thound（COT）の最近の進歩により、大規模な言語モ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

Any2Caption:Interpreting Any Condition to Caption for Controllable Video Generation

投稿日: 2025年4月1日作成者: jarxiv

要約現在のビデオ生成コミュニティ内の正確なユーザー意図解釈のボトルネックに対処 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

投稿者「jarxiv」のアーカイブ

Can Test-Time Scaling Improve World Foundation Model?

Self-Supervised Pretraining for Aerial Road Extraction

PathOrchestra: A Comprehensive Foundation Model for Computational Pathology with Over 100 Diverse Clinical-Grade Tasks

ORAL: Prompting Your Large-Scale LoRAs via Conditional Recurrent Diffusion

InstructRestore: Region-Customized Image Restoration with Human Instructions

StochasticSplats: Stochastic Rasterization for Sorting-Free 3D Gaussian Splatting

Adapting Vision Foundation Models for Real-time Ultrasound Image Segmentation

ERUPT: Efficient Rendering with Unposed Patch Transformer

Exploring the Effect of Reinforcement Learning on Video Understanding: Insights from SEED-Bench-R1

Any2Caption:Interpreting Any Condition to Caption for Controllable Video Generation

最近の投稿

最近のコメント

アーカイブ

カテゴリー