cs.CV」カテゴリーアーカイブ

Chain-of-Action: Trajectory Autoregressive Modeling for Robotic Manipulation

要約 軌跡の自己回帰モデリングに基づいて構築された新しいVisuo-Motorポ … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | Chain-of-Action: Trajectory Autoregressive Modeling for Robotic Manipulation はコメントを受け付けていません

Text-Aware Image Restoration with Diffusion Models

要約 画像修復は、劣化した画像を回復することを目的としています。 しかし、既存の … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Text-Aware Image Restoration with Diffusion Models はコメントを受け付けていません

PlayerOne: Egocentric World Simulator

要約 鮮明に動的な環境内で没入型と無制限の探索を促進する、最初のエゴセントリック … 続きを読む

カテゴリー: cs.CV | PlayerOne: Egocentric World Simulator はコメントを受け付けていません

DGS-LRM: Real-Time Deformable 3D Gaussian Reconstruction From Monocular Videos

要約 変形可能なガウススプラット大きな再構成モデ​​ル(DGS-LRM)を紹介し … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG | DGS-LRM: Real-Time Deformable 3D Gaussian Reconstruction From Monocular Videos はコメントを受け付けていません

Fine-Grained Spatially Varying Material Selection in Images

要約 選択は、多くの画像編集プロセスの最初のステップであり、共通のモダリティを共 … 続きを読む

カテゴリー: cs.CV, cs.GR | Fine-Grained Spatially Varying Material Selection in Images はコメントを受け付けていません

MIRAGE: Multimodal foundation model and benchmark for comprehensive retinal OCT image analysis

要約 人工知能(AI)は、臨床医が光コヒーレンス断層撮影(OCT)などの眼科画像 … 続きを読む

カテゴリー: cs.CV | MIRAGE: Multimodal foundation model and benchmark for comprehensive retinal OCT image analysis はコメントを受け付けていません

Do Multiple Instance Learning Models Transfer?

要約 複数のインスタンス学習(MIL)は、ギガピクセル組織画像から臨床的に意味の … 続きを読む

カテゴリー: cs.CV | Do Multiple Instance Learning Models Transfer? はコメントを受け付けていません

Video-CoT: A Comprehensive Dataset for Spatiotemporal Understanding of Videos Based on Chain-of-Thought

要約 ビデオ分析からインタラクティブなシステムに至るまで、ビデオコンテンツの理解 … 続きを読む

カテゴリー: cs.CV | Video-CoT: A Comprehensive Dataset for Spatiotemporal Understanding of Videos Based on Chain-of-Thought はコメントを受け付けていません

Adapting Vision-Language Foundation Model for Next Generation Medical Ultrasound Image Analysis

要約 医学的超音波検査は、リンパ節、乳房、甲状腺などの表在臓器や組織を調べるため … 続きを読む

カテゴリー: cs.CV | Adapting Vision-Language Foundation Model for Next Generation Medical Ultrasound Image Analysis はコメントを受け付けていません

SkipVAR: Accelerating Visual Autoregressive Modeling via Adaptive Frequency-Aware Skipping

要約 視覚的自己回帰(VAR)モデルに関する最近の研究では、生成プロセスの高周波 … 続きを読む

カテゴリー: cs.CV | SkipVAR: Accelerating Visual Autoregressive Modeling via Adaptive Frequency-Aware Skipping はコメントを受け付けていません