月別アーカイブ: 2025年3月

Repurposing Stable Diffusion Attention for Training-Free Unsupervised Interactive Segmentation

要約 インタラクティブポイントプロンプトベースの画像セグメンテーションの最近の進 … 続きを読む

カテゴリー: cs.AI, cs.CV | Repurposing Stable Diffusion Attention for Training-Free Unsupervised Interactive Segmentation はコメントを受け付けていません

SceneMI: Motion In-betweening for Modeling Human-Scene Interactions

要約 人間の相互作用(HSI)のモデリングは、日常の人間の行動を理解してシミュレ … 続きを読む

カテゴリー: cs.CV | SceneMI: Motion In-betweening for Modeling Human-Scene Interactions はコメントを受け付けていません

Unleashing Vecset Diffusion Model for Fast Shape Generation

要約 3D形状生成は、特にVECSET拡散モデル(VDM)を通じて、いわゆる「ネ … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | Unleashing Vecset Diffusion Model for Fast Shape Generation はコメントを受け付けていません

Unifying 2D and 3D Vision-Language Understanding

要約 3Dビジョン言語学習の進歩は、大規模な3Dデータセットの希少性によって妨げ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Unifying 2D and 3D Vision-Language Understanding はコメントを受け付けていません

Rapid patient-specific neural networks for intraoperative X-ray to volume registration

要約 画像誘導介入における人工知能の統合は、変革の可能性をもたらし、複雑な手順中 … 続きを読む

カテゴリー: cs.CV, eess.IV, physics.med-ph | Rapid patient-specific neural networks for intraoperative X-ray to volume registration はコメントを受け付けていません

Dynamic Point Maps: A Versatile Representation for Dynamic 3D Reconstruction

要約 Dust3Rは最近、カメラの内在性と外的性論の推定、3Dのシーンの再構築、 … 続きを読む

カテゴリー: cs.CV | Dynamic Point Maps: A Versatile Representation for Dynamic 3D Reconstruction はコメントを受け付けていません

Multi-Modal Foundation Models for Computational Pathology: A Survey

要約 基礎モデルは、計算病理学(CPATH)の強力なパラダイムとして浮上し、組織 … 続きを読む

カテゴリー: cs.AI, cs.CV | Multi-Modal Foundation Models for Computational Pathology: A Survey はコメントを受け付けていません

Ultra-Resolution Adaptation with Ease

要約 テキストからイメージへの拡散モデルは、近年顕著な進歩を遂げています。 ただ … 続きを読む

カテゴリー: cs.CV | Ultra-Resolution Adaptation with Ease はコメントを受け付けていません

Gaussian Graph Network: Learning Efficient and Generalizable Gaussian Representations from Multi-view Images

要約 3Dガウススプラッティング(3DGS)は、印象的な新規ビューの合成パフォー … 続きを読む

カテゴリー: cs.CV | Gaussian Graph Network: Learning Efficient and Generalizable Gaussian Representations from Multi-view Images はコメントを受け付けていません

CaKE: Circuit-aware Editing Enables Generalizable Knowledge Learners

要約 知識編集(KE)により、大規模な言語モデル(LLM)で時代遅れまたは誤った … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.IR, cs.LG | CaKE: Circuit-aware Editing Enables Generalizable Knowledge Learners はコメントを受け付けていません