月別アーカイブ: 2024年8月

Rethinking Video with a Universal Event-Based Representation

要約 従来、ビデオは一連の個別の画像フレームとして構造化されていました。 しかし … 続きを読む

カテゴリー: cs.CV, cs.MM | Rethinking Video with a Universal Event-Based Representation はコメントを受け付けていません

Context-aware Visual Storytelling with Visual Prefix Tuning and Contrastive Learning

要約 ビジュアル ストーリーテリング システムは、一連の画像から複数の文章からな … 続きを読む

カテゴリー: cs.CL, cs.CV | Context-aware Visual Storytelling with Visual Prefix Tuning and Contrastive Learning はコメントを受け付けていません

CT evaluation of 2D and 3D holistic deep learning methods for the volumetric segmentation of airway lesions

要約 この研究は、嚢胞性線維症 (CF) 病変に焦点を当て、2D 形式と 3D … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | CT evaluation of 2D and 3D holistic deep learning methods for the volumetric segmentation of airway lesions はコメントを受け付けていません

Mipmap-GS: Let Gaussians Deform with Scale-specific Mipmap for Anti-aliasing Rendering

要約 3D ガウス スプラッティング (3DGS) は、その優れたレンダリング効 … 続きを読む

カテゴリー: cs.CV | Mipmap-GS: Let Gaussians Deform with Scale-specific Mipmap for Anti-aliasing Rendering はコメントを受け付けていません

Toward a Surgeon-in-the-Loop Ophthalmic Robotic Apprentice using Reinforcement and Imitation Learning

要約 ロボット支援手術システムは、手術の精度を高め、人的ミスを最小限に抑える上で … 続きを読む

カテゴリー: cs.CV, cs.HC, cs.LG, cs.RO | Toward a Surgeon-in-the-Loop Ophthalmic Robotic Apprentice using Reinforcement and Imitation Learning はコメントを受け付けていません

OpenIns3D: Snap and Lookup for 3D Open-vocabulary Instance Segmentation

要約 この研究では、3D オープンボキャブラリーシーンを理解するための新しい 3 … 続きを読む

カテゴリー: cs.CV | OpenIns3D: Snap and Lookup for 3D Open-vocabulary Instance Segmentation はコメントを受け付けていません

Finding Patterns in Ambiguity: Interpretable Stress Testing in the Decision~Boundary

要約 さまざまなドメインでディープラーニングの使用が増加していることにより、これ … 続きを読む

カテゴリー: cs.CV, cs.LG | Finding Patterns in Ambiguity: Interpretable Stress Testing in the Decision~Boundary はコメントを受け付けていません

Long-Form Answers to Visual Questions from Blind and Low Vision People

要約 ビジョン言語モデルは、画像に関する質問に対する長い形式の回答、つまり長い形 … 続きを読む

カテゴリー: cs.CL, cs.CV | Long-Form Answers to Visual Questions from Blind and Low Vision People はコメントを受け付けていません

From SAM to SAM 2: Exploring Improvements in Meta’s Segment Anything Model

要約 2023 年 4 月に Meta によってコンピューター ビジョン コミュ … 続きを読む

カテゴリー: cs.CV | From SAM to SAM 2: Exploring Improvements in Meta’s Segment Anything Model はコメントを受け付けていません

EqNIO: Subequivariant Neural Inertial Odometry

要約 現在、ニューラル ネットワークは、慣性測定ユニット (IMU) データから … 続きを読む

カテゴリー: cs.CV, cs.RO | EqNIO: Subequivariant Neural Inertial Odometry はコメントを受け付けていません