cs.CV」カテゴリーアーカイブ

Hierarchical Graph Interaction Transformer with Dynamic Token Clustering for Camouflaged Object Detection

要約 カモフラージュオブジェクト検出 (COD) は、周囲の背景にシームレスに溶 … 続きを読む

カテゴリー: cs.CV | Hierarchical Graph Interaction Transformer with Dynamic Token Clustering for Camouflaged Object Detection はコメントを受け付けていません

Sequence-aware Pre-training for Echocardiography Probe Guidance

要約 心臓超音波プローブのガイダンスは、初心者が 6-DOF プローブの姿勢を調 … 続きを読む

カテゴリー: cs.AI, cs.CV | Sequence-aware Pre-training for Echocardiography Probe Guidance はコメントを受け付けていません

Mamba2MIL: State Space Duality Based Multiple Instance Learning for Computational Pathology

要約 コンピューター病理学 (CPath) は、病理学の臨床実践を大幅に進歩させ … 続きを読む

カテゴリー: cs.AI, cs.CV | Mamba2MIL: State Space Duality Based Multiple Instance Learning for Computational Pathology はコメントを受け付けていません

FPO++: Efficient Encoding and Rendering of Dynamic Neural Radiance Fields by Analyzing and Enhancing Fourier PlenOctrees

要約 Fourier PlenOctree は、動的 Neural Radian … 続きを読む

カテゴリー: cs.CV, cs.GR | FPO++: Efficient Encoding and Rendering of Dynamic Neural Radiance Fields by Analyzing and Enhancing Fourier PlenOctrees はコメントを受け付けていません

Interactive Occlusion Boundary Estimation through Exploitation of Synthetic Data

要約 オクルージョン境界 (OB) は、2D 画像内のオクルージョン イベントを … 続きを読む

カテゴリー: cs.CV | Interactive Occlusion Boundary Estimation through Exploitation of Synthetic Data はコメントを受け付けていません

DocLayLLM: An Efficient and Effective Multi-modal Extension of Large Language Models for Text-rich Document Understanding

要約 テキストリッチ文書理解 (TDU) とは、実質的なテキストコンテンツを含む … 続きを読む

カテゴリー: cs.CV | DocLayLLM: An Efficient and Effective Multi-modal Extension of Large Language Models for Text-rich Document Understanding はコメントを受け付けていません

TAAT: Think and Act from Arbitrary Texts in Text2Motion

要約 Text to Motion は、テキストから人間の動きを生成することを目 … 続きを読む

カテゴリー: cs.CV | TAAT: Think and Act from Arbitrary Texts in Text2Motion はコメントを受け付けていません

Attention is All They Need: Exploring the Media Archaeology of the Computer Vision Research Paper

要約 研究論文は、テキスト文書に加えて、研究者がコミュニケーションをとるために設 … 続きを読む

カテゴリー: cs.CV, cs.CY, K.7.m | Attention is All They Need: Exploring the Media Archaeology of the Computer Vision Research Paper はコメントを受け付けていません

3D Adaptive Structural Convolution Network for Domain-Invariant Point Cloud Recognition

要約 自動運転車の点群データ認識にディープラーニング ネットワークを適応させるこ … 続きを読む

カテゴリー: cs.AI, cs.CV, I.2.10 | 3D Adaptive Structural Convolution Network for Domain-Invariant Point Cloud Recognition はコメントを受け付けていません

Adapting Segment Anything Model to Multi-modal Salient Object Detection with Semantic Feature Fusion Guidance

要約 既存のマルチモーダル顕著物体検出 (SOD) 手法のほとんどは、モデルを最 … 続きを読む

カテゴリー: cs.CV | Adapting Segment Anything Model to Multi-modal Salient Object Detection with Semantic Feature Fusion Guidance はコメントを受け付けていません