cs.CV」カテゴリーアーカイブ

Can Foundation Models Really Segment Tumors? A Benchmarking Odyssey in Lung CT Imaging

要約 正確な肺腫瘍のセグメンテーションは、腫瘍学の診断、治療計画、患者の転帰を改 … 続きを読む

カテゴリー: cs.CV, eess.IV | Can Foundation Models Really Segment Tumors? A Benchmarking Odyssey in Lung CT Imaging はコメントを受け付けていません

Fusing Foveal Fixations Using Linear Retinal Transformations and Bayesian Experimental Design

要約 人間(および多くの脊椎動物)は、シーンの複数の固視を融合して全体の表現を得 … 続きを読む

カテゴリー: cs.CV, cs.LG | Fusing Foveal Fixations Using Linear Retinal Transformations and Bayesian Experimental Design はコメントを受け付けていません

CAMELTrack: Context-Aware Multi-cue ExpLoitation for Online Multi-Object Tracking

要約 オンラインマルチオブジェクトトラッキングは、トラックレット表現、特徴フュー … 続きを読む

カテゴリー: cs.CV, cs.LG | CAMELTrack: Context-Aware Multi-cue ExpLoitation for Online Multi-Object Tracking はコメントを受け付けていません

FlowDubber: Movie Dubbing with LLM-based Semantic-aware Learning and Flow Matching based Voice Enhancing

要約 ムービーダビングは、与えられた短い参照音声のボーカルの音色を維持しながら、 … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | FlowDubber: Movie Dubbing with LLM-based Semantic-aware Learning and Flow Matching based Voice Enhancing はコメントを受け付けていません

Diffusion-based Adversarial Purification from the Perspective of the Frequency Domain

要約 拡散に基づく敵対的浄化法は、順方向処理によって敵対的摂動を等方性ノイズの一 … 続きを読む

カテゴリー: cs.CV | Diffusion-based Adversarial Purification from the Perspective of the Frequency Domain はコメントを受け付けていません

MASH: Masked Anchored SpHerical Distances for 3D Shape Representation and Generation

要約 我々は、3D形状の新しいマルチビュー・パラメトリック表現であるMasked … 続きを読む

カテゴリー: cs.CG, cs.CV | MASH: Masked Anchored SpHerical Distances for 3D Shape Representation and Generation はコメントを受け付けていません

A Neural Architecture Search Method using Auxiliary Evaluation Metric based on ResNet Architecture

要約 本稿では、ResNetをフレームワークとして用いたニューラル・アーキテクチ … 続きを読む

カテゴリー: cs.CV, cs.NE | A Neural Architecture Search Method using Auxiliary Evaluation Metric based on ResNet Architecture はコメントを受け付けていません

FreeInsert: Disentangled Text-Guided Object Insertion in 3D Gaussian Scene without Spatial Priors

要約 3Dシーンにおけるテキスト駆動オブジェクト挿入は、自然言語による直感的なシ … 続きを読む

カテゴリー: cs.CV | FreeInsert: Disentangled Text-Guided Object Insertion in 3D Gaussian Scene without Spatial Priors はコメントを受け付けていません

Soybean Disease Detection via Interpretable Hybrid CNN-GNN: Integrating MobileNetV2 and GraphSAGE with Cross-Modal Attention

要約 大豆の葉の病害検出は農業生産性にとって重要であるが、従来の方法では視覚的に … 続きを読む

カテゴリー: cs.CV, cs.LG | Soybean Disease Detection via Interpretable Hybrid CNN-GNN: Integrating MobileNetV2 and GraphSAGE with Cross-Modal Attention はコメントを受け付けていません

Project-and-Fuse: Improving RGB-D Semantic Segmentation via Graph Convolution Networks

要約 既存のRGB-Dセマンティックセグメンテーション手法の多くは、複雑なクロス … 続きを読む

カテゴリー: cs.CV | Project-and-Fuse: Improving RGB-D Semantic Segmentation via Graph Convolution Networks はコメントを受け付けていません