月別アーカイブ: 2024年2月

Denoising-Diffusion Alignment for Continuous Sign Language Recognition

要約 ソーシャルグッドへの鍵として、連続手話認識(CSLR)は聴覚障害者のための … 続きを読む

カテゴリー: cs.CV | Denoising-Diffusion Alignment for Continuous Sign Language Recognition はコメントを受け付けていません

Organic or Diffused: Can We Distinguish Human Art from AI-generated Images?

要約 AIによる画像生成の登場は、アートの世界を完全に破壊した。AIが生成した画 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Organic or Diffused: Can We Distinguish Human Art from AI-generated Images? はコメントを受け付けていません

IGUANe: a 3D generalizable CycleGAN for multicenter harmonization of brain MR images

要約 MRI研究では、複数の撮影部位からの画像データを集約することでサンプルサイ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | IGUANe: a 3D generalizable CycleGAN for multicenter harmonization of brain MR images はコメントを受け付けていません

CT-based Anatomical Segmentation for Thoracic Surgical Planning: A Benchmark Study for 3D U-shaped Deep Learning Models

要約 近年、患者固有の胸部外科手術計画やシミュレーションに対する関心が高まってお … 続きを読む

カテゴリー: cs.CV, cs.LG | CT-based Anatomical Segmentation for Thoracic Surgical Planning: A Benchmark Study for 3D U-shaped Deep Learning Models はコメントを受け付けていません

ActiveAnno3D – An Active Learning Framework for Multi-Modal 3D Object Detection

要約 大規模データセットのキュレーションは、依然としてコストがかかり、多くの時間 … 続きを読む

カテゴリー: cs.CV, cs.LG | ActiveAnno3D – An Active Learning Framework for Multi-Modal 3D Object Detection はコメントを受け付けていません

FROSTER: Frozen CLIP Is A Strong Teacher for Open-Vocabulary Action Recognition

要約 本稿では、オープンボキャブラリーアクション認識のための効果的なフレームワー … 続きを読む

カテゴリー: cs.CV, cs.LG | FROSTER: Frozen CLIP Is A Strong Teacher for Open-Vocabulary Action Recognition はコメントを受け付けていません

SGS-SLAM: Semantic Gaussian Splatting For Neural Dense SLAM

要約 高密度同時定位マッピング(SLAM)では、意味理解が重要な役割を果たし、シ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | SGS-SLAM: Semantic Gaussian Splatting For Neural Dense SLAM はコメントを受け付けていません

CLIP Can Understand Depth

要約 CLIPの単眼奥行き推定への一般化に関する最近の研究により、ウェブクローリ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | CLIP Can Understand Depth はコメントを受け付けていません

Towards a Flexible Scale-out Framework for Efficient Visual Data Query Processing

要約 画像のリサイズから複雑な機械学習モデルの実行まで、特殊な操作を伴うクエリを … 続きを読む

カテゴリー: cs.CV, cs.DB | Towards a Flexible Scale-out Framework for Efficient Visual Data Query Processing はコメントを受け付けていません

Training-Free Consistent Text-to-Image Generation

要約 Text-to-imageモデルは、ユーザが自然言語によって画像生成プロセ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG | Training-Free Consistent Text-to-Image Generation はコメントを受け付けていません