月別アーカイブ: 2024年2月

Denoising-Diffusion Alignment for Continuous Sign Language Recognition

投稿日: 2024年2月6日作成者: jarxiv

要約ソーシャルグッドへの鍵として、連続手話認識（CSLR）は聴覚障害者のための … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Organic or Diffused: Can We Distinguish Human Art from AI-generated Images?

投稿日: 2024年2月6日作成者: jarxiv

要約 AIによる画像生成の登場は、アートの世界を完全に破壊した。AIが生成した画 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

IGUANe: a 3D generalizable CycleGAN for multicenter harmonization of brain MR images

投稿日: 2024年2月6日作成者: jarxiv

要約 MRI研究では、複数の撮影部位からの画像データを集約することでサンプルサイ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

CT-based Anatomical Segmentation for Thoracic Surgical Planning: A Benchmark Study for 3D U-shaped Deep Learning Models

投稿日: 2024年2月6日作成者: jarxiv

要約近年、患者固有の胸部外科手術計画やシミュレーションに対する関心が高まってお … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

ActiveAnno3D – An Active Learning Framework for Multi-Modal 3D Object Detection

投稿日: 2024年2月6日作成者: jarxiv

要約大規模データセットのキュレーションは、依然としてコストがかかり、多くの時間 … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

FROSTER: Frozen CLIP Is A Strong Teacher for Open-Vocabulary Action Recognition

投稿日: 2024年2月6日作成者: jarxiv

要約本稿では、オープンボキャブラリーアクション認識のための効果的なフレームワー … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

SGS-SLAM: Semantic Gaussian Splatting For Neural Dense SLAM

投稿日: 2024年2月6日作成者: jarxiv

要約高密度同時定位マッピング(SLAM)では、意味理解が重要な役割を果たし、シ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

CLIP Can Understand Depth

投稿日: 2024年2月6日作成者: jarxiv

要約 CLIPの単眼奥行き推定への一般化に関する最近の研究により、ウェブクローリ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Towards a Flexible Scale-out Framework for Efficient Visual Data Query Processing

投稿日: 2024年2月6日作成者: jarxiv

要約画像のリサイズから複雑な機械学習モデルの実行まで、特殊な操作を伴うクエリを … 続きを読む →

カテゴリー: cs.CV, cs.DB | コメントを受け付けていません

Training-Free Consistent Text-to-Image Generation

投稿日: 2024年2月6日作成者: jarxiv

要約 Text-to-imageモデルは、ユーザが自然言語によって画像生成プロセ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG | コメントを受け付けていません

月別アーカイブ: 2024年2月

Denoising-Diffusion Alignment for Continuous Sign Language Recognition

Organic or Diffused: Can We Distinguish Human Art from AI-generated Images?

IGUANe: a 3D generalizable CycleGAN for multicenter harmonization of brain MR images

CT-based Anatomical Segmentation for Thoracic Surgical Planning: A Benchmark Study for 3D U-shaped Deep Learning Models

ActiveAnno3D – An Active Learning Framework for Multi-Modal 3D Object Detection

FROSTER: Frozen CLIP Is A Strong Teacher for Open-Vocabulary Action Recognition

SGS-SLAM: Semantic Gaussian Splatting For Neural Dense SLAM

CLIP Can Understand Depth

Towards a Flexible Scale-out Framework for Efficient Visual Data Query Processing

Training-Free Consistent Text-to-Image Generation

最近の投稿

最近のコメント

アーカイブ

カテゴリー