月別アーカイブ: 2024年2月

InstanceDiffusion: Instance-level Control for Image Generation

要約 テキストから画像への拡散モデルは高品質な画像を生成するが、画像内の個々のイ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | InstanceDiffusion: Instance-level Control for Image Generation はコメントを受け付けていません

Zero-shot Object-Level OOD Detection with Context-Aware Inpainting

要約 機械学習アルゴリズムは、学習データにアクセスすることなく、ブラックボックス … 続きを読む

カテゴリー: cs.CV, cs.LG | Zero-shot Object-Level OOD Detection with Context-Aware Inpainting はコメントを受け付けていません

Swin-UMamba: Mamba-based UNet with ImageNet-based pretraining

要約 正確な医用画像セグメンテーションには、局所的な特徴から大域的な依存関係に至 … 続きを読む

カテゴリー: cs.CV, cs.LG | Swin-UMamba: Mamba-based UNet with ImageNet-based pretraining はコメントを受け付けていません

Do Diffusion Models Learn Semantically Meaningful and Efficient Representations?

要約 拡散モデルは、宇宙飛行士が月面で馬に乗り、影が適切に配置されているような、 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Do Diffusion Models Learn Semantically Meaningful and Efficient Representations? はコメントを受け付けていません

4D Gaussian Splatting: Towards Efficient Novel View Synthesis for Dynamic Scenes

要約 我々は動的なシーンに対する新規ビュー合成(NVS)の問題を考察する。最近の … 続きを読む

カテゴリー: cs.CV | 4D Gaussian Splatting: Towards Efficient Novel View Synthesis for Dynamic Scenes はコメントを受け付けていません

AONeuS: A Neural Rendering Framework for Acoustic-Optical Sensor Fusion

要約 水中での知覚と3D表面の再構築は、建設、セキュリティ、海洋考古学、環境モニ … 続きを読む

カテゴリー: cs.CV, cs.LG | AONeuS: A Neural Rendering Framework for Acoustic-Optical Sensor Fusion はコメントを受け付けていません

V-IRL: Grounding Virtual Intelligence in Real Life

要約 人間が住む地球と、現代のAIエージェントが作られるデジタル領域との間には、 … 続きを読む

カテゴリー: cs.AI, cs.CV | V-IRL: Grounding Virtual Intelligence in Real Life はコメントを受け付けていません

HASSOD: Hierarchical Adaptive Self-Supervised Object Detection

要約 人間の視覚認識システムは、明示的な監視なしに学習することと、物体の部分から … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | HASSOD: Hierarchical Adaptive Self-Supervised Object Detection はコメントを受け付けていません

Test-Time Adaptation for Depth Completion

要約 ある(ソース)データセットで学習したモデルをターゲットのテストデータに転送 … 続きを読む

カテゴリー: cs.CV, cs.LG | Test-Time Adaptation for Depth Completion はコメントを受け付けていません

LoTR: Low Tensor Rank Weight Adaptation

要約 本稿では、Transformerアーキテクチャに基づく大規模言語モデル(L … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | LoTR: Low Tensor Rank Weight Adaptation はコメントを受け付けていません