月別アーカイブ: 2024年2月

InstanceDiffusion: Instance-level Control for Image Generation

投稿日: 2024年2月6日作成者: jarxiv

要約テキストから画像への拡散モデルは高品質な画像を生成するが、画像内の個々のイ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Zero-shot Object-Level OOD Detection with Context-Aware Inpainting

投稿日: 2024年2月6日作成者: jarxiv

要約機械学習アルゴリズムは、学習データにアクセスすることなく、ブラックボックス … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Swin-UMamba: Mamba-based UNet with ImageNet-based pretraining

投稿日: 2024年2月6日作成者: jarxiv

要約正確な医用画像セグメンテーションには、局所的な特徴から大域的な依存関係に至 … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Do Diffusion Models Learn Semantically Meaningful and Efficient Representations?

投稿日: 2024年2月6日作成者: jarxiv

要約拡散モデルは、宇宙飛行士が月面で馬に乗り、影が適切に配置されているような、 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

4D Gaussian Splatting: Towards Efficient Novel View Synthesis for Dynamic Scenes

投稿日: 2024年2月6日作成者: jarxiv

要約我々は動的なシーンに対する新規ビュー合成（NVS）の問題を考察する。最近の … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

AONeuS: A Neural Rendering Framework for Acoustic-Optical Sensor Fusion

投稿日: 2024年2月6日作成者: jarxiv

要約水中での知覚と3D表面の再構築は、建設、セキュリティ、海洋考古学、環境モニ … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

V-IRL: Grounding Virtual Intelligence in Real Life

投稿日: 2024年2月6日作成者: jarxiv

要約人間が住む地球と、現代のAIエージェントが作られるデジタル領域との間には、 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

HASSOD: Hierarchical Adaptive Self-Supervised Object Detection

投稿日: 2024年2月6日作成者: jarxiv

要約人間の視覚認識システムは、明示的な監視なしに学習することと、物体の部分から … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Test-Time Adaptation for Depth Completion

投稿日: 2024年2月6日作成者: jarxiv

要約ある（ソース）データセットで学習したモデルをターゲットのテストデータに転送 … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

LoTR: Low Tensor Rank Weight Adaptation

投稿日: 2024年2月6日作成者: jarxiv

要約本稿では、Transformerアーキテクチャに基づく大規模言語モデル(L … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

月別アーカイブ: 2024年2月

InstanceDiffusion: Instance-level Control for Image Generation

Zero-shot Object-Level OOD Detection with Context-Aware Inpainting

Swin-UMamba: Mamba-based UNet with ImageNet-based pretraining

Do Diffusion Models Learn Semantically Meaningful and Efficient Representations?

4D Gaussian Splatting: Towards Efficient Novel View Synthesis for Dynamic Scenes

AONeuS: A Neural Rendering Framework for Acoustic-Optical Sensor Fusion

V-IRL: Grounding Virtual Intelligence in Real Life

HASSOD: Hierarchical Adaptive Self-Supervised Object Detection

Test-Time Adaptation for Depth Completion

LoTR: Low Tensor Rank Weight Adaptation

最近の投稿

最近のコメント

アーカイブ

カテゴリー