月別アーカイブ: 2024年6月

Open-Vocabulary Segmentation with Unpaired Mask-Text Supervision

要約 現在の最先端のオープン語彙セグメンテーション手法は、通常、監視のために画像 … 続きを読む

カテゴリー: cs.AI, cs.CV | Open-Vocabulary Segmentation with Unpaired Mask-Text Supervision はコメントを受け付けていません

Generated Contents Enrichment

要約 この論文では、生成コンテンツ エンリッチメント (GCE) と呼ばれる新し … 続きを読む

カテゴリー: cs.CV, cs.LG | Generated Contents Enrichment はコメントを受け付けていません

OphNet: A Large-Scale Video Benchmark for Ophthalmic Surgical Workflow Understanding

要約 ビデオによる手術シーンの認識は、特に眼科におけるロボット手術、遠隔手術、A … 続きを読む

カテゴリー: cs.CV | OphNet: A Large-Scale Video Benchmark for Ophthalmic Surgical Workflow Understanding はコメントを受け付けていません

Robust Inverse Graphics via Probabilistic Inference

要約 雨、雪、霧などの破損がある場合、1 つの画像から 3D シーンをどのように … 続きを読む

カテゴリー: cs.CV, stat.CO | Robust Inverse Graphics via Probabilistic Inference はコメントを受け付けていません

4Real: Towards Photorealistic 4D Scene Generation via Video Diffusion Models

要約 既存の動的シーン生成手法は主に、事前トレーニングされた 3D 生成モデルか … 続きを読む

カテゴリー: cs.CV | 4Real: Towards Photorealistic 4D Scene Generation via Video Diffusion Models はコメントを受け付けていません

VideoLLaMA 2: Advancing Spatial-Temporal Modeling and Audio Understanding in Video-LLMs

要約 このペーパーでは、ビデオおよびオーディオ指向のタスクにおける時空間モデリン … 続きを読む

カテゴリー: cs.CL, cs.CV | VideoLLaMA 2: Advancing Spatial-Temporal Modeling and Audio Understanding in Video-LLMs はコメントを受け付けていません

Image Neural Field Diffusion Models

要約 拡散モデルは、複雑なデータ分布をモデル化する優れた能力を示しており、安定し … 続きを読む

カテゴリー: cs.CV | Image Neural Field Diffusion Models はコメントを受け付けていません

Comparing Deep Learning Models for Rice Mapping in Bhutan Using High Resolution Satellite Imagery

要約 ブータン政府は、意思決定プロセスにリモート センシング ベースの知識を組み … 続きを読む

カテゴリー: cs.CV, cs.CY, cs.LG, physics.geo-ph | Comparing Deep Learning Models for Rice Mapping in Bhutan Using High Resolution Satellite Imagery はコメントを受け付けていません

3DGStream: On-the-Fly Training of 3D Gaussians for Efficient Streaming of Photo-Realistic Free-Viewpoint Videos

要約 マルチビュー ビデオからダイナミック シーンの写真のようにリアルな自由視点 … 続きを読む

カテゴリー: cs.CV | 3DGStream: On-the-Fly Training of 3D Gaussians for Efficient Streaming of Photo-Realistic Free-Viewpoint Videos はコメントを受け付けていません

GLAD: Towards Better Reconstruction with Global and Local Adaptive Diffusion Models for Unsupervised Anomaly Detection

要約 拡散モデルは、教師なしの異常検出タスクで優れたパフォーマンスを示しています … 続きを読む

カテゴリー: cs.CV | GLAD: Towards Better Reconstruction with Global and Local Adaptive Diffusion Models for Unsupervised Anomaly Detection はコメントを受け付けていません