月別アーカイブ: 2024年6月

CausalChaos! Dataset for Comprehensive Causal Action Question Answering Over Longer Causal Chains Grounded in Dynamic Visual Scenes

要約 因果関係のあるビデオ質問応答 (QA) はますます関心を集めていますが、既 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | CausalChaos! Dataset for Comprehensive Causal Action Question Answering Over Longer Causal Chains Grounded in Dynamic Visual Scenes はコメントを受け付けていません

Make It Count: Text-to-Image Generation with an Accurate Number of Objects

要約 テキストから画像への拡散モデルは前例のない成功を収めましたが、テキストを使 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR | Make It Count: Text-to-Image Generation with an Accurate Number of Objects はコメントを受け付けていません

DiffusionBlend: Learning 3D Image Prior through Position-aware Diffusion Score Blending for 3D Computed Tomography Reconstruction

要約 拡散モデルは、3D コンピュータ断層撮影 (CT) などの実際の現場で大規 … 続きを読む

カテゴリー: cs.CV | DiffusionBlend: Learning 3D Image Prior through Position-aware Diffusion Score Blending for 3D Computed Tomography Reconstruction はコメントを受け付けていません

NeST: Neural Stress Tensor Tomography by leveraging 3D Photoelasticity

要約 光弾性により、応力誘起複屈折を通じて透明物体の全視野応力解析が可能になりま … 続きを読む

カテゴリー: cs.CV, cs.GR | NeST: Neural Stress Tensor Tomography by leveraging 3D Photoelasticity はコメントを受け付けていません

PUP 3D-GS: Principled Uncertainty Pruning for 3D Gaussian Splatting

要約 新しいビュー合成の最近の進歩により、リアルタイムのレンダリング速度と高い再 … 続きを読む

カテゴリー: cs.CV, cs.GR | PUP 3D-GS: Principled Uncertainty Pruning for 3D Gaussian Splatting はコメントを受け付けていません

Short Film Dataset (SFD): A Benchmark for Story-Level Video Understanding

要約 視覚言語モデルの最近の進歩により、ビデオの理解が大幅に促進されました。 た … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Short Film Dataset (SFD): A Benchmark for Story-Level Video Understanding はコメントを受け付けていません

EFM3D: A Benchmark for Measuring Progress Towards 3D Egocentric Foundation Models

要約 ウェアラブル コンピューターの出現により、自己中心的なセンサー データに埋 … 続きを読む

カテゴリー: cs.CV | EFM3D: A Benchmark for Measuring Progress Towards 3D Egocentric Foundation Models はコメントを受け付けていません

SatDiffMoE: A Mixture of Estimation Method for Satellite Image Super-resolution with Latent Diffusion Models

要約 衛星画像の取得中、通常、衛星画像システムの搭載センサーにより、空間解像度と … 続きを読む

カテゴリー: cs.CV | SatDiffMoE: A Mixture of Estimation Method for Satellite Image Super-resolution with Latent Diffusion Models はコメントを受け付けていません

VideoGUI: A Benchmark for GUI Automation from Instructional Videos

要約 グラフィカル ユーザー インターフェイス (GUI) の自動化は、コンピュ … 続きを読む

カテゴリー: cs.AI, cs.CV | VideoGUI: A Benchmark for GUI Automation from Instructional Videos はコメントを受け付けていません

CinePile: A Long Video Question Answering Dataset and Benchmark

要約 長い形式のビデオを理解するための現在のデータセットは、ビデオから 1 つま … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.MM | CinePile: A Long Video Question Answering Dataset and Benchmark はコメントを受け付けていません