月別アーカイブ: 2024年6月

CausalChaos! Dataset for Comprehensive Causal Action Question Answering Over Longer Causal Chains Grounded in Dynamic Visual Scenes

投稿日: 2024年6月17日作成者: jarxiv

要約因果関係のあるビデオ質問応答 (QA) はますます関心を集めていますが、既 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

Make It Count: Text-to-Image Generation with an Accurate Number of Objects

投稿日: 2024年6月17日作成者: jarxiv

要約テキストから画像への拡散モデルは前例のない成功を収めましたが、テキストを使 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.GR | コメントを受け付けていません

DiffusionBlend: Learning 3D Image Prior through Position-aware Diffusion Score Blending for 3D Computed Tomography Reconstruction

投稿日: 2024年6月17日作成者: jarxiv

要約拡散モデルは、3D コンピュータ断層撮影 (CT) などの実際の現場で大規 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

NeST: Neural Stress Tensor Tomography by leveraging 3D Photoelasticity

投稿日: 2024年6月17日作成者: jarxiv

要約光弾性により、応力誘起複屈折を通じて透明物体の全視野応力解析が可能になりま … 続きを読む →

カテゴリー: cs.CV, cs.GR | コメントを受け付けていません

PUP 3D-GS: Principled Uncertainty Pruning for 3D Gaussian Splatting

投稿日: 2024年6月17日作成者: jarxiv

要約新しいビュー合成の最近の進歩により、リアルタイムのレンダリング速度と高い再 … 続きを読む →

カテゴリー: cs.CV, cs.GR | コメントを受け付けていません

Short Film Dataset (SFD): A Benchmark for Story-Level Video Understanding

投稿日: 2024年6月17日作成者: jarxiv

要約視覚言語モデルの最近の進歩により、ビデオの理解が大幅に促進されました。た … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

EFM3D: A Benchmark for Measuring Progress Towards 3D Egocentric Foundation Models

投稿日: 2024年6月17日作成者: jarxiv

要約ウェアラブルコンピューターの出現により、自己中心的なセンサーデータに埋 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

SatDiffMoE: A Mixture of Estimation Method for Satellite Image Super-resolution with Latent Diffusion Models

投稿日: 2024年6月17日作成者: jarxiv

要約衛星画像の取得中、通常、衛星画像システムの搭載センサーにより、空間解像度と … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

VideoGUI: A Benchmark for GUI Automation from Instructional Videos

投稿日: 2024年6月17日作成者: jarxiv

要約グラフィカルユーザーインターフェイス (GUI) の自動化は、コンピュ … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

CinePile: A Long Video Question Answering Dataset and Benchmark

投稿日: 2024年6月17日作成者: jarxiv

要約長い形式のビデオを理解するための現在のデータセットは、ビデオから 1 つま … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.MM | コメントを受け付けていません

月別アーカイブ: 2024年6月

CausalChaos! Dataset for Comprehensive Causal Action Question Answering Over Longer Causal Chains Grounded in Dynamic Visual Scenes

Make It Count: Text-to-Image Generation with an Accurate Number of Objects

DiffusionBlend: Learning 3D Image Prior through Position-aware Diffusion Score Blending for 3D Computed Tomography Reconstruction

NeST: Neural Stress Tensor Tomography by leveraging 3D Photoelasticity

PUP 3D-GS: Principled Uncertainty Pruning for 3D Gaussian Splatting

Short Film Dataset (SFD): A Benchmark for Story-Level Video Understanding

EFM3D: A Benchmark for Measuring Progress Towards 3D Egocentric Foundation Models

SatDiffMoE: A Mixture of Estimation Method for Satellite Image Super-resolution with Latent Diffusion Models

VideoGUI: A Benchmark for GUI Automation from Instructional Videos

CinePile: A Long Video Question Answering Dataset and Benchmark

最近の投稿

最近のコメント

アーカイブ

カテゴリー