-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年6月
CausalChaos! Dataset for Comprehensive Causal Action Question Answering Over Longer Causal Chains Grounded in Dynamic Visual Scenes
要約 因果関係のあるビデオ質問応答 (QA) はますます関心を集めていますが、既 … 続きを読む
Make It Count: Text-to-Image Generation with an Accurate Number of Objects
要約 テキストから画像への拡散モデルは前例のない成功を収めましたが、テキストを使 … 続きを読む
DiffusionBlend: Learning 3D Image Prior through Position-aware Diffusion Score Blending for 3D Computed Tomography Reconstruction
要約 拡散モデルは、3D コンピュータ断層撮影 (CT) などの実際の現場で大規 … 続きを読む
カテゴリー: cs.CV
DiffusionBlend: Learning 3D Image Prior through Position-aware Diffusion Score Blending for 3D Computed Tomography Reconstruction はコメントを受け付けていません
NeST: Neural Stress Tensor Tomography by leveraging 3D Photoelasticity
要約 光弾性により、応力誘起複屈折を通じて透明物体の全視野応力解析が可能になりま … 続きを読む
PUP 3D-GS: Principled Uncertainty Pruning for 3D Gaussian Splatting
要約 新しいビュー合成の最近の進歩により、リアルタイムのレンダリング速度と高い再 … 続きを読む
Short Film Dataset (SFD): A Benchmark for Story-Level Video Understanding
要約 視覚言語モデルの最近の進歩により、ビデオの理解が大幅に促進されました。 た … 続きを読む
EFM3D: A Benchmark for Measuring Progress Towards 3D Egocentric Foundation Models
要約 ウェアラブル コンピューターの出現により、自己中心的なセンサー データに埋 … 続きを読む
カテゴリー: cs.CV
EFM3D: A Benchmark for Measuring Progress Towards 3D Egocentric Foundation Models はコメントを受け付けていません
SatDiffMoE: A Mixture of Estimation Method for Satellite Image Super-resolution with Latent Diffusion Models
要約 衛星画像の取得中、通常、衛星画像システムの搭載センサーにより、空間解像度と … 続きを読む
カテゴリー: cs.CV
SatDiffMoE: A Mixture of Estimation Method for Satellite Image Super-resolution with Latent Diffusion Models はコメントを受け付けていません
VideoGUI: A Benchmark for GUI Automation from Instructional Videos
要約 グラフィカル ユーザー インターフェイス (GUI) の自動化は、コンピュ … 続きを読む
CinePile: A Long Video Question Answering Dataset and Benchmark
要約 長い形式のビデオを理解するための現在のデータセットは、ビデオから 1 つま … 続きを読む