-
最近の投稿
- GASLITEing the Retrieval: Exploring Vulnerabilities in Dense Embedding-based Search
- SyncDiff: Synchronized Motion Diffusion for Multi-Body Human-Object Interaction Synthesis
- Global SLAM in Visual-Inertial Systems with 5G Time-of-Arrival Integration
- Online Learning and Control for Data-Augmented Quadrotor Model
- Embodiment-Agnostic Navigation Policy Trained with Visual Demonstrations
-
最近のコメント
表示できるコメントはありません。 cs.AI (31596) cs.CL (23895) cs.CR (2452) cs.CV (37916) cs.LG (36465) cs.RO (18481) cs.SY (2824) eess.IV (4550) eess.SY (2818) stat.ML (4837)
月別アーカイブ: 2024年8月
Smart Multi-Modal Search: Contextual Sparse and Dense Embedding Integration in Adobe Express
要約 ユーザーのコンテンツとクエリがますますマルチモーダルになるにつれて、効果的 … 続きを読む
Towards Infusing Auxiliary Knowledge for Distracted Driver Detection
要約 わき見運転は世界的に交通事故の主な原因となっています。 注意散漫運転の特定 … 続きを読む
Verification of Geometric Robustness of Neural Networks via Piecewise Linear Approximation and Lipschitz Optimisation
要約 私たちは、回転、スケーリング、せん断、平行移動などの入力画像の幾何学的変換 … 続きを読む
Sparse Signal Reconstruction for Overdispersed Low-photon Count Biomedical Imaging Using $\ell_p$ Total Variation
要約 ポアソン分布モデルを一般化した負の二項モデルは、医療用画像処理などの低光子 … 続きを読む
Turbulence Strength $C_n^2$ Estimation from Video using Physics-based Deep Learning
要約 長距離から撮影した画像は、温度がランダムな空気セルの乱流により、屈折率が変 … 続きを読む
Trajectory Forecasting through Low-Rank Adaptation of Discrete Latent Codes
要約 軌跡予測は、一連のエージェント (例: エージェント) の将来の動きを予測 … 続きを読む
3D Pose-Based Temporal Action Segmentation for Figure Skating: A Fine-Grained and Jump Procedure-Aware Annotation Approach
要約 ビデオから人間の行動を理解することは、スポーツを含む多くの分野で不可欠です … 続きを読む
SODAWideNet++: Combining Attention and Convolutions for Salient Object Detection
要約 顕著なオブジェクト検出 (SOD) は従来、ImageNet の事前トレー … 続きを読む
カテゴリー: cs.CV
SODAWideNet++: Combining Attention and Convolutions for Salient Object Detection はコメントを受け付けていません
DriveGenVLM: Real-world Video Generation for Vision Language Model based Autonomous Driving
要約 自動運転技術の進歩により、現実世界のシナリオを理解して予測するための、ます … 続きを読む
Not (yet) the whole story: Evaluating Visual Storytelling Requires More than Measuring Coherence, Grounding, and Repetition
要約 視覚的なストーリーテリングは、時間的に順序付けられた一連の画像を与えられて … 続きを読む