-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Aligning Latent Spaces with Flow Priors
要約 このペーパーでは、流れベースの生成モデルを事前に活用することにより、学習可 … 続きを読む
DEFAME: Dynamic Evidence-based FAct-checking with Multimodal Experts
要約 偽情報の拡散は、信頼性が高くスケーラブルな事実確認ソリューションを必要とし … 続きを読む
Spatiotemporal Contrastive Learning for Cross-View Video Localization in Unstructured Off-road Terrains
要約 GPSが除外するオフロード環境における堅牢なクロスビュー3-DOFローカリ … 続きを読む
LeanPO: Lean Preference Optimization for Likelihood Alignment in Video-LLMs
要約 ほとんどのビデオ大規模な言語モデル(ビデオ-LLM)は、優先アライメント手 … 続きを読む
カテゴリー: cs.CV
LeanPO: Lean Preference Optimization for Likelihood Alignment in Video-LLMs はコメントを受け付けていません
Can Foundation Models Generalise the Presentation Attack Detection Capabilities on ID Cards?
要約 現在、IDカードのプレゼンテーション攻撃検出(PAD)の主な課題の1つは、 … 続きを読む
カテゴリー: cs.CV
Can Foundation Models Generalise the Presentation Attack Detection Capabilities on ID Cards? はコメントを受け付けていません
From Play to Replay: Composed Video Retrieval for Temporally Fine-Grained Videos
要約 Composed Video Retrieval(COVR)は、クエリビデ … 続きを読む
カテゴリー: cs.CV
From Play to Replay: Composed Video Retrieval for Temporally Fine-Grained Videos はコメントを受け付けていません
Unifying Appearance Codes and Bilateral Grids for Driving Scene Gaussian Splatting
要約 NERFやGaussian Splatting(GS)を含むニューラルレン … 続きを読む
カテゴリー: cs.CV
Unifying Appearance Codes and Bilateral Grids for Driving Scene Gaussian Splatting はコメントを受け付けていません
Rectified Point Flow: Generic Point Cloud Pose Estimation
要約 ペアワイズポイントクラウド登録とマルチパート形状アセンブリを単一の条件付き … 続きを読む
Video World Models with Long-term Spatial Memory
要約 新しい世界モデルは、カメラの動きやテキストプロンプトなどのアクションに応じ … 続きを読む
カテゴリー: cs.CV
Video World Models with Long-term Spatial Memory はコメントを受け付けていません
RaySt3R: Predicting Novel Depth Maps for Zero-Shot Object Completion
要約 3D Shape Compleyは、ロボット工学、デジタルツイン再建、およ … 続きを読む
カテゴリー: cs.CV
RaySt3R: Predicting Novel Depth Maps for Zero-Shot Object Completion はコメントを受け付けていません