-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年4月
V2X-DGW: Domain Generalization for Multi-agent Perception under Adverse Weather Conditions
要約 現在の LiDAR ベースの Vehicle-to-Everything … 続きを読む
カテゴリー: cs.CV
V2X-DGW: Domain Generalization for Multi-agent Perception under Adverse Weather Conditions はコメントを受け付けていません
You Only Sample Once: Taming One-Step Text-To-Image Synthesis by Self-Cooperative Diffusion GANs
要約 YOSO は、迅速かつスケーラブルで忠実度の高いワンステップ画像合成用に設 … 続きを読む
カテゴリー: cs.CV
You Only Sample Once: Taming One-Step Text-To-Image Synthesis by Self-Cooperative Diffusion GANs はコメントを受け付けていません
Rethinking Multi-view Representation Learning via Distilled Disentangling
要約 マルチビュー表現学習の目的は、多様なデータ ソースからビューの一貫性とビュ … 続きを読む
H2RSVLM: Towards Helpful and Honest Remote Sensing Large Vision Language Model
要約 一般的な大規模視覚言語モデル (VLM) は急速に開発されていますが、リモ … 続きを読む
カテゴリー: cs.CV
H2RSVLM: Towards Helpful and Honest Remote Sensing Large Vision Language Model はコメントを受け付けていません
Self-learning Canonical Space for Multi-view 3D Human Pose Estimation
要約 マルチビュー 3D 人間の姿勢推定は、当然ながら単一ビューの推定よりも優れ … 続きを読む
カテゴリー: cs.CV
Self-learning Canonical Space for Multi-view 3D Human Pose Estimation はコメントを受け付けていません
DragVideo: Interactive Drag-style Video Editing
要約 ビデオ生成モデルは、写真のようにリアルなビデオを生成する優れた能力を示して … 続きを読む
MTMMC: A Large-Scale Real-World Multi-Modal Camera Tracking Benchmark
要約 マルチターゲット マルチカメラ追跡は、複数のカメラからのビデオ ストリーム … 続きを読む
カテゴリー: cs.CV
MTMMC: A Large-Scale Real-World Multi-Modal Camera Tracking Benchmark はコメントを受け付けていません
3DInAction: Understanding Human Actions in 3D Point Clouds
要約 我々は、3D点群アクション認識のための新しい方法を提案します。 RGB ビ … 続きを読む
カテゴリー: cs.CV
3DInAction: Understanding Human Actions in 3D Point Clouds はコメントを受け付けていません
U-VAP: User-specified Visual Appearance Personalization via Decoupled Self Augmentation
要約 コンセプトのパーソナライゼーション手法により、大規模なテキストから画像への … 続きを読む
カテゴリー: cs.CV
U-VAP: User-specified Visual Appearance Personalization via Decoupled Self Augmentation はコメントを受け付けていません
Long-Tailed Anomaly Detection with Learnable Class Names
要約 異常検出 (AD) は、欠陥のある画像を特定し、その欠陥 (存在する場合) … 続きを読む
カテゴリー: cs.CV
Long-Tailed Anomaly Detection with Learnable Class Names はコメントを受け付けていません