-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
A Comprehensive Survey on Deep-Learning-based Vehicle Re-Identification: Models, Data Sets and Challenges
要約 車両再識別 (ReID) は、さまざまな交通環境にわたるカメラの分散ネット … 続きを読む
IM-IAD: Industrial Image Anomaly Detection Benchmark in Manufacturing
要約 画像異常検出 (IAD) は、工業製造 (IM) における新たな重要なコン … 続きを読む
Weakly Supervised Gaussian Contrastive Grounding with Large Multimodal Models for Video Question Answering
要約 Video Question Answering (VideoQA) は、 … 続きを読む
Q&A Prompts: Discovering Rich Visual Clues through Mining Question-Answer Prompts for VQA requiring Diverse World Knowledge
要約 マルチモーダルな大規模言語モデルの画期的な進歩により、高度な推論能力と世界 … 続きを読む
Learning to Visually Connect Actions and their Effects
要約 この研究では、ビデオ理解におけるアクションとその効果を視覚的に接続する ( … 続きを読む
Understanding Video Transformers via Universal Concept Discovery
要約 この論文では、ビデオのトランス表現の概念ベースの解釈可能性の問題を研究しま … 続きを読む
Source-Free and Image-Only Unsupervised Domain Adaptation for Category Level Object Pose Estimation
要約 適応中にソースドメインデータや 3D アノテーションにアクセスせずに、RG … 続きを読む
GBSD: Generative Bokeh with Stage Diffusion
要約 ボケ効果は、写真内の焦点の合っていない領域をぼかす芸術的なテクニックであり … 続きを読む
SCENES: Subpixel Correspondence Estimation With Epipolar Supervision
要約 シーンの 2 つ以上のビューから点の対応関係を抽出することは、コンピュータ … 続きを読む
Synthesizing Moving People with 3D Control
要約 この論文では、特定のターゲット 3D モーション シーケンスに対して単一の … 続きを読む