-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「I.2.10」カテゴリーアーカイブ
Vulnerability of Automatic Identity Recognition to Audio-Visual Deepfakes
要約 ディープフェイク検出の課題は、音声や視覚の研究者によって解決されるには程遠 … 続きを読む
FutureHuman3D: Forecasting Complex Long-Term 3D Human Behavior from Video Observations
要約 我々は、容易に利用可能な 2D 人間の行動データからの弱い監視のみを必要と … 続きを読む
CG-HOI: Contact-Guided 3D Human-Object Interaction Generation
要約 我々は、テキストから動的な 3D 人間とオブジェクトのインタラクション ( … 続きを読む
Extraction and Summarization of Explicit Video Content using Multi-Modal Deep Learning
要約 インターネット上でビデオ共有プラットフォームが増加するにつれ、人間が露骨な … 続きを読む
On the Overconfidence Problem in Semantic 3D Mapping
要約 セマンティック 3D マッピングは、オブジェクト クラスで注釈が付けられた … 続きを読む
Towards Multi-User Activity Recognition through Facilitated Training Data and Deep Learning for Human-Robot Collaboration Applications
要約 ヒューマン ロボット インタラクション (HRI) 研究では、ロボットが同 … 続きを読む
Diffusion-based generation of Histopathological Whole Slide Images at a Gigapixel scale
要約 我々は、前例のないギガピクセルスケールで合成病理組織学的全スライド画像(W … 続きを読む
On Measuring Faithfulness of Natural Language Explanations
要約 大規模言語モデル (LLM) は、事後または思考連鎖 (CoT) の説明を … 続きを読む
Dense Visual Odometry Using Genetic Algorithm
要約 私たちの研究は、静止シーンの RGB-D 画像から移動ロボットや移動物体の … 続きを読む
Real-time Addressee Estimation: Deployment of a Deep-Learning Model on the iCub Robot
要約 宛先推定は、人が誰に向かって話しているのかを理解する能力であり、ソーシャル … 続きを読む