-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Corn Ear Detection and Orientation Estimation Using Deep Learning
要約 穂の発達などのトウモロコシ植物の成長挙動を監視すると、植物の健康状態と発育 … 続きを読む
G-VEval: A Versatile Metric for Evaluating Image and Video Captions Using GPT-4o
要約 視覚的なキャプションの評価指標は重要ですが、十分に検討されていません。 B … 続きを読む
Dream to Manipulate: Compositional World Models Empowering Robot Imitation Learning with Imagination
要約 世界モデルは、エージェントにその環境の表現を提供し、エージェントがその行動 … 続きを読む
TDCNet: Transparent Objects Depth Completion with CNN-Transformer Dual-Branch Parallel Network
要約 透明な物体の感知と操作は、産業用および実験用ロボット工学において重大な課題 … 続きを読む
カテゴリー: cs.CV
TDCNet: Transparent Objects Depth Completion with CNN-Transformer Dual-Branch Parallel Network はコメントを受け付けていません
IDOL: Instant Photorealistic 3D Human Creation from a Single Image
要約 人間の外観やポーズは多様であり、利用できる高品質のトレーニング データが限 … 続きを読む
Movie2Story: A framework for understanding videos and telling stories in the form of novel text
要約 マルチモーダルビデオからテキストへのモデルは、主にビデオコンテンツの簡単な … 続きを読む
PhotoHolmes: a Python library for forgery detection in digital images
要約 このペーパーでは、デジタル画像に対する偽造検出方法を簡単に実行してベンチマ … 続きを読む
カテゴリー: cs.CV
PhotoHolmes: a Python library for forgery detection in digital images はコメントを受け付けていません
Arti-PG: A Toolbox for Procedurally Synthesizing Large-Scale and Diverse Articulated Objects with Rich Annotations
要約 相当量の 3D 多関節オブジェクト データの取得には費用と時間がかかり、そ … 続きを読む
Optimized Gradient Clipping for Noisy Label Learning
要約 これまでの研究では、モデルの予測確率に関して損失関数の勾配を制約すると、ノ … 続きを読む
Stitch Contrast and Segment_Learning a Human Action Segmentation Model Using Trimmed Skeleton Videos
要約 既存のスケルトンベースの人間の行動分類モデルは、トレーニングとテストの両方 … 続きを読む