-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年5月
Audio-Visual Speech Representation Expert for Enhanced Talking Face Video Generation and Evaluation
要約 話す顔の生成タスクの目的は、視覚的な詳細とアイデンティティ情報を維持しなが … 続きを読む
カテゴリー: cs.CV
Audio-Visual Speech Representation Expert for Enhanced Talking Face Video Generation and Evaluation はコメントを受け付けていません
Enhancing Boundary Segmentation for Topological Accuracy with Skeleton-based Methods
要約 トポロジーの一貫性は、ニューロン電子顕微鏡画像の細胞膜セグメンテーション、 … 続きを読む
SDDGR: Stable Diffusion-based Deep Generative Replay for Class Incremental Object Detection
要約 クラス増分学習 (CIL) の分野では、生成モデルの継続的な改善と並行して … 続きを読む
カテゴリー: cs.CV
SDDGR: Stable Diffusion-based Deep Generative Replay for Class Incremental Object Detection はコメントを受け付けていません
Novel View Synthesis with Neural Radiance Fields for Industrial Robot Applications
要約 Neural Radiance Fields (NeRF) は、3D シー … 続きを読む
A Unified Approach for Text- and Image-guided 4D Scene Generation
要約 大規模な拡散生成モデルにより、ユーザーが提供したテキスト プロンプトや画像 … 続きを読む
カテゴリー: cs.CV
A Unified Approach for Text- and Image-guided 4D Scene Generation はコメントを受け付けていません
Diffusion-driven GAN Inversion for Multi-Modal Face Image Generation
要約 テキスト プロンプトとセマンティック マスクや落書きマップなどの視覚入力を … 続きを読む
カテゴリー: cs.CV
Diffusion-driven GAN Inversion for Multi-Modal Face Image Generation はコメントを受け付けていません
Solving the bongard-logo problem by modeling a probabilistic model
要約 抽象的な推論の問題は、AI アルゴリズムの知覚および認知能力に挑戦し、明示 … 続きを読む
カテゴリー: cs.CV
Solving the bongard-logo problem by modeling a probabilistic model はコメントを受け付けていません
Zero Grads: Learning Local Surrogate Losses for Non-Differentiable Graphics
要約 勾配ベースの最適化は現在、グラフィックス全体で広く普及していますが、残念な … 続きを読む
Diff-IP2D: Diffusion-Based Hand-Object Interaction Prediction on Egocentric Videos
要約 ハンドとオブジェクトの相互作用中に人間がどのように動作するかを理解すること … 続きを読む
カテゴリー: cs.CV
Diff-IP2D: Diffusion-Based Hand-Object Interaction Prediction on Egocentric Videos はコメントを受け付けていません
PoseINN: Realtime Visual-based Pose Regression and Localization with Invertible Neural Networks
要約 カメラからエゴポーズを推定することは、移動ロボット工学から拡張現実感まで幅 … 続きを読む