-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Rethinking Crowd-Sourced Evaluation of Neuron Explanations
要約 アクティベーションの個々のニューロンまたは方向の解釈空間は、機械的解釈可能 … 続きを読む
Rethinking Cross-Modal Interaction in Multimodal Diffusion Transformers
要約 マルチモーダル拡散トランス(MM-DITS)は、テキスト駆動型の視覚生成に … 続きを読む
カテゴリー: cs.CV
Rethinking Cross-Modal Interaction in Multimodal Diffusion Transformers はコメントを受け付けていません
PairEdit: Learning Semantic Variations for Exemplar-based Image Editing
要約 テキスト誘導画像編集における最近の進歩は、微調整されたセマンティックコント … 続きを読む
カテゴリー: cs.CV
PairEdit: Learning Semantic Variations for Exemplar-based Image Editing はコメントを受け付けていません
UA-Pose: Uncertainty-Aware 6D Object Pose Estimation and Online Object Completion with Partial References
要約 6Dオブジェクトのポーズ推定により、新しいオブジェクトが強力な一般化可能性 … 続きを読む
Generative Modeling of Weights: Generalization or Memorization?
要約 イメージとビデオ生成に成功した生成モデルは、効果的なニューラルネットワーク … 続きを読む
MADFormer: Mixed Autoregressive and Diffusion Transformers for Continuous Image Generation
要約 マルチモーダル生成の最近の進歩により、自己回帰(AR)と拡散ベースのアプロ … 続きを読む
E3D-Bench: A Benchmark for End-to-End 3D Geometric Foundation Models
要約 3D再構成、知覚、および推論を含む空間インテリジェンスは、ロボット工学、空 … 続きを読む
カテゴリー: cs.CV
E3D-Bench: A Benchmark for End-to-End 3D Geometric Foundation Models はコメントを受け付けていません
Aligning Text, Images, and 3D Structure Token-by-Token
要約 3Dで世界を理解できるマシンの作成は、3次元空間内でナビゲートおよび相互作 … 続きを読む
カテゴリー: cs.CV
Aligning Text, Images, and 3D Structure Token-by-Token はコメントを受け付けていません
Audio-Sync Video Generation with Multi-Stream Temporal Control
要約 オーディオは本質的に一時的であり、視覚的な世界と密接に同期されているため、 … 続きを読む
Dynamic View Synthesis as an Inverse Problem
要約 この作業では、トレーニングなしの設定での逆の問題として、単眼動画からの動的 … 続きを読む