-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年3月
Score-Guided Diffusion for 3D Human Recovery
要約 3D 人間のポーズと形状の再構成の逆問題を解決するためのアプローチである、 … 続きを読む
カテゴリー: cs.CV
Score-Guided Diffusion for 3D Human Recovery はコメントを受け付けていません
Make-Your-3D: Fast and Consistent Subject-Driven 3D Content Generation
要約 近年、3D 生成モデルの強力なパワーが実証されており、ユーザーが 1 つの … 続きを読む
Video Mamba Suite: State Space Model as a Versatile Alternative for Video Understanding
要約 ビデオを理解することはコンピューター ビジョン研究の基本的な方向性の 1 … 続きを読む
カテゴリー: cs.CV
Video Mamba Suite: State Space Model as a Versatile Alternative for Video Understanding はコメントを受け付けていません
HumanGaussian: Text-Driven 3D Human Generation with Gaussian Splatting
要約 テキスト プロンプトからリアルな 3D 人間を生成することは、望ましいこと … 続きを読む
カテゴリー: cs.CV
HumanGaussian: Text-Driven 3D Human Generation with Gaussian Splatting はコメントを受け付けていません
Generalized Predictive Model for Autonomous Driving
要約 この論文では、自動運転分野における初の大規模ビデオ予測モデルを紹介します。 … 続きを読む
カテゴリー: cs.CV
Generalized Predictive Model for Autonomous Driving はコメントを受け付けていません
3D-VLA: A 3D Vision-Language-Action Generative World Model
要約 最近のビジョン言語アクション (VLA) モデルは 2D 入力に依存してお … 続きを読む
Holo-Relighting: Controllable Volumetric Portrait Relighting from a Single Image
要約 ポートレート写真の核心は、理想的な照明と視点の探求です。 このプロセスでは … 続きを読む
カテゴリー: cs.CV
Holo-Relighting: Controllable Volumetric Portrait Relighting from a Single Image はコメントを受け付けていません
OneTracker: Unifying Visual Object Tracking with Foundation Models and Efficient Tuning
要約 視覚オブジェクト追跡は、最初のフレームでの最初の出現に基づいて各フレームの … 続きを読む
カテゴリー: cs.CV
OneTracker: Unifying Visual Object Tracking with Foundation Models and Efficient Tuning はコメントを受け付けていません
Transformers Get Stable: An End-to-End Signal Propagation Theory for Language Models
要約 変圧器モデルは大成功を収めているにもかかわらず、依然として詳細に拡張するこ … 続きを読む
A Data Perspective on Enhanced Identity Preservation for Diffusion Personalization
要約 大規模なテキストから画像へのモデルは、自然言語を使用して画像を生成する機能 … 続きを読む
カテゴリー: cs.CV
A Data Perspective on Enhanced Identity Preservation for Diffusion Personalization はコメントを受け付けていません