-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年3月
TC4D: Trajectory-Conditioned Text-to-4D Generation
要約 テキストから 4D への生成のための最近の技術では、事前トレーニングされた … 続きを読む
カテゴリー: cs.CV
TC4D: Trajectory-Conditioned Text-to-4D Generation はコメントを受け付けていません
AID: Attention Interpolation of Text-to-Image Diffusion
要約 条件付き拡散モデルは、さまざまな設定で目に見えない画像を作成し、画像補間を … 続きを読む
FastCAR: Fast Classification And Regression Multi-Task Learning via Task Consolidation for Modelling a Continuous Property Variable of Object Classes
要約 FastCAR は、相関関係がわずかしかないタスクの異質性にも関わらず、分 … 続きを読む
カテゴリー: cs.CV
FastCAR: Fast Classification And Regression Multi-Task Learning via Task Consolidation for Modelling a Continuous Property Variable of Object Classes はコメントを受け付けていません
Towards Explaining Hypercomplex Neural Networks
要約 超複雑ニューラル ネットワークは、深層学習コミュニティでますます関心を集め … 続きを読む
カテゴリー: cs.CV
Towards Explaining Hypercomplex Neural Networks はコメントを受け付けていません
Track Everything Everywhere Fast and Robustly
要約 私たちは、ビデオ内でいつでも効率的かつ確実にピクセルを追跡するための新しい … 続きを読む
カテゴリー: cs.CV
Track Everything Everywhere Fast and Robustly はコメントを受け付けていません
SLEDGE: Synthesizing Simulation Environments for Driving Agents with Generative Models
要約 SLEDGE は、現実世界の運転ログでトレーニングされた、車両動作計画のた … 続きを読む
AiOS: All-in-One-Stage Expressive Human Pose and Shape Estimation
要約 表情豊かな人間のポーズと形状の推定 (別名 3D 全身メッシュ回復) には … 続きを読む
カテゴリー: cs.CV
AiOS: All-in-One-Stage Expressive Human Pose and Shape Estimation はコメントを受け付けていません
OmniVid: A Generative Framework for Universal Video Understanding
要約 認識、キャプション、追跡などのビデオ理解タスクの中核は、ビデオ内のオブジェ … 続きを読む
カテゴリー: cs.CV
OmniVid: A Generative Framework for Universal Video Understanding はコメントを受け付けていません
ConvoFusion: Multi-Modal Conversational Diffusion for Co-Speech Gesture Synthesis
要約 ジェスチャーは人間のコミュニケーションにおいて重要な役割を果たします。 同 … 続きを読む
カテゴリー: cs.CV
ConvoFusion: Multi-Modal Conversational Diffusion for Co-Speech Gesture Synthesis はコメントを受け付けていません
Efficient Video Object Segmentation via Modulated Cross-Attention Memory
要約 最近、トランスフォーマーベースのアプローチは、半教師ありビデオオブジェクト … 続きを読む
カテゴリー: cs.CV
Efficient Video Object Segmentation via Modulated Cross-Attention Memory はコメントを受け付けていません