-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
EchoApex: A General-Purpose Vision Foundation Model for Echocardiography
要約 心エコー検査の定量的評価は、心臓の状態を正確に評価し、病気の進行を監視し、 … 続きを読む
Order-aware Interactive Segmentation
要約 インタラクティブ セグメンテーションは、最小限のユーザー操作でターゲット … 続きを読む
Movie Gen: A Cast of Media Foundation Models
要約 さまざまなアスペクト比と同期されたオーディオを備えた高品質の 1080p … 続きを読む
DAWN: Dynamic Frame Avatar with Non-autoregressive Diffusion Framework for Talking Head Video Generation
要約 トーキング ヘッドの生成は、1 つのポートレートとスピーチ オーディオ ク … 続きを読む
Improving Multi-modal Large Language Model through Boosting Vision Capabilities
要約 私たちは、視覚言語モデルを強化するための視覚理解能力の向上に焦点を当ててい … 続きを読む
Corrective Machine Unlearning
要約 機械学習モデルは、インターネットから取得した大規模なトレーニング データセ … 続きを読む
Eyelid Fold Consistency in Facial Modeling
要約 まぶたの形状は、人間の顔のモデリングにおけるアイデンティティと類似性に不可 … 続きを読む
Representing Model Weights with Language using Tree Experts
要約 公開モデルの利用可能性が高まるにつれ、他のネットワークを入力として使用する … 続きを読む
Emphasizing Semantic Consistency of Salient Posture for Speech-Driven Gesture Generation
要約 音声駆動型のジェスチャ生成は、入力音声信号と同期したジェスチャ シーケンス … 続きを読む
カテゴリー: cs.CV
Emphasizing Semantic Consistency of Salient Posture for Speech-Driven Gesture Generation はコメントを受け付けていません
MotionBank: A Large-scale Video Motion Benchmark with Disentangled Rule-based Annotations
要約 このペーパーでは、大規模モーション モデル (LMM) を構築してベンチマ … 続きを読む
カテゴリー: cs.CV
MotionBank: A Large-scale Video Motion Benchmark with Disentangled Rule-based Annotations はコメントを受け付けていません