cs.CV」カテゴリーアーカイブ

EchoApex: A General-Purpose Vision Foundation Model for Echocardiography

要約 心エコー検査の定量的評価は、心臓の状態を正確に評価し、病気の進行を監視し、 … 続きを読む

カテゴリー: cs.AI, cs.CV | EchoApex: A General-Purpose Vision Foundation Model for Echocardiography はコメントを受け付けていません

Order-aware Interactive Segmentation

要約 インタラクティブ セグメンテーションは、最小限のユーザー操作でターゲット … 続きを読む

カテゴリー: cs.AI, cs.CV | Order-aware Interactive Segmentation はコメントを受け付けていません

Movie Gen: A Cast of Media Foundation Models

要約 さまざまなアスペクト比と同期されたオーディオを備えた高品質の 1080p … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, eess.IV | Movie Gen: A Cast of Media Foundation Models はコメントを受け付けていません

DAWN: Dynamic Frame Avatar with Non-autoregressive Diffusion Framework for Talking Head Video Generation

要約 トーキング ヘッドの生成は、1 つのポートレートとスピーチ オーディオ ク … 続きを読む

カテゴリー: cs.AI, cs.CV | DAWN: Dynamic Frame Avatar with Non-autoregressive Diffusion Framework for Talking Head Video Generation はコメントを受け付けていません

Improving Multi-modal Large Language Model through Boosting Vision Capabilities

要約 私たちは、視覚言語モデルを強化するための視覚理解能力の向上に焦点を当ててい … 続きを読む

カテゴリー: cs.CV, cs.MM | Improving Multi-modal Large Language Model through Boosting Vision Capabilities はコメントを受け付けていません

Corrective Machine Unlearning

要約 機械学習モデルは、インターネットから取得した大規模なトレーニング データセ … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.CV, cs.LG | Corrective Machine Unlearning はコメントを受け付けていません

Eyelid Fold Consistency in Facial Modeling

要約 まぶたの形状は、人間の顔のモデリングにおけるアイデンティティと類似性に不可 … 続きを読む

カテゴリー: cs.CV, cs.GR | Eyelid Fold Consistency in Facial Modeling はコメントを受け付けていません

Representing Model Weights with Language using Tree Experts

要約 公開モデルの利用可能性が高まるにつれ、他のネットワークを入力として使用する … 続きを読む

カテゴリー: cs.CV, cs.LG | Representing Model Weights with Language using Tree Experts はコメントを受け付けていません

Emphasizing Semantic Consistency of Salient Posture for Speech-Driven Gesture Generation

要約 音声駆動型のジェスチャ生成は、入力音声信号と同期したジェスチャ シーケンス … 続きを読む

カテゴリー: cs.CV | Emphasizing Semantic Consistency of Salient Posture for Speech-Driven Gesture Generation はコメントを受け付けていません

MotionBank: A Large-scale Video Motion Benchmark with Disentangled Rule-based Annotations

要約 このペーパーでは、大規模モーション モデル (LMM) を構築してベンチマ … 続きを読む

カテゴリー: cs.CV | MotionBank: A Large-scale Video Motion Benchmark with Disentangled Rule-based Annotations はコメントを受け付けていません