cs.CV」カテゴリーアーカイブ

Visual Encoders for Data-Efficient Imitation Learning in Modern Video Games

要約 ビデオゲームは意思決定コミュニティにとって有用なベンチマークとして機能しま … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Visual Encoders for Data-Efficient Imitation Learning in Modern Video Games はコメントを受け付けていません

3D Stylization via Large Reconstruction Model

要約 テキストまたはイメージガイド付き3Dジェネレーターの成功が高まっているため … 続きを読む

カテゴリー: cs.CV | 3D Stylization via Large Reconstruction Model はコメントを受け付けていません

Active Light Modulation to Counter Manipulation of Speech Visual Content

要約 有名なスピーチビデオは、そのアクセシビリティと影響力のために、偽造の主要な … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.CV | Active Light Modulation to Counter Manipulation of Speech Visual Content はコメントを受け付けていません

Differentiable Room Acoustic Rendering with Multi-View Vision Priors

要約 空間オーディオによって可能になった没入型の音響体験は、現実的な仮想環境を作 … 続きを読む

カテゴリー: cs.CV, cs.SD | Differentiable Room Acoustic Rendering with Multi-View Vision Priors はコメントを受け付けていません

COMPACT: COMPositional Atomic-to-Complex Visual Capability Tuning

要約 マルチモーダル大手言語モデル(MLLM)は、単純なビジョン言語タスクに優れ … 続きを読む

カテゴリー: cs.CV | COMPACT: COMPositional Atomic-to-Complex Visual Capability Tuning はコメントを受け付けていません

A Survey of Interactive Generative Video

要約 インタラクティブな生成ビデオ(IGV)は、さまざまなドメインにわたる高品質 … 続きを読む

カテゴリー: cs.CV | A Survey of Interactive Generative Video はコメントを受け付けていません

ReVision: High-Quality, Low-Cost Video Generation with Explicit 3D Physics Modeling for Complex Motion and Interaction

要約 近年、ビデオ生成は大きな進歩を遂げています。 ただし、複雑な動きと相互作用 … 続きを読む

カテゴリー: cs.CV | ReVision: High-Quality, Low-Cost Video Generation with Explicit 3D Physics Modeling for Complex Motion and Interaction はコメントを受け付けていません

Stereo4D: Learning How Things Move in 3D from Internet Stereo Videos

要約 画像から動的な3Dシーンを理解することを学ぶことは、ロボット工学からシーン … 続きを読む

カテゴリー: cs.CV | Stereo4D: Learning How Things Move in 3D from Internet Stereo Videos はコメントを受け付けていません

End-to-end Audio Deepfake Detection from RAW Waveforms: a RawNet-Based Approach with Cross-Dataset Evaluation

要約 オーディオディープフェイクは、デジタルセキュリティと信頼に対する脅威の高ま … 続きを読む

カテゴリー: cs.CV, cs.SD, eess.AS | End-to-end Audio Deepfake Detection from RAW Waveforms: a RawNet-Based Approach with Cross-Dataset Evaluation はコメントを受け付けていません

DS_FusionNet: Dynamic Dual-Stream Fusion with Bidirectional Knowledge Distillation for Plant Disease Recognition

要約 経済作物の世界的な成長の安全性に直面している深刻な課題を考えると、植物疾患 … 続きを読む

カテゴリー: cs.CV | DS_FusionNet: Dynamic Dual-Stream Fusion with Bidirectional Knowledge Distillation for Plant Disease Recognition はコメントを受け付けていません