月別アーカイブ: 2025年1月

Gaussian Eigen Models for Human Heads

要約 現在のパーソナライズされたニューラル ヘッド アバターはトレードオフに直面 … 続きを読む

カテゴリー: cs.CV | Gaussian Eigen Models for Human Heads はコメントを受け付けていません

LayerAnimate: Layer-specific Control for Animation

要約 アニメーション ビデオでは、前景要素と背景要素がレイヤーに分離され、スケッ … 続きを読む

カテゴリー: cs.CV | LayerAnimate: Layer-specific Control for Animation はコメントを受け付けていません

Advancing Semantic Future Prediction through Multimodal Visual Sequence Transformers

要約 意味論的な将来予測は、動的環境をナビゲートする自律システムにとって重要です … 続きを読む

カテゴリー: cs.CV | Advancing Semantic Future Prediction through Multimodal Visual Sequence Transformers はコメントを受け付けていません

MiniMax-01: Scaling Foundation Models with Lightning Attention

要約 MiniMax-Text-01 および MiniMax-VL-01 を含む … 続きを読む

カテゴリー: cs.CL, cs.CV | MiniMax-01: Scaling Foundation Models with Lightning Attention はコメントを受け付けていません

Rate-In: Information-Driven Adaptive Dropout Rates for Improved Inference-Time Uncertainty Estimation

要約 医療診断などのリスクに敏感なアプリケーションにニューラル ネットワークを導 … 続きを読む

カテゴリー: cs.CV, cs.LG, stat.ML | Rate-In: Information-Driven Adaptive Dropout Rates for Improved Inference-Time Uncertainty Estimation はコメントを受け付けていません

Diffusion Adversarial Post-Training for One-Step Video Generation

要約 拡散モデルは画像やビデオの生成に広く使用されていますが、反復生成プロセスは … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Diffusion Adversarial Post-Training for One-Step Video Generation はコメントを受け付けていません

GameFactory: Creating New Games with Generative Interactive Videos

要約 生成型ゲーム エンジンは、新しいコンテンツを自律的に作成し、手動の作業負荷 … 続きを読む

カテゴリー: cs.CV | GameFactory: Creating New Games with Generative Interactive Videos はコメントを受け付けていません

Omni-RGPT: Unifying Image and Video Region-level Understanding via Token Marks

要約 私たちは、画像とビデオの両方の領域レベルの理解を容易にするように設計された … 続きを読む

カテゴリー: cs.CV | Omni-RGPT: Unifying Image and Video Region-level Understanding via Token Marks はコメントを受け付けていません

Predicting 4D Hand Trajectory from Monocular Videos

要約 単眼ビデオからコヒーレントな 4D 手の軌跡を推測するアプローチである H … 続きを読む

カテゴリー: cs.CV | Predicting 4D Hand Trajectory from Monocular Videos はコメントを受け付けていません

Go-with-the-Flow: Motion-Controllable Video Diffusion Models Using Real-Time Warped Noise

要約 生成モデリングは、ランダム ノイズを構造化された出力に変換することを目的と … 続きを読む

カテゴリー: cs.CV | Go-with-the-Flow: Motion-Controllable Video Diffusion Models Using Real-Time Warped Noise はコメントを受け付けていません