cs.CV」カテゴリーアーカイブ

The Tenth NTIRE 2025 Image Denoising Challenge Report

要約 このペーパーでは、提案された方法論と対応する結果を強調するNTIRE 20 … 続きを読む

カテゴリー: cs.CV | The Tenth NTIRE 2025 Image Denoising Challenge Report はコメントを受け付けていません

Taming Data and Transformers for Audio Generation

要約 アンビエントサウンドジェネレーターのスケーラビリティは、データ不足、キャプ … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.MM, cs.SD, eess.AS | Taming Data and Transformers for Audio Generation はコメントを受け付けていません

How Do I Do That? Synthesizing 3D Hand Motion and Contacts for Everyday Interactions

要約 単一のRGBビュー、アクションテキスト、およびオブジェクト上の3D接点ポイ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | How Do I Do That? Synthesizing 3D Hand Motion and Contacts for Everyday Interactions はコメントを受け付けていません

SHeaP: Self-Supervised Head Geometry Predictor Learned via 2D Gaussians

要約 単眼の画像やビデオからの人間の頭の正確でリアルタイムの3D再構築は、多数の … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | SHeaP: Self-Supervised Head Geometry Predictor Learned via 2D Gaussians はコメントを受け付けていません

Adapting a World Model for Trajectory Following in a 3D Game

要約 模倣学習は、専門知識を活用することにより、トレーニングエージェントにとって … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Adapting a World Model for Trajectory Following in a 3D Game はコメントを受け付けていません

Seedream 3.0 Technical Report

要約 中国と英語の高性能バイリンガルイメージジェネレーションファンデーションモデ … 続きを読む

カテゴリー: cs.CV | Seedream 3.0 Technical Report はコメントを受け付けていません

UI-E2I-Synth: Advancing GUI Grounding with Large-Scale Instruction Synthesis

要約 大規模なビジョン言語モデルの最近の進歩は、デジタルデバイスの生産性を高める … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.HC | UI-E2I-Synth: Advancing GUI Grounding with Large-Scale Instruction Synthesis はコメントを受け付けていません

DeepWheel: Generating a 3D Synthetic Wheel Dataset for Design and Performance Evaluation

要約 データ駆動型の設計は、エンジニアリングの革新を加速するための強力な戦略とし … 続きを読む

カテゴリー: 68T07, cs.CV, physics.app-ph | DeepWheel: Generating a 3D Synthetic Wheel Dataset for Design and Performance Evaluation はコメントを受け付けていません

Diffusion Distillation With Direct Preference Optimization For Efficient 3D LiDAR Scene Completion

要約 3D LIDARシーンの完了における拡散モデルの適用は、拡散のサンプリング … 続きを読む

カテゴリー: cs.CV | Diffusion Distillation With Direct Preference Optimization For Efficient 3D LiDAR Scene Completion はコメントを受け付けていません

CleanMAP: Distilling Multimodal LLMs for Confidence-Driven Crowdsourced HD Map Updates

要約 インテリジェント接続車両(I​​CV)と統合された車両ロードクラウドシステ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO, I.2.10 | CleanMAP: Distilling Multimodal LLMs for Confidence-Driven Crowdsourced HD Map Updates はコメントを受け付けていません