「cs.CV」カテゴリーアーカイブ

The Tenth NTIRE 2025 Image Denoising Challenge Report

投稿日: 2025年4月17日作成者: jarxiv

要約このペーパーでは、提案された方法論と対応する結果を強調するNTIRE 20 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Taming Data and Transformers for Audio Generation

投稿日: 2025年4月17日作成者: jarxiv

要約アンビエントサウンドジェネレーターのスケーラビリティは、データ不足、キャプ … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

How Do I Do That? Synthesizing 3D Hand Motion and Contacts for Everyday Interactions

投稿日: 2025年4月17日作成者: jarxiv

要約単一のRGBビュー、アクションテキスト、およびオブジェクト上の3D接点ポイ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

SHeaP: Self-Supervised Head Geometry Predictor Learned via 2D Gaussians

投稿日: 2025年4月17日作成者: jarxiv

要約単眼の画像やビデオからの人間の頭の正確でリアルタイムの3D再構築は、多数の … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Adapting a World Model for Trajectory Following in a 3D Game

投稿日: 2025年4月17日作成者: jarxiv

要約模倣学習は、専門知識を活用することにより、トレーニングエージェントにとって … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Seedream 3.0 Technical Report

投稿日: 2025年4月17日作成者: jarxiv

要約中国と英語の高性能バイリンガルイメージジェネレーションファンデーションモデ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

UI-E2I-Synth: Advancing GUI Grounding with Large-Scale Instruction Synthesis

投稿日: 2025年4月17日作成者: jarxiv

要約大規模なビジョン言語モデルの最近の進歩は、デジタルデバイスの生産性を高める … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.HC | コメントを受け付けていません

DeepWheel: Generating a 3D Synthetic Wheel Dataset for Design and Performance Evaluation

投稿日: 2025年4月17日作成者: jarxiv

要約データ駆動型の設計は、エンジニアリングの革新を加速するための強力な戦略とし … 続きを読む →

カテゴリー: 68T07, cs.CV, physics.app-ph | コメントを受け付けていません

Diffusion Distillation With Direct Preference Optimization For Efficient 3D LiDAR Scene Completion

投稿日: 2025年4月17日作成者: jarxiv

要約 3D LIDARシーンの完了における拡散モデルの適用は、拡散のサンプリング … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

CleanMAP: Distilling Multimodal LLMs for Confidence-Driven Crowdsourced HD Map Updates

投稿日: 2025年4月16日作成者: jarxiv

要約インテリジェント接続車両（ICV）と統合された車両ロードクラウドシステ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO, I.2.10 | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

The Tenth NTIRE 2025 Image Denoising Challenge Report

Taming Data and Transformers for Audio Generation

How Do I Do That? Synthesizing 3D Hand Motion and Contacts for Everyday Interactions

SHeaP: Self-Supervised Head Geometry Predictor Learned via 2D Gaussians

Adapting a World Model for Trajectory Following in a 3D Game

Seedream 3.0 Technical Report

UI-E2I-Synth: Advancing GUI Grounding with Large-Scale Instruction Synthesis

DeepWheel: Generating a 3D Synthetic Wheel Dataset for Design and Performance Evaluation

Diffusion Distillation With Direct Preference Optimization For Efficient 3D LiDAR Scene Completion

CleanMAP: Distilling Multimodal LLMs for Confidence-Driven Crowdsourced HD Map Updates

最近の投稿

最近のコメント

アーカイブ

カテゴリー