「cs.CV」カテゴリーアーカイブ

DepthMatch: Semi-Supervised RGB-D Scene Parsing through Depth-Guided Regularization

投稿日: 2025年5月27日作成者: jarxiv

要約 RGB-Dシーンの解析方法は、環境のセマンティックと幾何学的特徴の両方を効 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

NFIG: Autoregressive Image Generation with Next-Frequency Prediction

投稿日: 2025年5月27日作成者: jarxiv

要約自己回帰モデルは、自然言語処理において有望な結果を達成しています。ただし … 続きを読む →

カテゴリー: 68T07, cs.AI, cs.CV, I.2.10 | コメントを受け付けていません

Efficient Training-Free High-Resolution Synthesis with Energy Rectification in Diffusion Models

投稿日: 2025年5月27日作成者: jarxiv

要約拡散モデルは、さまざまな視覚生成タスクにわたって顕著な進歩を遂げています。 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Data-Free Class-Incremental Gesture Recognition with Prototype-Guided Pseudo Feature Replay

投稿日: 2025年5月27日作成者: jarxiv

要約ジェスチャー認識は、コンピュータービジョンの分野における重要な研究分野です … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Multimodal LLM-Guided Semantic Correction in Text-to-Image Diffusion

投稿日: 2025年5月27日作成者: jarxiv

要約拡散モデルは、テキストからイメージの生成の主流のアーキテクチャとなっており … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM | コメントを受け付けていません

PAMD: Plausibility-Aware Motion Diffusion Model for Long Dance Generation

投稿日: 2025年5月27日作成者: jarxiv

要約コンピューティングダンス生成は、特にコヒーレントで表現力豊かな長いダンスシ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

M3DHMR: Monocular 3D Hand Mesh Recovery

投稿日: 2025年5月27日作成者: jarxiv

要約単眼3Dハンドメッシュの回復は、手の自由度、2Dから3Dのあいまいさ、自己 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Time-VLM: Exploring Multimodal Vision-Language Models for Augmented Time Series Forecasting

投稿日: 2025年5月27日作成者: jarxiv

要約時系列予測における最近の進歩により、テキストまたはビジョンモダリティを使用 … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

VR-Robo: A Real-to-Sim-to-Real Framework for Visual Robot Navigation and Locomotion

投稿日: 2025年5月27日作成者: jarxiv

要約レッグロボットの移動における最近の成功は、強化学習と物理シミュレーターの統 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

NoisyRollout: Reinforcing Visual Reasoning with Data Augmentation

投稿日: 2025年5月27日作成者: jarxiv

要約強化学習（RL）の最近の進歩により、視覚言語モデル（VLM）の推論能力が強 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

DepthMatch: Semi-Supervised RGB-D Scene Parsing through Depth-Guided Regularization

NFIG: Autoregressive Image Generation with Next-Frequency Prediction

Efficient Training-Free High-Resolution Synthesis with Energy Rectification in Diffusion Models

Data-Free Class-Incremental Gesture Recognition with Prototype-Guided Pseudo Feature Replay

Multimodal LLM-Guided Semantic Correction in Text-to-Image Diffusion

PAMD: Plausibility-Aware Motion Diffusion Model for Long Dance Generation

M3DHMR: Monocular 3D Hand Mesh Recovery

Time-VLM: Exploring Multimodal Vision-Language Models for Augmented Time Series Forecasting

VR-Robo: A Real-to-Sim-to-Real Framework for Visual Robot Navigation and Locomotion

NoisyRollout: Reinforcing Visual Reasoning with Data Augmentation

最近の投稿

最近のコメント

アーカイブ

カテゴリー