-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Probabilistic Gaussian Superposition for Efficient 3D Occupancy Prediction
要約 3D セマンティック占有予測は、周囲のシーンのきめ細かいジオメトリとセマン … 続きを読む
Regularization by Neural Style Transfer for MRI Field-Transfer Reconstruction with Limited Data
要約 MRI 再構成における最近の進歩は、深層学習ベースのモデルで目覚ましい成功 … 続きを読む
カテゴリー: cs.CV, cs.LG, physics.med-ph
Regularization by Neural Style Transfer for MRI Field-Transfer Reconstruction with Limited Data はコメントを受け付けていません
Learning to Reconstruct Accelerated MRI Through K-space Cold Diffusion without Noise
要約 最近では、ディープラーニングベースの MRI 再構成モデルが優れたパフ … 続きを読む
カテゴリー: cs.CV, cs.LG, eess.IV, physics.med-ph
Learning to Reconstruct Accelerated MRI Through K-space Cold Diffusion without Noise はコメントを受け付けていません
FedDUAL: A Dual-Strategy with Adaptive Loss and Dynamic Aggregation for Mitigating Data Heterogeneity in Federated Learning
要約 Federated Learning (FL) は、さまざまなクライアント … 続きを読む
Negative Token Merging: Image-based Adversarial Feature Guidance
要約 否定的なプロンプトを使用したテキストベースの敵対的誘導は、拡散モデルを望ま … 続きを読む
Florence-VL: Enhancing Vision-Language Models with Generative Vision Encoder and Depth-Breadth Fusion
要約 我々は、生成ビジョン基盤モデルである Florence-2 によって生成さ … 続きを読む
Grounding Descriptions in Images informs Zero-Shot Visual Recognition
要約 CLIP のような視覚言語モデル (VLM) は、オープンな語彙概念に基づ … 続きを読む
Infinity: Scaling Bitwise AutoRegressive Modeling for High-Resolution Image Synthesis
要約 私たちは、言語命令に従って高解像度でフォトリアリスティックな画像を生成でき … 続きを読む
カテゴリー: cs.CV
Infinity: Scaling Bitwise AutoRegressive Modeling for High-Resolution Image Synthesis はコメントを受け付けていません
Divot: Diffusion Powers Video Tokenizer for Comprehension and Generation
要約 近年、大規模言語モデル (LLM) 内で画像の理解と生成を統合することへの … 続きを読む
カテゴリー: cs.CV
Divot: Diffusion Powers Video Tokenizer for Comprehension and Generation はコメントを受け付けていません
PBDyG: Position Based Dynamic Gaussians for Motion-Aware Clothed Human Avatars
要約 この論文では、物理的に正確な体と衣服の動きを復元することに特に重点を置き、 … 続きを読む
カテゴリー: cs.CV
PBDyG: Position Based Dynamic Gaussians for Motion-Aware Clothed Human Avatars はコメントを受け付けていません