-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Stable Vision Concept Transformers for Medical Diagnosis
要約 透明性は医療分野で最も重要な懸念であり、研究者が説明可能なAI(XAI)の … 続きを読む
EOC-Bench: Can MLLMs Identify, Recall, and Forecast Objects in an Egocentric World?
要約 マルチモーダル大手言語モデル(MLLMS)の出現により、エゴセントリックビ … 続きを読む
カテゴリー: cs.CV
EOC-Bench: Can MLLMs Identify, Recall, and Forecast Objects in an Egocentric World? はコメントを受け付けていません
AliTok: Towards Sequence Modeling Alignment between Tokenizer and Autoregressive Model
要約 オートレーリングイメージの生成は、以前のトークンに基づいて次のトークンを予 … 続きを読む
カテゴリー: cs.CV
AliTok: Towards Sequence Modeling Alignment between Tokenizer and Autoregressive Model はコメントを受け付けていません
DM-SegNet: Dual-Mamba Architecture for 3D Medical Image Segmentation with Global Context Modeling
要約 正確な3D医療画像セグメンテーションには、グローバルなコンテキストモデリン … 続きを読む
SeedVR2: One-Step Video Restoration via Diffusion Adversarial Post-Training
要約 拡散ベースのビデオ修復(VR)の最近の進歩は、視覚品質の大幅な改善を示して … 続きを読む
カテゴリー: cs.CV
SeedVR2: One-Step Video Restoration via Diffusion Adversarial Post-Training はコメントを受け付けていません
Perceive Anything: Recognize, Explain, Caption, and Segment Anything in Images and Videos
要約 画像やビデオの包括的な地域レベルの視覚的理解のための概念的に簡単かつ効率的 … 続きを読む
カテゴリー: cs.CV
Perceive Anything: Recognize, Explain, Caption, and Segment Anything in Images and Videos はコメントを受け付けていません
ReasonGen-R1: CoT for Autoregressive Image generation models through SFT and RL
要約 考え方の推論と強化学習(RL)がNLPのブレークスルーを駆動していますが、 … 続きを読む
Do It Yourself: Learning Semantic Correspondence from Pseudo-Labels
要約 画像とオブジェクトインスタンス間で意味的に類似したポイント間の対応を見つけ … 続きを読む
カテゴリー: cs.CV
Do It Yourself: Learning Semantic Correspondence from Pseudo-Labels はコメントを受け付けていません
MARBLE: Material Recomposition and Blending in CLIP-Space
要約 模範的な画像に基づいた画像内のオブジェクトの資料の編集は、コンピュータービ … 続きを読む
カテゴリー: cs.CV
MARBLE: Material Recomposition and Blending in CLIP-Space はコメントを受け付けていません
ProJo4D: Progressive Joint Optimization for Sparse-View Inverse Physics Estimation
要約 ニューラルレンダリングは、3D再構成と新規ビューの合成に大きな進歩を遂げま … 続きを読む
カテゴリー: cs.CV
ProJo4D: Progressive Joint Optimization for Sparse-View Inverse Physics Estimation はコメントを受け付けていません