-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
GeoPixel: Pixel Grounding Large Multimodal Model in Remote Sensing
要約 大規模なマルチモーダルモデル(LMMS)の最近の進歩は、視覚的理解と対話の … 続きを読む
カテゴリー: cs.CV
GeoPixel: Pixel Grounding Large Multimodal Model in Remote Sensing はコメントを受け付けていません
Towards Robust Multimodal Open-set Test-time Adaptation via Adaptive Entropy-aware Optimization
要約 テスト時間適応(TTA)は、トレーニングとテストデータの間の分布シフトに対 … 続きを読む
Can We Generate Images with CoT? Let’s Verify and Reinforce Image Generation Step by Step
要約 思考連鎖 (CoT) 推論は、複雑な理解タスクに取り組むために、大規模なモ … 続きを読む
CRPO: Confidence-Reward Driven Preference Optimization for Machine Translation
要約 大規模言語モデル (LLM) は、自然言語処理タスクにおいて大きな可能性を … 続きを読む
Fast3R: Towards 3D Reconstruction of 1000+ Images in One Forward Pass
要約 マルチビュー3D再構成は、特に多様な視点で正確でスケーラブルな表現を必要と … 続きを読む
VideoLLaMA 3: Frontier Multimodal Foundation Models for Image and Video Understanding
要約 この論文では、画像とビデオを理解するためのより高度なマルチモーダル基盤モデ … 続きを読む
カテゴリー: cs.CV
VideoLLaMA 3: Frontier Multimodal Foundation Models for Image and Video Understanding はコメントを受け付けていません
Accelerate High-Quality Diffusion Models with Inner Loop Feedback
要約 拡散モデルの推論を加速するための新しいアプローチであるインナーループフィー … 続きを読む
カテゴリー: cs.CV
Accelerate High-Quality Diffusion Models with Inner Loop Feedback はコメントを受け付けていません
CHaRNet: Conditioned Heatmap Regression for Robust Dental Landmark Localization
要約 3D歯科モデルでの解剖学的ランドマークを特定することは、歯科矯正治療に不可 … 続きを読む
カテゴリー: cs.CV
CHaRNet: Conditioned Heatmap Regression for Robust Dental Landmark Localization はコメントを受け付けていません
SpatialCoT: Advancing Spatial Reasoning through Coordinate Alignment and Chain-of-Thought for Embodied Task Planning
要約 空間的推論は、具体化されたAI研究において重要な問題です。 補足的な空間デ … 続きを読む
Boosting Diffusion Guidance via Learning Degradation-Aware Models for Blind Super Resolution
要約 最近、拡散ベースのブラインドスーパー解像度(SR)メソッドは、豊富な高周波 … 続きを読む