-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
InstructSeg: Unifying Instructed Visual Segmentation with Multi-modal Large Language Models
要約 マルチモーダル大規模言語モデル (MLLM) によって後押しされ、画像およ … 続きを読む
カテゴリー: cs.CV
InstructSeg: Unifying Instructed Visual Segmentation with Multi-modal Large Language Models はコメントを受け付けていません
Prompting Depth Anything for 4K Resolution Accurate Metric Depth Estimation
要約 プロンプトは、特定のタスクに対して言語と視覚の基礎モデルの力を解き放つ上で … 続きを読む
カテゴリー: cs.CV
Prompting Depth Anything for 4K Resolution Accurate Metric Depth Estimation はコメントを受け付けていません
SurgSora: Decoupled RGBD-Flow Diffusion Model for Controllable Surgical Video Generation
要約 医療ビデオの生成には、正確で制御可能な視覚表現を通じて、外科の理解と病理の … 続きを読む
Restore Anything Model via Efficient Degradation Adaptation
要約 モバイル デバイスの普及に伴い、劣化した画像を復元するための効率的なモデル … 続きを読む
カテゴリー: cs.CV
Restore Anything Model via Efficient Degradation Adaptation はコメントを受け付けていません
CAD-Recode: Reverse Engineering CAD Code from Point Clouds
要約 コンピュータ支援設計 (CAD) モデルは通常、パラメトリック スケッチを … 続きを読む
カテゴリー: cs.CV
CAD-Recode: Reverse Engineering CAD Code from Point Clouds はコメントを受け付けていません
A Review of Multimodal Explainable Artificial Intelligence: Past, Present and Future
要約 人工知能 (AI) は、計算能力の進歩と大規模なデータセットの増加によって … 続きを読む
Towards Generalist Robot Policies: What Matters in Building Vision-Language-Action Models
要約 Foundation Vision Language Models (VL … 続きを読む
Joint Perception and Prediction for Autonomous Driving: A Survey
要約 知覚および予測モジュールは自動運転システムの重要なコンポーネントであり、車 … 続きを読む
Adaptive Concept Bottleneck for Foundation Models Under Distribution Shifts
要約 基礎モデル (FM) の進歩により、機械学習のパラダイムシフトが起こりまし … 続きを読む
Parameter-efficient Fine-tuning for improved Convolutional Baseline for Brain Tumor Segmentation in Sub-Saharan Africa Adult Glioma Dataset
要約 深層学習手法を使用して脳腫瘍のセグメンテーションを自動化することは、医療画 … 続きを読む