-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Spider: Any-to-Many Multimodal LLM
要約 マルチモーダルLLM(MLLM)は、大規模な言語モデル(LLM)の拡張とし … 続きを読む
カテゴリー: cs.CV
Spider: Any-to-Many Multimodal LLM はコメントを受け付けていません
Mapping biodiversity at very-high resolution in Europe
要約 このペーパーでは、ヨーロッパ全体の高解像度の生物多様性マッピングのためのカ … 続きを読む
Federated Learning for Medical Image Classification: A Comprehensive Benchmark
要約 連邦学習パラダイムは、参加者のプライバシーを保護しながら、孤立した多施設デ … 続きを読む
Texture2LoD3: Enabling LoD3 Building Reconstruction With Panoramic Images
要約 表面再構成の最近の進歩にもかかわらず、詳細レベル(LOD)3建物の再建は未 … 続きを読む
Contour Integration Underlies Human-Like Vision
要約 コンピュータービジョンにおける深い学習の大成功にもかかわらず、モデルはまだ … 続きを読む
カテゴリー: cs.CV
Contour Integration Underlies Human-Like Vision はコメントを受け付けていません
Explaining Low Perception Model Competency with High-Competency Counterfactuals
要約 画像分類モデルがその決定を生成する方法を説明する多くの方法が存在しますが、 … 続きを読む
DualPM: Dual Posed-Canonical Point Maps for 3D Shape and Pose Reconstruction
要約 データ表現の選択は、幾何学的なタスクにおける深い学習の成功における重要な要 … 続きを読む
カテゴリー: cs.CV
DualPM: Dual Posed-Canonical Point Maps for 3D Shape and Pose Reconstruction はコメントを受け付けていません
TflosYOLO+TFSC: An Accurate and Robust Model for Estimating Flower Count and Flowering Period
要約 茶の花は、茶植物の分類学的研究とハイブリッド繁殖において重要な役割を果たし … 続きを読む
From Sparse Signal to Smooth Motion: Real-Time Motion Generation with Rolling Prediction Models
要約 拡張現実(XR)では、ユーザーの全身動きを生成することは、自分の行動を理解 … 続きを読む
カテゴリー: cs.CV
From Sparse Signal to Smooth Motion: Real-Time Motion Generation with Rolling Prediction Models はコメントを受け付けていません
FetalCLIP: A Visual-Language Foundation Model for Fetal Ultrasound Image Analysis
要約 基礎モデルは、医療ドメインでますます効果的になりつつあり、下流のタスクに容 … 続きを読む