-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
SEM: Enhancing Spatial Understanding for Robust Robot Manipulation
要約 ロボット操作の重要な課題は、強い空間的理解、3D形状、オブジェクト関係、ロ … 続きを読む
Seeing What Tastes Good: Revisiting Multimodal Distributional Semantics in the Billion Parameter Era
要約 人間の学習と概念表現は、最先端の基礎モデルとは対照的に、感覚運動体験に基づ … 続きを読む
Vocabulary-free few-shot learning for Vision-Language Models
要約 ビジョン言語モデル(VLM)の少数のショット適応の最近の進歩により、いくつ … 続きを読む
カテゴリー: cs.CV
Vocabulary-free few-shot learning for Vision-Language Models はコメントを受け付けていません
Go Beyond Earth: Understanding Human Actions and Scenes in Microgravity Environments
要約 ビデオ理解の実質的な進歩にもかかわらず、ほとんどの既存のデータセットは地球 … 続きを読む
カテゴリー: cs.CV
Go Beyond Earth: Understanding Human Actions and Scenes in Microgravity Environments はコメントを受け付けていません
Dreaming up scale invariance via inverse renormalization group
要約 最小限のニューラルネットワークが、2次元ISINGモデルで繰り込みグループ … 続きを読む
カテゴリー: cond-mat.stat-mech, cs.CV, cs.LG
Dreaming up scale invariance via inverse renormalization group はコメントを受け付けていません
UltraBones100k: A reliable automated labeling method and large-scale dataset for ultrasound-based bone surface extraction
要約 超音波ベースの骨表面セグメンテーションは、コンピューター支援整形外科手術に … 続きを読む
Comparing the Effects of Persistence Barcodes Aggregation and Feature Concatenation on Medical Imaging
要約 医療画像分析では、機能エンジニアリングは、機械学習モデルの設計とパフォーマ … 続きを読む
Conformal coronary calcification volume estimation with conditional coverage via histogram clustering
要約 CTスキャンにおける冠動脈カルシウムの偶発的検出と定量化は、命を救う臨床介 … 続きを読む
Rex-Thinker: Grounded Object Referring via Chain-of-Thought Reasoning
要約 オブジェクトは、特定の自然言語の説明に一致する画像内のすべてのオブジェクト … 続きを読む
カテゴリー: cs.CV
Rex-Thinker: Grounded Object Referring via Chain-of-Thought Reasoning はコメントを受け付けていません
Mitigating Hallucinations in Large Vision-Language Models via Entity-Centric Multimodal Preference Optimization
要約 大規模な視覚言語モデル(LVLMS)は、複数のタスクにわたって印象的な機能 … 続きを読む