cs.CV」カテゴリーアーカイブ

Diffusion-VLA: Generalizable and Interpretable Robot Foundation Model via Self-Generated Reasoning

要約 この論文では、自己網性モデルと視覚運動ポリシーを学習するための拡散モデルを … 続きを読む

カテゴリー: cs.CV, cs.RO | コメントする

SEM: Enhancing Spatial Understanding for Robust Robot Manipulation

要約 ロボット操作の重要な課題は、強い空間的理解、3D形状、オブジェクト関係、ロ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | コメントする

Seeing What Tastes Good: Revisiting Multimodal Distributional Semantics in the Billion Parameter Era

要約 人間の学習と概念表現は、最先端の基礎モデルとは対照的に、感覚運動体験に基づ … 続きを読む

カテゴリー: cs.CL, cs.CV | コメントする

Vocabulary-free few-shot learning for Vision-Language Models

要約 ビジョン言語モデル(VLM)の少数のショット適応の最近の進歩により、いくつ … 続きを読む

カテゴリー: cs.CV | コメントする

Go Beyond Earth: Understanding Human Actions and Scenes in Microgravity Environments

要約 ビデオ理解の実質的な進歩にもかかわらず、ほとんどの既存のデータセットは地球 … 続きを読む

カテゴリー: cs.CV | コメントする

Dreaming up scale invariance via inverse renormalization group

要約 最小限のニューラルネットワークが、2次元ISINGモデルで繰り込みグループ … 続きを読む

カテゴリー: cond-mat.stat-mech, cs.CV, cs.LG | コメントする

UltraBones100k: A reliable automated labeling method and large-scale dataset for ultrasound-based bone surface extraction

要約 超音波ベースの骨表面セグメンテーションは、コンピューター支援整形外科手術に … 続きを読む

カテゴリー: cs.CV, eess.IV | コメントする

Comparing the Effects of Persistence Barcodes Aggregation and Feature Concatenation on Medical Imaging

要約 医療画像分析では、機能エンジニアリングは、機械学習モデルの設計とパフォーマ … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする

Conformal coronary calcification volume estimation with conditional coverage via histogram clustering

要約 CTスキャンにおける冠動脈カルシウムの偶発的検出と定量化は、命を救う臨床介 … 続きを読む

カテゴリー: cs.CV, eess.IV | コメントする

Rex-Thinker: Grounded Object Referring via Chain-of-Thought Reasoning

要約 オブジェクトは、特定の自然言語の説明に一致する画像内のすべてのオブジェクト … 続きを読む

カテゴリー: cs.CV | コメントする