「cs.CV」カテゴリーアーカイブ

SEM: Enhancing Spatial Understanding for Robust Robot Manipulation

投稿日: 2025年6月5日作成者: jarxiv

要約ロボット操作の重要な課題は、強い空間的理解、3D形状、オブジェクト関係、ロ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

Seeing What Tastes Good: Revisiting Multimodal Distributional Semantics in the Billion Parameter Era

投稿日: 2025年6月5日作成者: jarxiv

要約人間の学習と概念表現は、最先端の基礎モデルとは対照的に、感覚運動体験に基づ … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

Vocabulary-free few-shot learning for Vision-Language Models

投稿日: 2025年6月5日作成者: jarxiv

要約ビジョン言語モデル（VLM）の少数のショット適応の最近の進歩により、いくつ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Go Beyond Earth: Understanding Human Actions and Scenes in Microgravity Environments

投稿日: 2025年6月5日作成者: jarxiv

要約ビデオ理解の実質的な進歩にもかかわらず、ほとんどの既存のデータセットは地球 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Dreaming up scale invariance via inverse renormalization group

投稿日: 2025年6月5日作成者: jarxiv

要約最小限のニューラルネットワークが、2次元ISINGモデルで繰り込みグループ … 続きを読む →

カテゴリー: cond-mat.stat-mech, cs.CV, cs.LG | コメントを受け付けていません

UltraBones100k: A reliable automated labeling method and large-scale dataset for ultrasound-based bone surface extraction

投稿日: 2025年6月5日作成者: jarxiv

要約超音波ベースの骨表面セグメンテーションは、コンピューター支援整形外科手術に … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

Comparing the Effects of Persistence Barcodes Aggregation and Feature Concatenation on Medical Imaging

投稿日: 2025年6月5日作成者: jarxiv

要約医療画像分析では、機能エンジニアリングは、機械学習モデルの設計とパフォーマ … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Conformal coronary calcification volume estimation with conditional coverage via histogram clustering

投稿日: 2025年6月5日作成者: jarxiv

要約 CTスキャンにおける冠動脈カルシウムの偶発的検出と定量化は、命を救う臨床介 … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

Rex-Thinker: Grounded Object Referring via Chain-of-Thought Reasoning

投稿日: 2025年6月5日作成者: jarxiv

要約オブジェクトは、特定の自然言語の説明に一致する画像内のすべてのオブジェクト … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Mitigating Hallucinations in Large Vision-Language Models via Entity-Centric Multimodal Preference Optimization

投稿日: 2025年6月5日作成者: jarxiv

要約大規模な視覚言語モデル（LVLMS）は、複数のタスクにわたって印象的な機能 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

SEM: Enhancing Spatial Understanding for Robust Robot Manipulation

Seeing What Tastes Good: Revisiting Multimodal Distributional Semantics in the Billion Parameter Era

Vocabulary-free few-shot learning for Vision-Language Models

Go Beyond Earth: Understanding Human Actions and Scenes in Microgravity Environments

Dreaming up scale invariance via inverse renormalization group

UltraBones100k: A reliable automated labeling method and large-scale dataset for ultrasound-based bone surface extraction

Comparing the Effects of Persistence Barcodes Aggregation and Feature Concatenation on Medical Imaging

Conformal coronary calcification volume estimation with conditional coverage via histogram clustering

Rex-Thinker: Grounded Object Referring via Chain-of-Thought Reasoning

Mitigating Hallucinations in Large Vision-Language Models via Entity-Centric Multimodal Preference Optimization

最近の投稿

最近のコメント

アーカイブ

カテゴリー