cs.CV」カテゴリーアーカイブ

Towards long-term player tracking with graph hierarchies and domain-specific features

要約 チームスポーツ分析では、プレーヤーの外観の類似性、閉塞、および動的モーショ … 続きを読む

カテゴリー: cs.CV | Towards long-term player tracking with graph hierarchies and domain-specific features はコメントを受け付けていません

Anatomically-guided masked autoencoder pre-training for aneurysm detection

要約 頭蓋内動脈瘤は、世界中の罹患率と死亡率の主な原因であり、それらを手動で検出 … 続きを読む

カテゴリー: cs.CV | Anatomically-guided masked autoencoder pre-training for aneurysm detection はコメントを受け付けていません

AeroReformer: Aerial Referring Transformer for UAV-based Referring Image Segmentation

要約 斬新で挑戦的なタスクとして、セグメンテーションを参照することで、コンピュー … 続きを読む

カテゴリー: cs.CV | AeroReformer: Aerial Referring Transformer for UAV-based Referring Image Segmentation はコメントを受け付けていません

Dual Thinking and Logical Processing — Are Multi-modal Large Language Models Closing the Gap with Human Vision ?

要約 二重の思考フレームワークは、高速で直感的で、論理処理が遅くなることを考慮し … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | Dual Thinking and Logical Processing — Are Multi-modal Large Language Models Closing the Gap with Human Vision ? はコメントを受け付けていません

RoboBrain: A Unified Brain Model for Robotic Manipulation from Abstract to Concrete

要約 マルチモーダル大手言語モデル(MLLM)の最近の進歩は、さまざまなマルチモ … 続きを読む

カテゴリー: cs.CV, cs.RO | RoboBrain: A Unified Brain Model for Robotic Manipulation from Abstract to Concrete はコメントを受け付けていません

Exploring the Effectiveness of Object-Centric Representations in Visual Question Answering: Comparative Insights with Foundation Models

要約 離散オブジェクトの構成として視覚シーンをモデル化するオブジェクト中心(OC … 続きを読む

カテゴリー: cs.CV, cs.LG | Exploring the Effectiveness of Object-Centric Representations in Visual Question Answering: Comparative Insights with Foundation Models はコメントを受け付けていません

Language-Informed Hyperspectral Image Synthesis for Imbalanced-Small Sample Classification via Semi-Supervised Conditional Diffusion Model

要約 データ増強は、ハイパースペクトル画像分類(HSIC)の不均衡なスマルサンプ … 続きを読む

カテゴリー: cs.CV | Language-Informed Hyperspectral Image Synthesis for Imbalanced-Small Sample Classification via Semi-Supervised Conditional Diffusion Model はコメントを受け付けていません

Foundation Models — A Panacea for Artificial Intelligence in Pathology?

要約 病理学における人工知能(AI)の役割は、診断を支援することから、全体のスラ … 続きを読む

カテゴリー: cs.AI, cs.CV | Foundation Models — A Panacea for Artificial Intelligence in Pathology? はコメントを受け付けていません

Adaptive Keyframe Sampling for Long Video Understanding

要約 マルチモーダル大手言語モデル(MLLM)は、視覚入力をコンテキストとして大 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Adaptive Keyframe Sampling for Long Video Understanding はコメントを受け付けていません

Back to the Future Cyclopean Stereo: a human perception approach unifying deep and geometric constraints

要約 深さの不連続性と閉塞を組み込んだシクロピアンアイモデルで見られるように、分 … 続きを読む

カテゴリー: cs.CV | Back to the Future Cyclopean Stereo: a human perception approach unifying deep and geometric constraints はコメントを受け付けていません