月別アーカイブ: 2025年3月

The PanAf-FGBG Dataset: Understanding the Impact of Backgrounds in Wildlife Behaviour Recognition

要約 カメラトラップビデオ映像のコンピュータービジョン分析は、キャプチャされた行 … 続きを読む

カテゴリー: cs.AI, cs.CV | The PanAf-FGBG Dataset: Understanding the Impact of Backgrounds in Wildlife Behaviour Recognition はコメントを受け付けていません

ReMatching Dynamic Reconstruction Flow

要約 画像入力から動的シーンを再構築することは、多くのダウンストリームアプリケー … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | ReMatching Dynamic Reconstruction Flow はコメントを受け付けていません

Towards long-term player tracking with graph hierarchies and domain-specific features

要約 チームスポーツ分析では、プレーヤーの外観の類似性、閉塞、および動的モーショ … 続きを読む

カテゴリー: cs.CV | Towards long-term player tracking with graph hierarchies and domain-specific features はコメントを受け付けていません

Anatomically-guided masked autoencoder pre-training for aneurysm detection

要約 頭蓋内動脈瘤は、世界中の罹患率と死亡率の主な原因であり、それらを手動で検出 … 続きを読む

カテゴリー: cs.CV | Anatomically-guided masked autoencoder pre-training for aneurysm detection はコメントを受け付けていません

AeroReformer: Aerial Referring Transformer for UAV-based Referring Image Segmentation

要約 斬新で挑戦的なタスクとして、セグメンテーションを参照することで、コンピュー … 続きを読む

カテゴリー: cs.CV | AeroReformer: Aerial Referring Transformer for UAV-based Referring Image Segmentation はコメントを受け付けていません

Dual Thinking and Logical Processing — Are Multi-modal Large Language Models Closing the Gap with Human Vision ?

要約 二重の思考フレームワークは、高速で直感的で、論理処理が遅くなることを考慮し … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | Dual Thinking and Logical Processing — Are Multi-modal Large Language Models Closing the Gap with Human Vision ? はコメントを受け付けていません

RoboBrain: A Unified Brain Model for Robotic Manipulation from Abstract to Concrete

要約 マルチモーダル大手言語モデル(MLLM)の最近の進歩は、さまざまなマルチモ … 続きを読む

カテゴリー: cs.CV, cs.RO | RoboBrain: A Unified Brain Model for Robotic Manipulation from Abstract to Concrete はコメントを受け付けていません

Exploring the Effectiveness of Object-Centric Representations in Visual Question Answering: Comparative Insights with Foundation Models

要約 離散オブジェクトの構成として視覚シーンをモデル化するオブジェクト中心(OC … 続きを読む

カテゴリー: cs.CV, cs.LG | Exploring the Effectiveness of Object-Centric Representations in Visual Question Answering: Comparative Insights with Foundation Models はコメントを受け付けていません

Language-Informed Hyperspectral Image Synthesis for Imbalanced-Small Sample Classification via Semi-Supervised Conditional Diffusion Model

要約 データ増強は、ハイパースペクトル画像分類(HSIC)の不均衡なスマルサンプ … 続きを読む

カテゴリー: cs.CV | Language-Informed Hyperspectral Image Synthesis for Imbalanced-Small Sample Classification via Semi-Supervised Conditional Diffusion Model はコメントを受け付けていません

Foundation Models — A Panacea for Artificial Intelligence in Pathology?

要約 病理学における人工知能(AI)の役割は、診断を支援することから、全体のスラ … 続きを読む

カテゴリー: cs.AI, cs.CV | Foundation Models — A Panacea for Artificial Intelligence in Pathology? はコメントを受け付けていません