cs.CV」カテゴリーアーカイブ

Chimera: Improving Generalist Model with Domain-Specific Experts

要約 大規模マルチモーダル モデル (LMM) の最近の進歩により、画像とテキス … 続きを読む

カテゴリー: cs.CV | Chimera: Improving Generalist Model with Domain-Specific Experts はコメントを受け付けていません

Neural Differential Appearance Equations

要約 空間的には静止しているが時間とともに変化する視覚統計を用いて、動的外観テク … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.LG | Neural Differential Appearance Equations はコメントを受け付けていません

Weakly Supervised Segmentation of Hyper-Reflective Foci with Compact Convolutional Transformers and SAM2

要約 弱教師セグメンテーションは、光干渉断層撮影 (OCT) の超反射焦点 (H … 続きを読む

カテゴリー: cs.CV | Weakly Supervised Segmentation of Hyper-Reflective Foci with Compact Convolutional Transformers and SAM2 はコメントを受け付けていません

CloudTrack: Scalable UAV Tracking with Cloud Semantics

要約 現在、無人航空機 (UAV) は、捜索エリア内の情報を収集するために捜索救 … 続きを読む

カテゴリー: cs.CV, cs.RO | CloudTrack: Scalable UAV Tracking with Cloud Semantics はコメントを受け付けていません

A Multimodal Dataset for Enhancing Industrial Task Monitoring and Engagement Prediction

要約 動的な産業ワークフローにおけるオペレーターのアクション、関与、オブジェクト … 続きを読む

カテゴリー: cs.CV | A Multimodal Dataset for Enhancing Industrial Task Monitoring and Engagement Prediction はコメントを受け付けていません

Class Distance Weighted Cross Entropy Loss for Classification of Disease Severity

要約 順序クラスを含む疾患の重症度の評価では、各クラスが重症度の増加レベルを表し … 続きを読む

カテゴリー: cs.CV | Class Distance Weighted Cross Entropy Loss for Classification of Disease Severity はコメントを受け付けていません

Dolphin: Closed-loop Open-ended Auto-research through Thinking, Practice, and Feedback

要約 科学研究のパラダイムは、人工知能 (AI) の発展により大きな変革を迎えて … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Dolphin: Closed-loop Open-ended Auto-research through Thinking, Practice, and Feedback はコメントを受け付けていません

Reusable specimen-level inference in computational pathology

要約 計算病理学の基礎モデルは、標本レベルのタスクに大きな可能性を示しており、研 … 続きを読む

カテゴリー: cs.CV, eess.IV, q-bio.TO | Reusable specimen-level inference in computational pathology はコメントを受け付けていません

Strip R-CNN: Large Strip Convolution for Remote Sensing Object Detection

要約 急速な発展が見られる一方で、リモートセンシングによる物体検出は依然として高 … 続きを読む

カテゴリー: cs.CV | Strip R-CNN: Large Strip Convolution for Remote Sensing Object Detection はコメントを受け付けていません

Scalable Vision Language Model Training via High Quality Data Curation

要約 このペーパーでは、2B パラメータを備えた最先端 (SOTA) パフォーマ … 続きを読む

カテゴリー: cs.CL, cs.CV | Scalable Vision Language Model Training via High Quality Data Curation はコメントを受け付けていません