cs.CV」カテゴリーアーカイブ

MsaMIL-Net: An End-to-End Multi-Scale Aware Multiple Instance Learning Network for Efficient Whole Slide Image Classification

要約 バッグベースの複数インスタンス学習(MIL)アプローチは、スライド画像全体 … 続きを読む

カテゴリー: cs.AI, cs.CV | MsaMIL-Net: An End-to-End Multi-Scale Aware Multiple Instance Learning Network for Efficient Whole Slide Image Classification はコメントを受け付けていません

HierarQ: Task-Aware Hierarchical Q-Former for Enhanced Video Understanding

要約 マルチモーダルの大手言語モデル(MLLM)の進歩にもかかわらず、現在のアプ … 続きを読む

カテゴリー: cs.CV | HierarQ: Task-Aware Hierarchical Q-Former for Enhanced Video Understanding はコメントを受け付けていません

Integration of nested cross-validation, automated hyperparameter optimization, high-performance computing to reduce and quantify the variance of test performance estimation of deep learning models

要約 医療イメージングのためのディープラーニングモデルの実際のパフォーマンスベン … 続きを読む

カテゴリー: cs.CV | Integration of nested cross-validation, automated hyperparameter optimization, high-performance computing to reduce and quantify the variance of test performance estimation of deep learning models はコメントを受け付けていません

3D Point Cloud Generation via Autoregressive Up-sampling

要約 3Dポイントクラウド生成向けの先駆的なオートレーフレフな生成モデルを紹介し … 続きを読む

カテゴリー: cs.CV, cs.LG | 3D Point Cloud Generation via Autoregressive Up-sampling はコメントを受け付けていません

X-Field: A Physically Grounded Representation for 3D X-ray Reconstruction

要約 X線イメージングは​​、医療診断において不可欠ですが、その使用は潜在的な健 … 続きを読む

カテゴリー: cs.CV | X-Field: A Physically Grounded Representation for 3D X-ray Reconstruction はコメントを受け付けていません

LiSu: A Dataset and Method for LiDAR Surface Normal Estimation

要約 表面正数は3Dシーンのジオメトリを分析するために広く使用されていますが、L … 続きを読む

カテゴリー: cs.CV | LiSu: A Dataset and Method for LiDAR Surface Normal Estimation はコメントを受け付けていません

ReTaKe: Reducing Temporal and Knowledge Redundancy for Long Video Understanding

要約 ビデオ大規模な言語モデル(Videollms)は、ビデオ理解において顕著な … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.MM | ReTaKe: Reducing Temporal and Knowledge Redundancy for Long Video Understanding はコメントを受け付けていません

CellStyle: Improved Zero-Shot Cell Segmentation via Style Transfer

要約 細胞顕微鏡データは豊富です。 ただし、対応するセグメンテーション注釈は希少 … 続きを読む

カテゴリー: cs.CV, cs.LG | CellStyle: Improved Zero-Shot Cell Segmentation via Style Transfer はコメントを受け付けていません

Tuning-Free Multi-Event Long Video Generation via Synchronized Coupled Sampling

要約 テキストからビデオへの拡散モデルの最近の進歩により、単一のプロンプトから高 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Tuning-Free Multi-Event Long Video Generation via Synchronized Coupled Sampling はコメントを受け付けていません

Curriculum Direct Preference Optimization for Diffusion and Consistency Models

要約 直接選好最適化(DPO)は、人間のフィードバック(RLHF)からの強化学習 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Curriculum Direct Preference Optimization for Diffusion and Consistency Models はコメントを受け付けていません