月別アーカイブ: 2025年2月

Conformal Predictions for Human Action Recognition with Vision-Language Models

要約 Human-in-the-Loop(HITL)フレームワークは、多くの現実 … 続きを読む

カテゴリー: cs.AI, cs.CV | Conformal Predictions for Human Action Recognition with Vision-Language Models はコメントを受け付けていません

Few-Shot Classification and Anatomical Localization of Tissues in SPECT Imaging

要約 正確な分類と解剖学的局在は、効果的な医療診断と研究に不可欠であり、深い学習 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Few-Shot Classification and Anatomical Localization of Tissues in SPECT Imaging はコメントを受け付けていません

Do generative video models learn physical principles from watching videos?

要約 AIビデオ生成は革命を起こしており、品質とリアリズムが急速に進歩しています … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG | Do generative video models learn physical principles from watching videos? はコメントを受け付けていません

Prototype Contrastive Consistency Learning for Semi-Supervised Medical Image Segmentation

要約 医療画像のセグメンテーションは、医療画像分析において重要なタスクですが、特 … 続きを読む

カテゴリー: cs.CV, I.4.6 | Prototype Contrastive Consistency Learning for Semi-Supervised Medical Image Segmentation はコメントを受け付けていません

Generalizable Implicit Motion Modeling for Video Frame Interpolation

要約 モーションモデリングは、フローベースのビデオフレーム補間(VFI)で重要で … 続きを読む

カテゴリー: cs.CV | Generalizable Implicit Motion Modeling for Video Frame Interpolation はコメントを受け付けていません

CHIRLA: Comprehensive High-resolution Identification and Re-identification for Large-scale Analysis

要約 人の再識別(REID)は、コンピュータービジョンの重要な課題であり、さまざ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | CHIRLA: Comprehensive High-resolution Identification and Re-identification for Large-scale Analysis はコメントを受け付けていません

Transfer Your Perspective: Controllable 3D Generation from Any Viewpoint in a Driving Scene

要約 自動運転車は、自我中心の認識に依存して、感覚の制限に直面し、しばしば閉塞さ … 続きを読む

カテゴリー: cs.CV | Transfer Your Perspective: Controllable 3D Generation from Any Viewpoint in a Driving Scene はコメントを受け付けていません

Optimal Visual Search with Highly Heuristic Decision Rules

要約 視覚検索は、人間や他の動物にとって基本的な自然な仕事です。 よく分離された … 続きを読む

カテゴリー: cs.CV, q-bio.NC, stat.AP | Optimal Visual Search with Highly Heuristic Decision Rules はコメントを受け付けていません

MultiVENT 2.0: A Massive Multilingual Benchmark for Event-Centric Video Retrieval

要約 大規模なマルチモーダルコレクションから情報を効率的に取得して合成することが … 続きを読む

カテゴリー: cs.CL, cs.CV | MultiVENT 2.0: A Massive Multilingual Benchmark for Event-Centric Video Retrieval はコメントを受け付けていません

GHOST: Gaussian Hypothesis Open-Set Technique

要約 大規模な認識方法の評価は、通常、全体的なパフォーマンスに焦点を当てています … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | GHOST: Gaussian Hypothesis Open-Set Technique はコメントを受け付けていません