月別アーカイブ: 2025年2月

Step-Video-T2V Technical Report: The Practice, Challenges, and Future of Video Foundation Model

要約 30Bパラメーターと最大204フレームの長さまでのビデオを生成する機能を備 … 続きを読む

カテゴリー: cs.CL, cs.CV | Step-Video-T2V Technical Report: The Practice, Challenges, and Future of Video Foundation Model はコメントを受け付けていません

Local-Prompt: Extensible Local Prompts for Few-Shot Out-of-Distribution Detection

要約 外れ方(OOD)検出は、既知のカテゴリと既知のカテゴリを区別することを目的 … 続きを読む

カテゴリー: cs.CV | Local-Prompt: Extensible Local Prompts for Few-Shot Out-of-Distribution Detection はコメントを受け付けていません

VisCon-100K: Leveraging Contextual Web Data for Fine-tuning Vision Language Models

要約 ビジョン言語モデル(VLM)は、さまざまな視覚ベンチマークで優れていますが … 続きを読む

カテゴリー: cs.CL, cs.CV | VisCon-100K: Leveraging Contextual Web Data for Fine-tuning Vision Language Models はコメントを受け付けていません

PromptArtisan: Multi-instruction Image Editing in Single Pass with Complete Attention Control

要約 私たちは、単一のパスで顕著な結果を達成するマルチインストラクション画像編集 … 続きを読む

カテゴリー: cs.CV, cs.HC | PromptArtisan: Multi-instruction Image Editing in Single Pass with Complete Attention Control はコメントを受け付けていません

MITO: Enabling Non-Line-of-Sight Perception using Millimeter-waves through Real-World Datasets and Simulation Tools

要約 日常のオブジェクトのマルチスペクトルミリ波(mmwave)画像の最初のデー … 続きを読む

カテゴリー: cs.CV | MITO: Enabling Non-Line-of-Sight Perception using Millimeter-waves through Real-World Datasets and Simulation Tools はコメントを受け付けていません

Probing Perceptual Constancy in Large Vision Language Models

要約 知覚的恒常性とは、距離、角度、照明の変動など、感覚入力の変化にもかかわらず … 続きを読む

カテゴリー: cs.AI, cs.CV | Probing Perceptual Constancy in Large Vision Language Models はコメントを受け付けていません

Artificial Intelligence to Assess Dental Findings from Panoramic Radiographs — A Multinational Study

要約 歯科用パノラマX線写真(DPR)は、包括的な口頭評価のために臨床診療で広く … 続きを読む

カテゴリー: cs.CV | Artificial Intelligence to Assess Dental Findings from Panoramic Radiographs — A Multinational Study はコメントを受け付けていません

QMaxViT-Unet+: A Query-Based MaxViT-Unet with Edge Enhancement for Scribble-Supervised Segmentation of Medical Images

要約 医療画像セグメンテーションのための高度なディープラーニングモデルの展開は、 … 続きを読む

カテゴリー: cs.CV | QMaxViT-Unet+: A Query-Based MaxViT-Unet with Edge Enhancement for Scribble-Supervised Segmentation of Medical Images はコメントを受け付けていません

SPIRIT: Short-term Prediction of solar IRradIance for zero-shot Transfer learning using Foundation Models

要約 従来のソーラー予測モデルは、数年のサイト固有の歴史的放射照度データに基づい … 続きを読む

カテゴリー: cs.CV, cs.LG | SPIRIT: Short-term Prediction of solar IRradIance for zero-shot Transfer learning using Foundation Models はコメントを受け付けていません

Object Detection and Tracking

要約 効率的で正確なオブジェクト検出は、コンピュータービジョンシステムの開発にお … 続きを読む

カテゴリー: cs.CV, cs.CY | Object Detection and Tracking はコメントを受け付けていません