月別アーカイブ: 2025年3月

ZeroBench: An Impossible Visual Benchmark for Contemporary Large Multimodal Models

要約 大規模なマルチモーダルモデル(LMM)は、画像を解釈する際に大きな不足を示 … 続きを読む

カテゴリー: cs.CV | ZeroBench: An Impossible Visual Benchmark for Contemporary Large Multimodal Models はコメントを受け付けていません

Implicit Neural Representation for Video and Image Super-Resolution

要約 暗黙の神経表現(INR)を利用して、低解像度のビデオと画像を効果的に再構築 … 続きを読む

カテゴリー: cs.CV | Implicit Neural Representation for Video and Image Super-Resolution はコメントを受け付けていません

What Are You Doing? A Closer Look at Controllable Human Video Generation

要約 機械学習研究の進捗状況を促進するためには、高品質のベンチマークが重要です。 … 続きを読む

カテゴリー: cs.CV | What Are You Doing? A Closer Look at Controllable Human Video Generation はコメントを受け付けていません

Detecting Systematic Weaknesses in Vision Models along Predefined Human-Understandable Dimensions

要約 スライス発見方法(SDMS)は、DNNSの体系的な弱点を見つけるための顕著 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Detecting Systematic Weaknesses in Vision Models along Predefined Human-Understandable Dimensions はコメントを受け付けていません

Teach YOLO to Remember: A Self-Distillation Approach for Continual Object Detection

要約 Yoloのようなリアルタイムオブジェクト検出器は、複数のエポックの大きなデ … 続きを読む

カテゴリー: cs.CV | Teach YOLO to Remember: A Self-Distillation Approach for Continual Object Detection はコメントを受け付けていません

DEAL-YOLO: Drone-based Efficient Animal Localization using YOLO

要約 深い学習と空中監視技術の進歩により、野生生物の保全の取り組みが改善されてい … 続きを読む

カテゴリー: cs.CV | DEAL-YOLO: Drone-based Efficient Animal Localization using YOLO はコメントを受け付けていません

Iris Style Transfer: Enhancing Iris Recognition with Style Features and Privacy Preservation through Neural Style Transfer

要約 IRISテクスチャは、認証と識別のためのゴールドスタンダードバイオメトリッ … 続きを読む

カテゴリー: cs.CV, cs.HC | Iris Style Transfer: Enhancing Iris Recognition with Style Features and Privacy Preservation through Neural Style Transfer はコメントを受け付けていません

Floxels: Fast Unsupervised Voxel Based Scene Flow Estimation

要約 シーンフローの推定は、堅牢な動的オブジェクト検出、自動ラベル付け、センサー … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | Floxels: Fast Unsupervised Voxel Based Scene Flow Estimation はコメントを受け付けていません

FluidNexus: 3D Fluid Reconstruction and Prediction from a Single Video

要約 単一のビデオからの3D流体の外観と速度の再構築と予測を研究します。 現在の … 続きを読む

カテゴリー: cs.CV | FluidNexus: 3D Fluid Reconstruction and Prediction from a Single Video はコメントを受け付けていません

BHViT: Binarized Hybrid Vision Transformer

要約 モデルのバイナリゼーションは、畳み込みニューラルネットワーク(CNN)のリ … 続きを読む

カテゴリー: cs.CV | BHViT: Binarized Hybrid Vision Transformer はコメントを受け付けていません