月別アーカイブ: 2025年3月

ZeroBench: An Impossible Visual Benchmark for Contemporary Large Multimodal Models

投稿日: 2025年3月7日作成者: jarxiv

要約大規模なマルチモーダルモデル（LMM）は、画像を解釈する際に大きな不足を示 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Implicit Neural Representation for Video and Image Super-Resolution

投稿日: 2025年3月7日作成者: jarxiv

要約暗黙の神経表現（INR）を利用して、低解像度のビデオと画像を効果的に再構築 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

What Are You Doing? A Closer Look at Controllable Human Video Generation

投稿日: 2025年3月7日作成者: jarxiv

要約機械学習研究の進捗状況を促進するためには、高品質のベンチマークが重要です。 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Detecting Systematic Weaknesses in Vision Models along Predefined Human-Understandable Dimensions

投稿日: 2025年3月7日作成者: jarxiv

要約スライス発見方法（SDMS）は、DNNSの体系的な弱点を見つけるための顕著 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Teach YOLO to Remember: A Self-Distillation Approach for Continual Object Detection

投稿日: 2025年3月7日作成者: jarxiv

要約 Yoloのようなリアルタイムオブジェクト検出器は、複数のエポックの大きなデ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

DEAL-YOLO: Drone-based Efficient Animal Localization using YOLO

投稿日: 2025年3月7日作成者: jarxiv

要約深い学習と空中監視技術の進歩により、野生生物の保全の取り組みが改善されてい … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Iris Style Transfer: Enhancing Iris Recognition with Style Features and Privacy Preservation through Neural Style Transfer

投稿日: 2025年3月7日作成者: jarxiv

要約 IRISテクスチャは、認証と識別のためのゴールドスタンダードバイオメトリッ … 続きを読む →

カテゴリー: cs.CV, cs.HC | コメントを受け付けていません

Floxels: Fast Unsupervised Voxel Based Scene Flow Estimation

投稿日: 2025年3月7日作成者: jarxiv

要約シーンフローの推定は、堅牢な動的オブジェクト検出、自動ラベル付け、センサー … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.RO | コメントを受け付けていません

FluidNexus: 3D Fluid Reconstruction and Prediction from a Single Video

投稿日: 2025年3月7日作成者: jarxiv

要約単一のビデオからの3D流体の外観と速度の再構築と予測を研究します。現在の … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

BHViT: Binarized Hybrid Vision Transformer

投稿日: 2025年3月7日作成者: jarxiv

要約モデルのバイナリゼーションは、畳み込みニューラルネットワーク（CNN）のリ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

月別アーカイブ: 2025年3月

ZeroBench: An Impossible Visual Benchmark for Contemporary Large Multimodal Models

Implicit Neural Representation for Video and Image Super-Resolution

What Are You Doing? A Closer Look at Controllable Human Video Generation

Detecting Systematic Weaknesses in Vision Models along Predefined Human-Understandable Dimensions

Teach YOLO to Remember: A Self-Distillation Approach for Continual Object Detection

DEAL-YOLO: Drone-based Efficient Animal Localization using YOLO

Iris Style Transfer: Enhancing Iris Recognition with Style Features and Privacy Preservation through Neural Style Transfer

Floxels: Fast Unsupervised Voxel Based Scene Flow Estimation

FluidNexus: 3D Fluid Reconstruction and Prediction from a Single Video

BHViT: Binarized Hybrid Vision Transformer

最近の投稿

最近のコメント

アーカイブ

カテゴリー