月別アーカイブ: 2025年1月

Learning to Mask and Permute Visual Tokens for Vision Transformer Pre-Training

要約 自己監視型事前トレーニングの使用は、さまざまな視覚タスクのパフォーマンスを … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | Learning to Mask and Permute Visual Tokens for Vision Transformer Pre-Training はコメントを受け付けていません

DocTTT: Test-Time Training for Handwritten Document Recognition Using Meta-Auxiliary Learning

要約 手書き文書認識 (HDR) は最近大幅に進歩しましたが、複雑な背景、多様な … 続きを読む

カテゴリー: cs.CV | DocTTT: Test-Time Training for Handwritten Document Recognition Using Meta-Auxiliary Learning はコメントを受け付けていません

PreciseCam: Precise Camera Control for Text-to-Image Generation

要約 芸術的な媒体としての画像は、アイデアや感情を伝えるために特定のカメラ アン … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | PreciseCam: Precise Camera Control for Text-to-Image Generation はコメントを受け付けていません

Capsule Vision 2024 Challenge: Multi-Class Abnormality Classification for Video Capsule Endoscopy

要約 Capsule Vision 2024 チャレンジ: ビデオ カプセル内視 … 続きを読む

カテゴリー: cs.CV | Capsule Vision 2024 Challenge: Multi-Class Abnormality Classification for Video Capsule Endoscopy はコメントを受け付けていません

DynamicEarth: How Far are We from Open-Vocabulary Change Detection?

要約 進化する地球の土地被覆を監視するには、幅広いカテゴリーや状況にわたる変化を … 続きを読む

カテゴリー: cs.CV | DynamicEarth: How Far are We from Open-Vocabulary Change Detection? はコメントを受け付けていません

3D Object Manipulation in a Single Image using Generative Models

要約 画像内のオブジェクト操作は、オブジェクトのプレゼンテーションを編集するだけ … 続きを読む

カテゴリー: cs.CV | 3D Object Manipulation in a Single Image using Generative Models はコメントを受け付けていません

Search3D: Hierarchical Open-Vocabulary 3D Segmentation

要約 オープンボキャブラリーの 3D セグメンテーションにより、自由形式のテキス … 続きを読む

カテゴリー: cs.CV | Search3D: Hierarchical Open-Vocabulary 3D Segmentation はコメントを受け付けていません

A Novel Tracking Framework for Devices in X-ray Leveraging Supplementary Cue-Driven Self-Supervised Features

要約 血管形成術によって閉塞した冠動脈の適切な血流を回復するには、ライブ透視また … 続きを読む

カテゴリー: cs.AI, cs.CV | A Novel Tracking Framework for Devices in X-ray Leveraging Supplementary Cue-Driven Self-Supervised Features はコメントを受け付けていません

Pay Attention and Move Better: Harnessing Attention for Interactive Motion Generation and Training-free Editing

要約 この研究では、人間のモーション生成のインタラクティブな編集の問題を詳しく調 … 続きを読む

カテゴリー: cs.CV | Pay Attention and Move Better: Harnessing Attention for Interactive Motion Generation and Training-free Editing はコメントを受け付けていません

Boosting Diffusion Guidance via Learning Degradation-Aware Models for Blind Super Resolution

要約 最近、拡散ベースのブラインド超解像 (SR) 手法は、豊富な高周波ディテー … 続きを読む

カテゴリー: cs.CV, eess.IV | Boosting Diffusion Guidance via Learning Degradation-Aware Models for Blind Super Resolution はコメントを受け付けていません