月別アーカイブ: 2025年2月

Self-Supervised Data Generation for Precision Agriculture: Blending Simulated Environments with Real Imagery

要約 精密な農業では、ラベル付きのデータと重要な共変量シフトの希少性は、機械学習 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO, I.5.2 | Self-Supervised Data Generation for Precision Agriculture: Blending Simulated Environments with Real Imagery はコメントを受け付けていません

From Vision to Sound: Advancing Audio Anomaly Detection with Vision-Based Algorithms

要約 視覚異常検出(VAD)の最近の進歩により、事前に訓練された特徴抽出器によっ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.SD, eess.AS | From Vision to Sound: Advancing Audio Anomaly Detection with Vision-Based Algorithms はコメントを受け付けていません

ART: Anonymous Region Transformer for Variable Multi-Layer Transparent Image Generation

要約 多層画像生成は、ユーザーが特定の画像レイヤーを分離、選択、編集し、生成モデ … 続きを読む

カテゴリー: cs.CV | ART: Anonymous Region Transformer for Variable Multi-Layer Transparent Image Generation はコメントを受け付けていません

Near-Shore Mapping for Detection and Tracking of Vessels

要約 自律的な表面容器(ASV)がドッキングするには、ドッキングエリアに近い他の … 続きを読む

カテゴリー: cs.CV | Near-Shore Mapping for Detection and Tracking of Vessels はコメントを受け付けていません

ARLON: Boosting Diffusion Transformers with Autoregressive Models for Long Video Generation

要約 テキストからビデオへのモデルは最近、急速かつ実質的な進歩を遂げました。 そ … 続きを読む

カテゴリー: cs.CV | ARLON: Boosting Diffusion Transformers with Autoregressive Models for Long Video Generation はコメントを受け付けていません

EgoSim: An Egocentric Multi-view Simulator and Real Dataset for Body-worn Cameras during Motion and Activity

要約 コンピュータービジョンにおけるエゴセントリックタスクに関する研究は、主に魚 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | EgoSim: An Egocentric Multi-view Simulator and Real Dataset for Body-worn Cameras during Motion and Activity はコメントを受け付けていません

SG-I2V: Self-Guided Trajectory Control in Image-to-Video Generation

要約 画像間生成の方法は、印象的な写真と現実的な品質を達成しています。 ただし、 … 続きを読む

カテゴリー: cs.CV, cs.LG | SG-I2V: Self-Guided Trajectory Control in Image-to-Video Generation はコメントを受け付けていません

Improved Detection of Latent Diffusion-Generated Images through Aligned Datasets

要約 潜在的な拡散モデル(LDM)が画像生成機能を民主化するにつれて、偽の画像を … 続きを読む

カテゴリー: cs.CV | Improved Detection of Latent Diffusion-Generated Images through Aligned Datasets はコメントを受け付けていません

IG-CFAT: An Improved GAN-Based Framework for Effectively Exploiting Transformers in Real-World Image Super-Resolution

要約 シングル画像のスーパー解像度(SISR)の分野では、トランスベースのモデル … 続きを読む

カテゴリー: cs.CV, eess.IV | IG-CFAT: An Improved GAN-Based Framework for Effectively Exploiting Transformers in Real-World Image Super-Resolution はコメントを受け付けていません

OmniAlign-V: Towards Enhanced Alignment of MLLMs with Human Preference

要約 オープンソースのマルチモーダル大手言語モデル(MLLM)の最近の進歩は、主 … 続きを読む

カテゴリー: cs.CV | OmniAlign-V: Towards Enhanced Alignment of MLLMs with Human Preference はコメントを受け付けていません