月別アーカイブ: 2025年4月

MediSee: Reasoning-based Pixel-level Perception in Medical Images

要約 ピクセルレベルの医療画像認識の顕著な進歩にもかかわらず、既存の方法は特定の … 続きを読む

カテゴリー: cs.AI, cs.CV | MediSee: Reasoning-based Pixel-level Perception in Medical Images はコメントを受け付けていません

A Low-Cost Photogrammetry System for 3D Plant Modeling and Phenotyping

要約 3Dプラントモデリングと表現型のためのオープンソースの低コストの写真測量シ … 続きを読む

カテゴリー: cs.CV | A Low-Cost Photogrammetry System for 3D Plant Modeling and Phenotyping はコメントを受け付けていません

Hyperspectral Vision Transformers for Greenhouse Gas Estimations from Space

要約 Hyperspectralイメージングは​​、詳細なスペクトル情報を提供し … 続きを読む

カテゴリー: cs.CV | Hyperspectral Vision Transformers for Greenhouse Gas Estimations from Space はコメントを受け付けていません

A Novel Adaptive Hybrid Focal-Entropy Loss for Enhancing Diabetic Retinopathy Detection Using Convolutional Neural Networks

要約 糖尿病性網膜症は、世界中の失明の主な原因であり、AIベースの正確な診断ツー … 続きを読む

カテゴリー: 68T07, 68U10, 92C55, cs.AI, cs.CV, cs.LG, eess.IV, I.2.10 | A Novel Adaptive Hybrid Focal-Entropy Loss for Enhancing Diabetic Retinopathy Detection Using Convolutional Neural Networks はコメントを受け付けていません

High-Quality Cloud-Free Optical Image Synthesis Using Multi-Temporal SAR and Contaminated Optical Data

要約 雲の覆いと衛星の長い再訪サイクルによって引き起こされるギャップに対処するこ … 続きを読む

カテゴリー: cs.CV | High-Quality Cloud-Free Optical Image Synthesis Using Multi-Temporal SAR and Contaminated Optical Data はコメントを受け付けていません

BadVideo: Stealthy Backdoor Attack against Text-to-Video Generation

要約 テキストツービデオ(T2V)の生成モデルは、急速に進歩し、エンターテイメン … 続きを読む

カテゴリー: cs.AI, cs.CV | BadVideo: Stealthy Backdoor Attack against Text-to-Video Generation はコメントを受け付けていません

DreamO: A Unified Framework for Image Customization

要約 最近、画像のカスタマイズに関する広範な研究(例:アイデンティティ、主題、ス … 続きを読む

カテゴリー: cs.CV | DreamO: A Unified Framework for Image Customization はコメントを受け付けていません

DiffArtist: Towards Structure and Appearance Controllable Image Stylization

要約 芸術的なスタイルには、構造要素と外観の両方の要素が含まれます。 既存のニュ … 続きを読む

カテゴリー: cs.CV, cs.GR | DiffArtist: Towards Structure and Appearance Controllable Image Stylization はコメントを受け付けていません

Critic-V: VLM Critics Help Catch VLM Errors in Multimodal Reasoning

要約 ビジョン言語モデル(VLM)は、マルチモーダル推論タスクの顕著な進歩を示し … 続きを読む

カテゴリー: cs.CL, cs.CV | Critic-V: VLM Critics Help Catch VLM Errors in Multimodal Reasoning はコメントを受け付けていません

A Survey on Mixup Augmentations and Beyond

要約 深いニューラルネットワークが過去10年間でスリリングなブレークスルーを達成 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | A Survey on Mixup Augmentations and Beyond はコメントを受け付けていません