月別アーカイブ: 2025年4月

MediSee: Reasoning-based Pixel-level Perception in Medical Images

投稿日: 2025年4月24日作成者: jarxiv

要約ピクセルレベルの医療画像認識の顕著な進歩にもかかわらず、既存の方法は特定の … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

A Low-Cost Photogrammetry System for 3D Plant Modeling and Phenotyping

投稿日: 2025年4月24日作成者: jarxiv

要約 3Dプラントモデリングと表現型のためのオープンソースの低コストの写真測量シ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Hyperspectral Vision Transformers for Greenhouse Gas Estimations from Space

投稿日: 2025年4月24日作成者: jarxiv

要約 Hyperspectralイメージングは、詳細なスペクトル情報を提供し … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

A Novel Adaptive Hybrid Focal-Entropy Loss for Enhancing Diabetic Retinopathy Detection Using Convolutional Neural Networks

投稿日: 2025年4月24日作成者: jarxiv

要約糖尿病性網膜症は、世界中の失明の主な原因であり、AIベースの正確な診断ツー … 続きを読む →

カテゴリー: 68T07, 68U10, 92C55, cs.AI, cs.CV, cs.LG, eess.IV, I.2.10 | コメントを受け付けていません

High-Quality Cloud-Free Optical Image Synthesis Using Multi-Temporal SAR and Contaminated Optical Data

投稿日: 2025年4月24日作成者: jarxiv

要約雲の覆いと衛星の長い再訪サイクルによって引き起こされるギャップに対処するこ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

BadVideo: Stealthy Backdoor Attack against Text-to-Video Generation

投稿日: 2025年4月24日作成者: jarxiv

要約テキストツービデオ（T2V）の生成モデルは、急速に進歩し、エンターテイメン … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

DreamO: A Unified Framework for Image Customization

投稿日: 2025年4月24日作成者: jarxiv

要約最近、画像のカスタマイズに関する広範な研究（例：アイデンティティ、主題、ス … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

DiffArtist: Towards Structure and Appearance Controllable Image Stylization

投稿日: 2025年4月24日作成者: jarxiv

要約芸術的なスタイルには、構造要素と外観の両方の要素が含まれます。既存のニュ … 続きを読む →

カテゴリー: cs.CV, cs.GR | コメントを受け付けていません

Critic-V: VLM Critics Help Catch VLM Errors in Multimodal Reasoning

投稿日: 2025年4月24日作成者: jarxiv

要約ビジョン言語モデル（VLM）は、マルチモーダル推論タスクの顕著な進歩を示し … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

A Survey on Mixup Augmentations and Beyond

投稿日: 2025年4月24日作成者: jarxiv

要約深いニューラルネットワークが過去10年間でスリリングなブレークスルーを達成 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

月別アーカイブ: 2025年4月

MediSee: Reasoning-based Pixel-level Perception in Medical Images

A Low-Cost Photogrammetry System for 3D Plant Modeling and Phenotyping

Hyperspectral Vision Transformers for Greenhouse Gas Estimations from Space

A Novel Adaptive Hybrid Focal-Entropy Loss for Enhancing Diabetic Retinopathy Detection Using Convolutional Neural Networks

High-Quality Cloud-Free Optical Image Synthesis Using Multi-Temporal SAR and Contaminated Optical Data

BadVideo: Stealthy Backdoor Attack against Text-to-Video Generation

DreamO: A Unified Framework for Image Customization

DiffArtist: Towards Structure and Appearance Controllable Image Stylization

Critic-V: VLM Critics Help Catch VLM Errors in Multimodal Reasoning

A Survey on Mixup Augmentations and Beyond

最近の投稿

最近のコメント

アーカイブ

カテゴリー