「cs.CV」カテゴリーアーカイブ

FlySearch: Exploring how vision-language models explore

投稿日: 2025年6月4日作成者: jarxiv

要約現実の世界は混乱しており、構造化されていない。重要な情報を発見するためには … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.RO | コメントを受け付けていません

FORLA:Federated Object-centric Representation Learning with Slot Attention

投稿日: 2025年6月4日作成者: jarxiv

要約異種のラベルなしデータセット間で効率的な視覚表現を学習することは、連携学習 … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Open-world Machine Learning: A Systematic Review and Future Directions

投稿日: 2025年6月4日作成者: jarxiv

要約機械学習は、多くのアプリケーションで目覚ましい成功を収めている。しかし、既 … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

MMLA: Multi-Environment, Multi-Species, Low-Altitude Drone Dataset

投稿日: 2025年6月4日作成者: jarxiv

要約ドローン画像におけるリアルタイムの野生生物検出は、重要な生態学的モニタリン … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

HaploOmni: Unified Single Transformer for Multimodal Video Understanding and Generation

投稿日: 2025年6月4日作成者: jarxiv

要約言語モデルの進歩に伴い、統一されたマルチモーダル理解と生成は、モデルアーキ … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Deep Learning for Retinal Degeneration Assessment: A Comprehensive Analysis of the MARIO AMD Progression Challenge

投稿日: 2025年6月4日作成者: jarxiv

要約 MICCAI 2024で開催されたMARIOチャレンジは、光干渉断層計（O … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

HunyuanVideo-Avatar: High-Fidelity Audio-Driven Human Animation for Multiple Characters

投稿日: 2025年6月4日作成者: jarxiv

要約近年、音声駆動型ヒューマン・アニメーションが大きく進歩している。しかし、( … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Astrophotography turbulence mitigation via generative models

投稿日: 2025年6月4日作成者: jarxiv

要約写真撮影は、現代の天文学および宇宙研究の要である。しかし、地上の望遠鏡で撮 … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

Learning on Model Weights using Tree Experts

投稿日: 2025年6月4日作成者: jarxiv

要約公開されているモデルの数は急速に増えているが、そのほとんどは文書化されてい … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

PartComposer: Learning and Composing Part-Level Concepts from Single-Image Examples

投稿日: 2025年6月4日作成者: jarxiv

要約我々はPartComposerを発表する：テキストから画像への拡散モデルが … 続きを読む →

カテゴリー: cs.CV, cs.GR | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

FlySearch: Exploring how vision-language models explore

FORLA:Federated Object-centric Representation Learning with Slot Attention

Open-world Machine Learning: A Systematic Review and Future Directions

MMLA: Multi-Environment, Multi-Species, Low-Altitude Drone Dataset

HaploOmni: Unified Single Transformer for Multimodal Video Understanding and Generation

Deep Learning for Retinal Degeneration Assessment: A Comprehensive Analysis of the MARIO AMD Progression Challenge

HunyuanVideo-Avatar: High-Fidelity Audio-Driven Human Animation for Multiple Characters

Astrophotography turbulence mitigation via generative models

Learning on Model Weights using Tree Experts

PartComposer: Learning and Composing Part-Level Concepts from Single-Image Examples

最近の投稿

最近のコメント

アーカイブ

カテゴリー