月別アーカイブ: 2025年1月

NeRAF: 3D Scene Infused Neural Radiance and Acoustic Fields

要約 サウンドは、人間の知覚において大きな役割を果たします。 ビジョンに加えて、 … 続きを読む

カテゴリー: cs.CV, cs.SD, eess.AS | NeRAF: 3D Scene Infused Neural Radiance and Acoustic Fields はコメントを受け付けていません

Text-to-Image Generation for Vocabulary Learning Using the Keyword Method

要約 「キーワード方法」は、外国語の語彙を学ぶための効果的な手法です。 それには … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.HC, cs.LG | Text-to-Image Generation for Vocabulary Learning Using the Keyword Method はコメントを受け付けていません

Scenario Understanding of Traffic Scenes Through Large Visual Language Models

要約 自律運転、知覚、計画、および制御を包含する深い学習モデルは、高性能を達成す … 続きを読む

カテゴリー: cs.CV | Scenario Understanding of Traffic Scenes Through Large Visual Language Models はコメントを受け付けていません

LUDVIG: Learning-free Uplifting of 2D Visual features to Gaussian Splatting scenes

要約 Dino、Sam、ClipなどのVision Foundationモデルの … 続きを読む

カテゴリー: cs.CV | LUDVIG: Learning-free Uplifting of 2D Visual features to Gaussian Splatting scenes はコメントを受け付けていません

IC-Portrait: In-Context Matching for View-Consistent Personalized Portrait

要約 既存の拡散モデルは、アイデンティティを提供する生成の大きな可能性を示してい … 続きを読む

カテゴリー: cs.CV | IC-Portrait: In-Context Matching for View-Consistent Personalized Portrait はコメントを受け付けていません

A Hybrid Deep Learning CNN Model for Enhanced COVID-19 Detection from Computed Tomography (CT) Scan Images

要約 Covid-19の早期発見は、効果的な治療とその拡散を制御するために重要で … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | A Hybrid Deep Learning CNN Model for Enhanced COVID-19 Detection from Computed Tomography (CT) Scan Images はコメントを受け付けていません

SFT Memorizes, RL Generalizes: A Comparative Study of Foundation Model Post-training

要約 監視された微調整(SFT)および強化学習(RL)は、基礎モデルのトレーニン … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | SFT Memorizes, RL Generalizes: A Comparative Study of Foundation Model Post-training はコメントを受け付けていません

CubeDiff: Repurposing Diffusion-Based Image Models for Panorama Generation

要約 テキストプロンプトまたは画像から360 {\ deg}パノラマを生成するた … 続きを読む

カテゴリー: cs.CV, cs.LG | CubeDiff: Repurposing Diffusion-Based Image Models for Panorama Generation はコメントを受け付けていません

Distilling foundation models for robust and efficient models in digital pathology

要約 近年、デジタル病理のための基礎モデル(FM)の出現は、トレーニング前のデー … 続きを読む

カテゴリー: 68T45, cs.CV, I.4.9 | Distilling foundation models for robust and efficient models in digital pathology はコメントを受け付けていません

SpatialVLA: Exploring Spatial Representations for Visual-Language-Action Model

要約 この論文では、空間的理解はロボット操作のキーポイントであると主張し、ロボッ … 続きを読む

カテゴリー: cs.AI, cs.RO | SpatialVLA: Exploring Spatial Representations for Visual-Language-Action Model はコメントを受け付けていません