月別アーカイブ: 2025年3月

TriDF: Triplane-Accelerated Density Fields for Few-Shot Remote Sensing Novel View Synthesis

要約 リモートセンシング新規ビュー合成(NVS)は、都市計画と環境監視における重 … 続きを読む

カテゴリー: cs.CV | TriDF: Triplane-Accelerated Density Fields for Few-Shot Remote Sensing Novel View Synthesis はコメントを受け付けていません

GuardSplat: Efficient and Robust Watermarking for 3D Gaussian Splatting

要約 3D Gaussian Splatting(3DGS)は、最近、さまざまな … 続きを読む

カテゴリー: cs.CR, cs.CV | GuardSplat: Efficient and Robust Watermarking for 3D Gaussian Splatting はコメントを受け付けていません

Parameter-free structure-texture image decomposition by unrolling

要約 この作業では、構造テクスチャー画像分解問題に取り組むためのパラメーターフリ … 続きを読む

カテゴリー: 68U10, 90C26, cs.CV, cs.NA, eess.IV, math.NA | Parameter-free structure-texture image decomposition by unrolling はコメントを受け付けていません

One-Step Residual Shifting Diffusion for Image Super-Resolution via Distillation

要約 スーパー解像度(SR)の拡散モデルは、高品質の視覚的結果を生成しますが、高 … 続きを読む

カテゴリー: cs.CV | One-Step Residual Shifting Diffusion for Image Super-Resolution via Distillation はコメントを受け付けていません

Mitigating Visual Forgetting via Take-along Visual Conditioning for Multi-modal Long CoT Reasoning

要約 大規模な言語モデル(LLMS)の最近の進歩は、推論能力の強化を実証しており … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Mitigating Visual Forgetting via Take-along Visual Conditioning for Multi-modal Long CoT Reasoning はコメントを受け付けていません

Structure-Activation Synergy: A Dual Efficiency Framework for Parameter-Memory Optimized Transfer Learning

要約 パラメーター効率の高い転送学習(PETL)は、大規模な事前訓練モデルを適応 … 続きを読む

カテゴリー: cs.CV | Structure-Activation Synergy: A Dual Efficiency Framework for Parameter-Memory Optimized Transfer Learning はコメントを受け付けていません

MAC: A Benchmark for Multiple Attributes Compositional Zero-Shot Learning

要約 構成ゼロショット学習(CZSL)は、見た構成からセマンティックプリミティブ … 続きを読む

カテゴリー: cs.CV | MAC: A Benchmark for Multiple Attributes Compositional Zero-Shot Learning はコメントを受け付けていません

Sightation Counts: Leveraging Sighted User Feedback in Building a BLV-aligned Dataset of Diagram Descriptions

要約 多くの場合、アノテーターグループとエンドユーザーグループ間でニーズと視覚能 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.HC | Sightation Counts: Leveraging Sighted User Feedback in Building a BLV-aligned Dataset of Diagram Descriptions はコメントを受け付けていません

TimeZero: Temporal Video Grounding with Reasoning-Guided LVLM

要約 Timezeroを紹介します。Timezeroは、Timezeroを紹介し … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | TimeZero: Temporal Video Grounding with Reasoning-Guided LVLM はコメントを受け付けていません

Cream of the Crop: Harvesting Rich, Scalable and Transferable Multi-Modal Data for Instruction Fine-Tuning

要約 前処理された大規模な言語モデル(LLM)は、微調整(SFT)段階(Zhou … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Cream of the Crop: Harvesting Rich, Scalable and Transferable Multi-Modal Data for Instruction Fine-Tuning はコメントを受け付けていません