月別アーカイブ: 2025年3月

Optimal Brain Apoptosis

要約 畳み込みニューラルネットワーク(CNN)とトランスフォーマーの複雑化とパラ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Optimal Brain Apoptosis はコメントを受け付けていません

A Decade’s Battle on Dataset Bias: Are We There Yet?

要約 10年前にTorralba & Efros (2011)によって … 続きを読む

カテゴリー: cs.CV, cs.LG | A Decade’s Battle on Dataset Bias: Are We There Yet? はコメントを受け付けていません

FLARE: Feed-forward Geometry, Appearance and Camera Estimation from Uncalibrated Sparse Views

要約 FLAREは、較正されていないスパースビュー画像(入力が2~8個程度)から … 続きを読む

カテゴリー: cs.CV | FLARE: Feed-forward Geometry, Appearance and Camera Estimation from Uncalibrated Sparse Views はコメントを受け付けていません

Poison-splat: Computation Cost Attack on 3D Gaussian Splatting

要約 画期的な性能と効率性で知られる3Dガウススプラッティング(3DGS)は、3 … 続きを読む

カテゴリー: cs.CR, cs.CV, cs.GR, cs.LG | Poison-splat: Computation Cost Attack on 3D Gaussian Splatting はコメントを受け付けていません

Efficient Learning With Sine-Activated Low-rank Matrices

要約 低ランク分解は、ニューラルネットワークアーキテクチャのパラメータ効率を向上 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.NE | Efficient Learning With Sine-Activated Low-rank Matrices はコメントを受け付けていません

CtrLoRA: An Extensible and Efficient Framework for Controllable Image Generation

要約 近年、大規模拡散モデルはテキストから画像(T2I)生成において目覚ましい進 … 続きを読む

カテゴリー: cs.CV | CtrLoRA: An Extensible and Efficient Framework for Controllable Image Generation はコメントを受け付けていません

HiLo: A Learning Framework for Generalized Category Discovery Robust to Domain Shifts

要約 一般化カテゴリー発見(GCD:Generalized Category D … 続きを読む

カテゴリー: cs.AI, cs.CV | HiLo: A Learning Framework for Generalized Category Discovery Robust to Domain Shifts はコメントを受け付けていません

Monocular Depth Estimation and Segmentation for Transparent Object with Iterative Semantic and Geometric Fusion

要約 透明な物体の知覚は、多くのロボットタスクに不可欠である。しかし、複雑な光学 … 続きを読む

カテゴリー: cs.CV | Monocular Depth Estimation and Segmentation for Transparent Object with Iterative Semantic and Geometric Fusion はコメントを受け付けていません

NavRAG: Generating User Demand Instructions for Embodied Navigation through Retrieval-Augmented LLM

要約 Vision-and-Language Navigation (VLN)は … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | NavRAG: Generating User Demand Instructions for Embodied Navigation through Retrieval-Augmented LLM はコメントを受け付けていません

Text-driven Adaptation of Foundation Models for Few-shot Surgical Workflow Analysis

要約 目的:手術ワークフローの解析は、手術の効率と安全性を向上させるために極めて … 続きを読む

カテゴリー: cs.AI, cs.CV | Text-driven Adaptation of Foundation Models for Few-shot Surgical Workflow Analysis はコメントを受け付けていません