月別アーカイブ: 2025年3月

Optimal Brain Apoptosis

投稿日: 2025年3月4日作成者: jarxiv

要約畳み込みニューラルネットワーク（CNN）とトランスフォーマーの複雑化とパラ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

A Decade’s Battle on Dataset Bias: Are We There Yet?

投稿日: 2025年3月4日作成者: jarxiv

要約 10年前にTorralba & Efros (2011)によって … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

FLARE: Feed-forward Geometry, Appearance and Camera Estimation from Uncalibrated Sparse Views

投稿日: 2025年3月4日作成者: jarxiv

要約 FLAREは、較正されていないスパースビュー画像（入力が2～8個程度）から … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Poison-splat: Computation Cost Attack on 3D Gaussian Splatting

投稿日: 2025年3月4日作成者: jarxiv

要約画期的な性能と効率性で知られる3Dガウススプラッティング（3DGS）は、3 … 続きを読む →

カテゴリー: cs.CR, cs.CV, cs.GR, cs.LG | コメントを受け付けていません

Efficient Learning With Sine-Activated Low-rank Matrices

投稿日: 2025年3月4日作成者: jarxiv

要約低ランク分解は、ニューラルネットワークアーキテクチャのパラメータ効率を向上 … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.NE | コメントを受け付けていません

CtrLoRA: An Extensible and Efficient Framework for Controllable Image Generation

投稿日: 2025年3月4日作成者: jarxiv

要約近年、大規模拡散モデルはテキストから画像（T2I）生成において目覚ましい進 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

HiLo: A Learning Framework for Generalized Category Discovery Robust to Domain Shifts

投稿日: 2025年3月4日作成者: jarxiv

要約一般化カテゴリー発見（GCD：Generalized Category D … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Monocular Depth Estimation and Segmentation for Transparent Object with Iterative Semantic and Geometric Fusion

投稿日: 2025年3月4日作成者: jarxiv

要約透明な物体の知覚は、多くのロボットタスクに不可欠である。しかし、複雑な光学 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

NavRAG: Generating User Demand Instructions for Embodied Navigation through Retrieval-Augmented LLM

投稿日: 2025年3月4日作成者: jarxiv

要約 Vision-and-Language Navigation (VLN)は … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

Text-driven Adaptation of Foundation Models for Few-shot Surgical Workflow Analysis

投稿日: 2025年3月4日作成者: jarxiv

要約目的：手術ワークフローの解析は、手術の効率と安全性を向上させるために極めて … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

月別アーカイブ: 2025年3月

Optimal Brain Apoptosis

A Decade’s Battle on Dataset Bias: Are We There Yet?

FLARE: Feed-forward Geometry, Appearance and Camera Estimation from Uncalibrated Sparse Views

Poison-splat: Computation Cost Attack on 3D Gaussian Splatting

Efficient Learning With Sine-Activated Low-rank Matrices

CtrLoRA: An Extensible and Efficient Framework for Controllable Image Generation

HiLo: A Learning Framework for Generalized Category Discovery Robust to Domain Shifts

Monocular Depth Estimation and Segmentation for Transparent Object with Iterative Semantic and Geometric Fusion

NavRAG: Generating User Demand Instructions for Embodied Navigation through Retrieval-Augmented LLM

Text-driven Adaptation of Foundation Models for Few-shot Surgical Workflow Analysis

最近の投稿

最近のコメント

アーカイブ

カテゴリー