投稿者「jarxiv」のアーカイブ

PhantomWiki: On-Demand Datasets for Reasoning and Retrieval Evaluation

要約 大規模な言語モデル(LLM)の推論と検索機能を評価するためには、高品質のベ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | PhantomWiki: On-Demand Datasets for Reasoning and Retrieval Evaluation はコメントを受け付けていません

Reparameterized LLM Training via Orthogonal Equivalence Transformation

要約 大規模な言語モデル(LLM)が人工知能の急速な進歩を推進していますが、これ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Reparameterized LLM Training via Orthogonal Equivalence Transformation はコメントを受け付けていません

FreeGave: 3D Physics Learning from Dynamic Videos by Gaussian Velocity

要約 この論文では、3Dシーンのジオメトリ、外観、および基礎となる物理学を純粋に … 続きを読む

カテゴリー: cs.AI, cs.CE, cs.CV, cs.LG, cs.RO | FreeGave: 3D Physics Learning from Dynamic Videos by Gaussian Velocity はコメントを受け付けていません

Spatio-Temporal State Space Model For Efficient Event-Based Optical Flow

要約 イベントカメラは、標準のフレームベースのカメラで以前は考えられなかった新し … 続きを読む

カテゴリー: cs.CV | Spatio-Temporal State Space Model For Efficient Event-Based Optical Flow はコメントを受け付けていません

Diffusion Counterfactual Generation with Semantic Abduction

要約 反事実的な画像生成は、アイデンティティの保存、知覚の質の維持、根本的な因果 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, stat.ML | Diffusion Counterfactual Generation with Semantic Abduction はコメントを受け付けていません

CrosswalkNet: An Optimized Deep Learning Framework for Pedestrian Crosswalk Detection in Aerial Images with High-Performance Computing

要約 空中および衛星画像の可用性が高まるにつれて、ディープラーニングは、輸送資産 … 続きを読む

カテゴリー: cs.CV | CrosswalkNet: An Optimized Deep Learning Framework for Pedestrian Crosswalk Detection in Aerial Images with High-Performance Computing はコメントを受け付けていません

EgoM2P: Egocentric Multimodal Multitask Pretraining

要約 RGBビデオ、深さ、カメラのポーズ、視線などのエゴセントリックビジョンにお … 続きを読む

カテゴリー: cs.CV | EgoM2P: Egocentric Multimodal Multitask Pretraining はコメントを受け付けていません

SimLTD: Simple Supervised and Semi-Supervised Long-Tailed Object Detection

要約 現代の視覚認識システムは大きな進歩を遂げていますが、多くは少数の模範から学 … 続きを読む

カテゴリー: cs.CV, cs.LG | SimLTD: Simple Supervised and Semi-Supervised Long-Tailed Object Detection はコメントを受け付けていません

Video Unlearning via Low-Rank Refusal Vector

要約 ビデオ生成モデルは、次の直感的な指導を通じて視覚コンテンツの作成を民主化し … 続きを読む

カテゴリー: cs.CV | Video Unlearning via Low-Rank Refusal Vector はコメントを受け付けていません

GaussianVAE: Adaptive Learning Dynamics of 3D Gaussians for High-Fidelity Super-Resolution

要約 ネイティブトレーニングの解決を超えて、3Dガウススプラッティング(3DG) … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG | GaussianVAE: Adaptive Learning Dynamics of 3D Gaussians for High-Fidelity Super-Resolution はコメントを受け付けていません