投稿者「jarxiv」のアーカイブ

PhantomWiki: On-Demand Datasets for Reasoning and Retrieval Evaluation

投稿日: 2025年6月10日作成者: jarxiv

要約大規模な言語モデル（LLM）の推論と検索機能を評価するためには、高品質のベ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Reparameterized LLM Training via Orthogonal Equivalence Transformation

投稿日: 2025年6月10日作成者: jarxiv

要約大規模な言語モデル（LLM）が人工知能の急速な進歩を推進していますが、これ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

FreeGave: 3D Physics Learning from Dynamic Videos by Gaussian Velocity

投稿日: 2025年6月10日作成者: jarxiv

要約この論文では、3Dシーンのジオメトリ、外観、および基礎となる物理学を純粋に … 続きを読む →

カテゴリー: cs.AI, cs.CE, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

Spatio-Temporal State Space Model For Efficient Event-Based Optical Flow

投稿日: 2025年6月10日作成者: jarxiv

要約イベントカメラは、標準のフレームベースのカメラで以前は考えられなかった新し … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Diffusion Counterfactual Generation with Semantic Abduction

投稿日: 2025年6月10日作成者: jarxiv

要約反事実的な画像生成は、アイデンティティの保存、知覚の質の維持、根本的な因果 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, stat.ML | コメントを受け付けていません

CrosswalkNet: An Optimized Deep Learning Framework for Pedestrian Crosswalk Detection in Aerial Images with High-Performance Computing

投稿日: 2025年6月10日作成者: jarxiv

要約空中および衛星画像の可用性が高まるにつれて、ディープラーニングは、輸送資産 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

EgoM2P: Egocentric Multimodal Multitask Pretraining

投稿日: 2025年6月10日作成者: jarxiv

要約 RGBビデオ、深さ、カメラのポーズ、視線などのエゴセントリックビジョンにお … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

SimLTD: Simple Supervised and Semi-Supervised Long-Tailed Object Detection

投稿日: 2025年6月10日作成者: jarxiv

要約現代の視覚認識システムは大きな進歩を遂げていますが、多くは少数の模範から学 … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Video Unlearning via Low-Rank Refusal Vector

投稿日: 2025年6月10日作成者: jarxiv

要約ビデオ生成モデルは、次の直感的な指導を通じて視覚コンテンツの作成を民主化し … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

GaussianVAE: Adaptive Learning Dynamics of 3D Gaussians for High-Fidelity Super-Resolution

投稿日: 2025年6月10日作成者: jarxiv

要約ネイティブトレーニングの解決を超えて、3Dガウススプラッティング（3DG） … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG | コメントを受け付けていません

投稿者「jarxiv」のアーカイブ

PhantomWiki: On-Demand Datasets for Reasoning and Retrieval Evaluation

Reparameterized LLM Training via Orthogonal Equivalence Transformation

FreeGave: 3D Physics Learning from Dynamic Videos by Gaussian Velocity

Spatio-Temporal State Space Model For Efficient Event-Based Optical Flow

Diffusion Counterfactual Generation with Semantic Abduction

CrosswalkNet: An Optimized Deep Learning Framework for Pedestrian Crosswalk Detection in Aerial Images with High-Performance Computing

EgoM2P: Egocentric Multimodal Multitask Pretraining

SimLTD: Simple Supervised and Semi-Supervised Long-Tailed Object Detection

Video Unlearning via Low-Rank Refusal Vector

GaussianVAE: Adaptive Learning Dynamics of 3D Gaussians for High-Fidelity Super-Resolution

最近の投稿

最近のコメント

アーカイブ

カテゴリー