cs.LG」カテゴリーアーカイブ

Multimodal Autoregressive Pre-training of Large Vision Encoders

要約 大規模ビジョンエンコーダの事前トレーニングのための新しい方法を紹介します。 … 続きを読む

カテゴリー: cs.CV, cs.LG | コメントする

Coarse Correspondences Boost Spatial-Temporal Reasoning in Multimodal Language Model

要約 マルチモーダル言語モデル (MLLM) は現実世界の環境でますます適用され … 続きを読む

カテゴリー: cs.CV, cs.LG | コメントする

Stable Flow: Vital Layers for Training-Free Image Editing

要約 拡散モデルは、コンテンツの合成と編集の分野に革命をもたらしました。 最近の … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.LG | コメントする

LLMSteer: Improving Long-Context LLM Inference by Steering Attention on Reused Contexts

要約 大規模言語モデル (LLM) は複雑なタスクで優れたパフォーマンスを示しま … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする

ViSTa Dataset: Do vision-language models understand sequential tasks?

要約 強化学習の報酬モデルとしてビジョン言語モデル (VLM) を使用すると、コ … 続きを読む

カテゴリー: cs.CV, cs.LG | コメントする

Predicting Wall Thickness Changes in Cold Forging Processes: An Integrated FEM and Neural Network approach

要約 この研究では、ノージングプロセス中のチューブの壁厚の変化を予測するための新 … 続きを読む

カテゴリー: cs.LG | コメントする

Extended Neural Contractive Dynamical Systems: On Multiple Tasks and Riemannian Safety Regions

要約 完全自律型ロボットが望ましくない、または潜在的に有害な動作を行わないように … 続きを読む

カテゴリー: cs.LG, cs.RO | コメントする

Transformers with Sparse Attention for Granger Causality

要約 時間的因果分析とは、時間の経過とともに観察される変数の背後にある根本的な原 … 続きを読む

カテゴリー: cs.LG | コメントする

Locally Adaptive One-Class Classifier Fusion with Dynamic $\ell$p-Norm Constraints for Robust Anomaly Detection

要約 この論文では、動的な $\ell$p-norm 制約を使用した局所適応学習 … 続きを読む

カテゴリー: cs.LG, stat.ML | コメントする

Vertical Validation: Evaluating Implicit Generative Models for Graphs on Thin Support Regions

要約 暗黙的なグラフ生成モデルを医学や材料設計のための新しい分子の設計や発見に使 … 続きを読む

カテゴリー: cs.LG | コメントする