-
最近の投稿
- Experimental Study on The Effect of Multi-step Deep Reinforcement Learning in POMDPs
- AutoLoop: Fast Visual SLAM Fine-tuning through Agentic Curriculum Learning
- Embodied Scene Understanding for Vision Language Models via MetaVQA
- Estimation-Aware Trajectory Optimization with Set-Valued Measurement Uncertainties
- Combining Movement Primitives with Contraction Theory
-
最近のコメント
表示できるコメントはありません。 cs.AI (32387) cs.CL (24483) cs.CR (2509) cs.CV (38599) cs.LG (37256) cs.RO (18883) cs.SY (2886) eess.IV (4625) eess.SY (2880) stat.ML (4916)
投稿者「jarxiv」のアーカイブ
Reward Machines for Deep RL in Noisy and Uncertain Environments
要約 報酬マシンは、命令、安全制約、その他の時間的に拡張された報酬に値する動作を … 続きを読む
AI-RAN: Transforming RAN with AI-driven Computing Infrastructure
要約 無線アクセス ネットワーク (RAN) の状況は、従来の通信中心のインフラ … 続きを読む
How Do Generative Models Draw a Software Engineer? A Case Study on Stable Diffusion Bias
要約 生成モデルは現在、複数の目的で使用されるグラフィック コンテンツを生成する … 続きを読む
Maximizing Uncertainty for Federated learning via Bayesian Optimisation-based Model Poisoning
要約 狭義の人工知能から超人工知能に移行するにつれて、ユーザーは自分のプライバシ … 続きを読む
Sports-QA: A Large-Scale Video Question Answering Benchmark for Complex and Professional Sports
要約 質問に答えるためにスポーツ ビデオを推論することは、選手のトレーニングや情 … 続きを読む
Few-Shot Learner Generalizes Across AI-Generated Image Detection
要約 大規模な合成画像データセットでトレーニングされた現在の偽画像検出器は、限ら … 続きを読む
When No-Reference Image Quality Models Meet MAP Estimation in Diffusion Latents
要約 最新の非参照画質評価 (NR-IQA) モデルは、知覚される画質を効果的に … 続きを読む
Admitting Ignorance Helps the Video Question Answering Models to Answer
要約 ディープラーニングと大規模な事前トレーニングのおかげで、ビデオ質問応答 ( … 続きを読む
3VL: Using Trees to Improve Vision-Language Models’ Interpretability
要約 ビジョン言語モデル (VLM) は、画像とテキスト表現を調整するのに効果的 … 続きを読む
Solving Energy-Independent Density for CT Metal Artifact Reduction via Neural Representation
要約 X 線 CT では、金属材料の存在下で影や縞模様のアーチファクトが発生し、 … 続きを読む