cs.AI」カテゴリーアーカイブ

Resfusion: Denoising Diffusion Probabilistic Models for Image Restoration Based on Prior Residual Noise

要約 近年、ノイズ除去拡散モデルの研究は、画像復元の分野にも応用を広げている。従 … 続きを読む

カテゴリー: cs.AI, cs.CV | Resfusion: Denoising Diffusion Probabilistic Models for Image Restoration Based on Prior Residual Noise はコメントを受け付けていません

Variational Bayes Gaussian Splatting

要約 近年、3Dガウススプラッティングは、ガウスの混合を使用して3Dシーンをモデ … 続きを読む

カテゴリー: cs.AI, cs.CV | Variational Bayes Gaussian Splatting はコメントを受け付けていません

Unraveling the Truth: Do VLMs really Understand Charts? A Deep Dive into Consistency and Robustness

要約 図表質問応答(CQA)は、視覚言語理解の重要な分野である。しかし、この分野 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.HC, cs.LG | Unraveling the Truth: Do VLMs really Understand Charts? A Deep Dive into Consistency and Robustness はコメントを受け付けていません

AID: Attention Interpolation of Text-to-Image Diffusion

要約 条件拡散モデルは、様々な環境において未見の画像を作成し、画像補間を支援する … 続きを読む

カテゴリー: cs.AI, cs.CV | AID: Attention Interpolation of Text-to-Image Diffusion はコメントを受け付けていません

GenSim2: Scaling Robot Data Generation with Multi-modal and Reasoning LLMs

要約 今日のロボットシミュレーションは、多様なシミュレーションタスクとシーンを作 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | GenSim2: Scaling Robot Data Generation with Multi-modal and Reasoning LLMs はコメントを受け付けていません

Estimating Body and Hand Motion in an Ego-sensed World

要約 我々は、ヘッドマウントデバイスから人間の動きを推定するシステムEgoAll … 続きを読む

カテゴリー: cs.AI, cs.CV | Estimating Body and Hand Motion in an Ego-sensed World はコメントを受け付けていません

Justice or Prejudice? Quantifying Biases in LLM-as-a-Judge

要約 LLM-as-a-Judgeは、様々なベンチマークにおける評価手法として広 … 続きを読む

カテゴリー: cs.AI, cs.CL | Justice or Prejudice? Quantifying Biases in LLM-as-a-Judge はコメントを受け付けていません

EIA: Environmental Injection Attack on Generalist Web Agents for Privacy Leakage

要約 ジェネラリスト型ウェブエージェントは、実際のウェブサイト上で様々なタスクを … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR, cs.LG | EIA: Environmental Injection Attack on Generalist Web Agents for Privacy Leakage はコメントを受け付けていません

Scaling Manipulation Learning with Visual Kinematic Chain Prediction

要約 多様なデータセットから汎用モデルを学習することは、機械学習において大きな成 … 続きを読む

カテゴリー: cs.AI, cs.RO | Scaling Manipulation Learning with Visual Kinematic Chain Prediction はコメントを受け付けていません

Reinforcement Learning with Foundation Priors: Let the Embodied Agent Efficiently Learn on Its Own

要約 強化学習(RL)は、ロボットの操作タスクを解決するための有望なアプローチで … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | Reinforcement Learning with Foundation Priors: Let the Embodied Agent Efficiently Learn on Its Own はコメントを受け付けていません