cs.AI」カテゴリーアーカイブ

ContRail: A Framework for Realistic Railway Image Synthesis using ControlNet

要約 ディープラーニングは、その並外れた有効性と多くの分野への適用性により、広く … 続きを読む

カテゴリー: cs.AI, cs.CV | ContRail: A Framework for Realistic Railway Image Synthesis using ControlNet はコメントを受け付けていません

Proactive Agents for Multi-Turn Text-to-Image Generation Under Uncertainty

要約 生成 AI モデルに対するユーザー プロンプトは、多くの場合、仕様が不十分 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Proactive Agents for Multi-Turn Text-to-Image Generation Under Uncertainty はコメントを受け付けていません

Visual Lexicon: Rich Image Features in Language Space

要約 私たちは、自然言語で伝えるのが難しい複雑な視覚的詳細を保持しながら、豊富な … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Visual Lexicon: Rich Image Features in Language Space はコメントを受け付けていません

Delve into Visual Contrastive Decoding for Hallucination Mitigation of Large Vision-Language Models

要約 大規模視覚言語モデル (LVLM) は、入力された視覚コンテンツと相関する … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Delve into Visual Contrastive Decoding for Hallucination Mitigation of Large Vision-Language Models はコメントを受け付けていません

Driv3R: Learning Dense 4D Reconstruction for Autonomous Driving

要約 動的シーンのリアルタイム 4D 再構成は、自動運転の知覚にとって依然として … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Driv3R: Learning Dense 4D Reconstruction for Autonomous Driving はコメントを受け付けていません

P3-PO: Prescriptive Point Priors for Visuo-Spatial Generalization of Robot Policies

要約 さまざまな環境条件やオブジェクト インスタンスを堅牢に処理できる一般化可能 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | P3-PO: Prescriptive Point Priors for Visuo-Spatial Generalization of Robot Policies はコメントを受け付けていません

[MASK] is All You Need

要約 生成モデルでは、次のセット予測ベースのマスク生成モデルと次のノイズ予測ベー … 続きを読む

カテゴリー: cs.AI, cs.CV | [MASK] is All You Need はコメントを受け付けていません

Code-as-Monitor: Constraint-aware Visual Programming for Reactive and Proactive Robotic Failure Detection

要約 オープンセット障害の自動検出と防止は、閉ループロボットシステムにおいて非常 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Code-as-Monitor: Constraint-aware Visual Programming for Reactive and Proactive Robotic Failure Detection はコメントを受け付けていません

APOLLO: SGD-like Memory, AdamW-level Performance

要約 大規模言語モデル (LLM) は、特に人気のある AdamW オプティマイ … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.PF | APOLLO: SGD-like Memory, AdamW-level Performance はコメントを受け付けていません

Enhancing FKG.in: automating Indian food composition analysis

要約 この論文では、インド料理のナレッジ グラフ (FKG.in) と LLM … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IR | Enhancing FKG.in: automating Indian food composition analysis はコメントを受け付けていません