cs.AI」カテゴリーアーカイブ

AceReason-Nemotron: Advancing Math and Code Reasoning through Reinforcement Learning

要約 推論のための大規模な強化学習(RL)の最近の進歩にもかかわらず、高性能の推 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | AceReason-Nemotron: Advancing Math and Code Reasoning through Reinforcement Learning はコメントを受け付けていません

Exploring Diffusion Transformer Designs via Grafting

要約 モデルアーキテクチャの設計には、オペレーター(注意、畳み込みなど)や構成( … 続きを読む

カテゴリー: cs.AI, cs.LG | Exploring Diffusion Transformer Designs via Grafting はコメントを受け付けていません

Rectified Point Flow: Generic Point Cloud Pose Estimation

要約 ペアワイズポイントクラウド登録とマルチパート形状アセンブリを単一の条件付き … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Rectified Point Flow: Generic Point Cloud Pose Estimation はコメントを受け付けていません

Direct Numerical Layout Generation for 3D Indoor Scene Synthesis via Spatial Reasoning

要約 具体化されたAIおよびデジタルコンテンツの作成には、現実的な3D屋内シーン … 続きを読む

カテゴリー: cs.AI, cs.CV | Direct Numerical Layout Generation for 3D Indoor Scene Synthesis via Spatial Reasoning はコメントを受け付けていません

Refer to Anything with Vision-Language Prompts

要約 最近の画像セグメンテーションモデルは、画像を視覚エンティティの高品質のマス … 続きを読む

カテゴリー: cs.AI, cs.CV | Refer to Anything with Vision-Language Prompts はコメントを受け付けていません

macOSWorld: A Multilingual Interactive Benchmark for GUI Agents

要約 グラフィカルユーザーインターフェイス(GUI)エージェントは、コンピュータ … 続きを読む

カテゴリー: cs.AI | macOSWorld: A Multilingual Interactive Benchmark for GUI Agents はコメントを受け付けていません

UniWorld-V1: High-Resolution Semantic Encoders for Unified Visual Understanding and Generation

要約 既存の統一モデルは、ビジョン言語の理解とテキストからイメージの生成において … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | UniWorld-V1: High-Resolution Semantic Encoders for Unified Visual Understanding and Generation はコメントを受け付けていません

Confidence-Guided Human-AI Collaboration: Reinforcement Learning with Distributional Proxy Value Propagation for Autonomous Driving

要約 自律運転は、モビリティ、交通安全、交通効率の重要な進歩を約束しますが、補強 … 続きを読む

カテゴリー: cs.AI, cs.RO | Confidence-Guided Human-AI Collaboration: Reinforcement Learning with Distributional Proxy Value Propagation for Autonomous Driving はコメントを受け付けていません

Biased by Design: Leveraging Inherent AI Biases to Enhance Critical Thinking of News Readers

要約 このペーパーでは、大規模な言語モデル(LLMS)を使用したプロパガンダ検出 … 続きを読む

カテゴリー: cs.AI, cs.HC | Biased by Design: Leveraging Inherent AI Biases to Enhance Critical Thinking of News Readers はコメントを受け付けていません

Grounded Vision-Language Interpreter for Integrated Task and Motion Planning

要約 ビジョン言語モデル(VLM)の最近の進歩により、言語誘導ロボットプランナー … 続きを読む

カテゴリー: cs.AI, cs.RO | Grounded Vision-Language Interpreter for Integrated Task and Motion Planning はコメントを受け付けていません