cs.AI」カテゴリーアーカイブ

NavGPT-2: Unleashing Navigational Reasoning Capability for Large Vision-Language Models

要約 大規模言語モデル (LLM) の目覚ましい進歩を利用して、ロボット ナビゲ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.RO | NavGPT-2: Unleashing Navigational Reasoning Capability for Large Vision-Language Models はコメントを受け付けていません

Rethinking the Integration of Prediction and Planning in Deep Learning-Based Automated Driving Systems: A Review

要約 自動運転は、個人、公共、貨物のモビリティに革命をもたらす可能性があります。 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MA, cs.RO | Rethinking the Integration of Prediction and Planning in Deep Learning-Based Automated Driving Systems: A Review はコメントを受け付けていません

Subequivariant Reinforcement Learning in 3D Multi-Entity Physical Environments

要約 3D 環境におけるマルチエンティティ システムの学習ポリシーは、エンティテ … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | Subequivariant Reinforcement Learning in 3D Multi-Entity Physical Environments はコメントを受け付けていません

The Oscars of AI Theater: A Survey on Role-Playing with Language Models

要約 この調査では、言語モデルを使用したロールプレイングの急成長分野を調査し、初 … 続きを読む

カテゴリー: cs.AI, cs.CL | The Oscars of AI Theater: A Survey on Role-Playing with Language Models はコメントを受け付けていません

Show Me the World in My Language: Establishing the First Baseline for Scene-Text to Scene-Text Translation

要約 この研究では、シーンのテキストをソース言語 (ヒンディー語など) からター … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM | Show Me the World in My Language: Establishing the First Baseline for Scene-Text to Scene-Text Translation はコメントを受け付けていません

End-to-End Evaluation for Low-Latency Simultaneous Speech Translation

要約 低遅延音声翻訳の課題は、いくつかの出版物や共有タスクによって示されているよ … 続きを読む

カテゴリー: cs.AI, cs.CL | End-to-End Evaluation for Low-Latency Simultaneous Speech Translation はコメントを受け付けていません

MERLIN: Multimodal Embedding Refinement via LLM-based Iterative Navigation for Text-Video Retrieval-Rerank Pipeline

要約 マルチメディア コンテンツの急速な拡大により、大規模なコレクションから関連 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | MERLIN: Multimodal Embedding Refinement via LLM-based Iterative Navigation for Text-Video Retrieval-Rerank Pipeline はコメントを受け付けていません

Struct-X: Enhancing Large Language Models Reasoning with Structured Data

要約 論理情報とリレーショナル情報が豊富な構造化データには、大規模言語モデル ( … 続きを読む

カテゴリー: cs.AI, cs.CL | Struct-X: Enhancing Large Language Models Reasoning with Structured Data はコメントを受け付けていません

DotaMath: Decomposition of Thought with Code Assistance and Self-correction for Mathematical Reasoning

要約 大規模言語モデル (LLM) は、単純な数学問題の処理において目覚ましい進 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | DotaMath: Decomposition of Thought with Code Assistance and Self-correction for Mathematical Reasoning はコメントを受け付けていません

Towards Collaborative Intelligence: Propagating Intentions and Reasoning for Multi-Agent Coordination with Large Language Models

要約 マルチエージェント システムで効果的にコラボレーションするには、エージェン … 続きを読む

カテゴリー: cs.AI, cs.CL | Towards Collaborative Intelligence: Propagating Intentions and Reasoning for Multi-Agent Coordination with Large Language Models はコメントを受け付けていません