cs.AI」カテゴリーアーカイブ

D-CODA: Diffusion for Coordinated Dual-Arm Data Augmentation

要約 2つの腕の間で必要な高次元と緊密な調整のために、双方向の操作を学ぶことは困 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントする

Lexicon3D: Probing Visual Foundation Models for Complex 3D Scene Understanding

要約 複雑な3Dシーンの理解は注目を集めており、シーンをエンコードする戦略がこの … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | コメントする

ADD: Physics-Based Motion Imitation with Adversarial Differential Discriminators

要約 複数の用語の同時最適化を必要とする多目的最適化問題は、多数のアプリケーショ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.RO | コメントする

AI and Vision based Autonomous Navigation of Nano-Drones in Partially-Known Environments

要約 センサーとプロセッサの小型化、接続されたエッジインテリジェンスの進歩、およ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.NI, cs.RO | コメントする

FindAnything: Open-Vocabulary and Object-Centric Mapping for Robot Exploration in Any Environment

要約 幾何学的に正確で意味的に表現力のある地図表現は、堅牢で安全なモバイルロボッ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | コメントする

E2E-AFG: An End-to-End Model with Adaptive Filtering for Retrieval-Augmented Generation

要約 検索された生成方法は、多くの場合、外部の知識ベースから取得されたコンテンツ … 続きを読む

カテゴリー: cs.AI, cs.CL | コメントする

Image-Text Relation Prediction for Multilingual Tweets

要約 さまざまなソーシャルネットワークが10年以上にわたってメディアのアップロー … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | コメントする

The Power of Stories: Narrative Priming Shapes How LLM Agents Collaborate and Compete

要約 Yuval Noah Harariによると、大規模な人間の協力は、一般的な … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.MA, I.2.11 | コメントする

WorldCuisines: A Massive-Scale Benchmark for Multilingual and Multicultural Visual Question Answering on Global Cuisines

要約 ビジョン言語モデル(VLM)は、特に英語以外の言語や過小評価されている文化 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | コメントする

Teochew-Wild: The First In-the-wild Teochew Dataset with Orthographic Annotations

要約 このペーパーでは、テオチュー方言のスピーチコーパスであるTeochew-W … 続きを読む

カテゴリー: cs.AI, cs.CL | コメントする