cs.AI」カテゴリーアーカイブ

Beyond Text: Utilizing Vocal Cues to Improve Decision Making in LLMs for Robot Navigation Tasks

要約 LLM は人間の会話におけるテキストの処理には優れていますが、ソーシャル … 続きを読む

カテゴリー: cs.AI, cs.RO | Beyond Text: Utilizing Vocal Cues to Improve Decision Making in LLMs for Robot Navigation Tasks はコメントを受け付けていません

XFT: Unlocking the Power of Code Instruction Tuning by Simply Merging Upcycled Mixture-of-Experts

要約 アップサイクルされた専門家混合 (MoE) をマージするだけで、命令調整さ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.SE | XFT: Unlocking the Power of Code Instruction Tuning by Simply Merging Upcycled Mixture-of-Experts はコメントを受け付けていません

Neuro-Inspired Hierarchical Multimodal Learning

要約 現実世界の包括的かつ正確な認識を得るには、さまざまなソースやモダリティから … 続きを読む

カテゴリー: cs.AI, cs.LG | Neuro-Inspired Hierarchical Multimodal Learning はコメントを受け付けていません

Aligning LLM Agents by Learning Latent Preference from User Edits

要約 私たちは、エージェントの出力に対して行われたユーザー編集に基づいて、言語エ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IR, cs.LG | Aligning LLM Agents by Learning Latent Preference from User Edits はコメントを受け付けていません

A review of deep learning-based information fusion techniques for multimodal medical image classification

要約 マルチモーダル医用画像処理は、さまざまな画像処理装置からの情報を組み合わせ … 続きを読む

カテゴリー: cs.AI, cs.CV | A review of deep learning-based information fusion techniques for multimodal medical image classification はコメントを受け付けていません

Visual Grounding Methods for VQA are Working for the Wrong Reasons!

要約 既存のビジュアル質問応答 (VQA) 手法は、正しい理由から正しい答えを生 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Visual Grounding Methods for VQA are Working for the Wrong Reasons! はコメントを受け付けていません

Taming Diffusion Probabilistic Models for Character Control

要約 モーション拡散確率モデルを効果的に利用して、高品質で多様なキャラクター ア … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR | Taming Diffusion Probabilistic Models for Character Control はコメントを受け付けていません

CutDiffusion: A Simple, Fast, Cheap, and Strong Diffusion Extrapolation Method

要約 高解像度の要求に応えるために、事前にトレーニングされた大規模な低解像度拡散 … 続きを読む

カテゴリー: cs.AI, cs.CV | CutDiffusion: A Simple, Fast, Cheap, and Strong Diffusion Extrapolation Method はコメントを受け付けていません

VT-Former: An Exploratory Study on Vehicle Trajectory Prediction for Highway Surveillance through Graph Isomorphism and Transformer

要約 道路の安全性の向上は、高度道路交通システム (ITS) にとって不可欠なコ … 続きを読む

カテゴリー: cs.AI, cs.CV | VT-Former: An Exploratory Study on Vehicle Trajectory Prediction for Highway Surveillance through Graph Isomorphism and Transformer はコメントを受け付けていません

Deep Models for Multi-View 3D Object Recognition: A Review

要約 人間の意思決定は、多くの場合、複数の視点や視点からの視覚情報に依存します。 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Deep Models for Multi-View 3D Object Recognition: A Review はコメントを受け付けていません