cs.AI」カテゴリーアーカイブ

HumanVBench: Exploring Human-Centric Video Understanding Capabilities of MLLMs with Synthetic Benchmark Data

要約 マルチモーダル大規模言語モデル (MLLM) の分野では、人間中心のビデオ … 続きを読む

カテゴリー: cs.AI, cs.CV | HumanVBench: Exploring Human-Centric Video Understanding Capabilities of MLLMs with Synthetic Benchmark Data はコメントを受け付けていません

Human-centric Reward Optimization for Reinforcement Learning-based Automated Driving using Large Language Models

要約 現在の強化学習 (RL) ベースの自動運転 (AD) エージェントにおける … 続きを読む

カテゴリー: cs.AI | Human-centric Reward Optimization for Reinforcement Learning-based Automated Driving using Large Language Models はコメントを受け付けていません

Joint Fine-tuning and Conversion of Pretrained Speech and Language Models towards Linear Complexity

要約 最近、Linformer や Mamba などのアーキテクチャが、トランス … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.SD, eess.AS | Joint Fine-tuning and Conversion of Pretrained Speech and Language Models towards Linear Complexity はコメントを受け付けていません

PC Agent: While You Sleep, AI Works — A Cognitive Journey into Digital World

要約 研究資料の整理、レポートの下書き、明日に必要なプレゼンテーションの作成など … 続きを読む

カテゴリー: cs.AI, cs.LG | PC Agent: While You Sleep, AI Works — A Cognitive Journey into Digital World はコメントを受け付けていません

GR-MG: Leveraging Partially Annotated Data via Multi-Modal Goal-Conditioned Policy

要約 ロボット工学コミュニティは、柔軟な自然言語命令による汎用化可能なロボット操 … 続きを読む

カテゴリー: cs.AI, cs.RO | GR-MG: Leveraging Partially Annotated Data via Multi-Modal Goal-Conditioned Policy はコメントを受け付けていません

CityBench: Evaluating the Capabilities of Large Language Models for Urban Tasks

要約 最近、広範な一般知識と強力な推論能力を備えた大規模言語モデル (LLM) … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | CityBench: Evaluating the Capabilities of Large Language Models for Urban Tasks はコメントを受け付けていません

LiveIdeaBench: Evaluating LLMs’ Scientific Creativity and Idea Generation with Minimal Context

要約 大規模言語モデル (LLM) は科学的タスクにおいて顕著な能力を実証してき … 続きを読む

カテゴリー: cs.AI, cs.CL | LiveIdeaBench: Evaluating LLMs’ Scientific Creativity and Idea Generation with Minimal Context はコメントを受け付けていません

Emerging Security Challenges of Large Language Models

要約 大規模言語モデル (LLM) は、教育 [4] や医療 [23] などの重 … 続きを読む

カテゴリー: cs.AI, cs.CR | Emerging Security Challenges of Large Language Models はコメントを受け付けていません

Transport-Hub-Aware Spatial-Temporal Adaptive Graph Transformer for Traffic Flow Prediction

要約 交通流予測は高度道路交通システム(ITS)の中核技術として幅広い応用が可能 … 続きを読む

カテゴリー: cs.AI | Transport-Hub-Aware Spatial-Temporal Adaptive Graph Transformer for Traffic Flow Prediction はコメントを受け付けていません

Facial Expression Analysis and Its Potentials in IoT Systems: A Contemporary Survey

要約 顔の表情は人間の感情を伝え、持続時間と強さに基づいてマクロ表情 (MaE) … 続きを読む

カテゴリー: cs.AI | Facial Expression Analysis and Its Potentials in IoT Systems: A Contemporary Survey はコメントを受け付けていません