cs.AI」カテゴリーアーカイブ

Autonomous Human-Robot Interaction via Operator Imitation

要約 遠隔操作されたロボットのキャラクタは、操作者の経験や社会的直感を頼りに、人 … 続きを読む

カテゴリー: cs.AI, cs.RO | Autonomous Human-Robot Interaction via Operator Imitation はコメントを受け付けていません

Unified World Models: Coupling Video and Action Diffusion for Pretraining on Large Robotic Datasets

要約 模倣学習は、汎用のロボットを構築するための有望なアプローチとして浮上してき … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | Unified World Models: Coupling Video and Action Diffusion for Pretraining on Large Robotic Datasets はコメントを受け付けていません

SAT: Dynamic Spatial Aptitude Training for Multimodal Language Models

要約 運動と空間に関する推論は、複数の実世界アプリケーションで必要とされる基本的 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.RO | SAT: Dynamic Spatial Aptitude Training for Multimodal Language Models はコメントを受け付けていません

Bridging the Linguistic Divide: A Survey on Leveraging Large Language Models for Machine Translation

要約 大規模言語モデル(LLM)の登場は、機械翻訳(MT)の状況を大きく変えてき … 続きを読む

カテゴリー: cs.AI, cs.CL | Bridging the Linguistic Divide: A Survey on Leveraging Large Language Models for Machine Translation はコメントを受け付けていません

DreamActor-M1: Holistic, Expressive and Robust Human Image Animation with Hybrid Guidance

要約 近年の画像ベースのヒューマンアニメーション手法は、リアルな身体や顔の動き合 … 続きを読む

カテゴリー: cs.AI, cs.CV | DreamActor-M1: Holistic, Expressive and Robust Human Image Animation with Hybrid Guidance はコメントを受け付けていません

InfiniteICL: Breaking the Limit of Context Window Size via Long Short-term Memory Transformation

要約 文脈内学習(In-Context Learning: ICL)は大規模言語 … 続きを読む

カテゴリー: cs.AI, cs.CL | InfiniteICL: Breaking the Limit of Context Window Size via Long Short-term Memory Transformation はコメントを受け付けていません

Accelerating IoV Intrusion Detection: Benchmarking GPU-Accelerated vs CPU-Based ML Libraries

要約 自動車のインターネット(IoV)は、高度な侵入検知システムを必要とする可能 … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.LG | Accelerating IoV Intrusion Detection: Benchmarking GPU-Accelerated vs CPU-Based ML Libraries はコメントを受け付けていません

Cosmos-Transfer1: Conditional World Generation with Adaptive Multimodal Control

要約 セグメンテーション、深さ、エッジなどのさまざまなモダリティの複数の空間制御 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Cosmos-Transfer1: Conditional World Generation with Adaptive Multimodal Control はコメントを受け付けていません

FUSION: Frequency-guided Underwater Spatial Image recOnstructioN

要約 水中画像は、色の歪み、視界の低下、波長依存性の減衰と散乱による構造の詳細の … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | FUSION: Frequency-guided Underwater Spatial Image recOnstructioN はコメントを受け付けていません

Bench4Merge: A Comprehensive Benchmark for Merging in Realistic Dense Traffic with Micro-Interactive Vehicles

要約 自律運転の能力は急速に進歩していますが、密集した交通に合併することは依然と … 続きを読む

カテゴリー: cs.AI, cs.RO | Bench4Merge: A Comprehensive Benchmark for Merging in Realistic Dense Traffic with Micro-Interactive Vehicles はコメントを受け付けていません