-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Catch Me if You Search: When Contextual Web Search Results Affect the Detection of Hallucinations
要約 さまざまなタスクについて大規模な言語モデル(LLM)にますます依存していま … 続きを読む
Humans can learn to detect AI-generated texts, or at least learn when they can’t
要約 この研究では、個人が即時のフィードバックが提供された場合、人間が作成したテ … 続きを読む
AMO: Adaptive Motion Optimization for Hyper-Dexterous Humanoid Whole-Body Control
要約 ヒューマノイドロボットは、その器用さの多くを、膨大な全身の動きから導き出し … 続きを読む
VITA-Audio: Fast Interleaved Cross-Modal Token Generation for Efficient Large Speech-Language Model
要約 自然なヒューマンコンピューターの相互作用の要件が高まっているため、音声ベー … 続きを読む
From Neurons to Computation: Biological Reservoir Computing for Pattern Recognition
要約 この論文では、培養された生物学的ニューロンのプールを貯水池基板として活用し … 続きを読む
Optimization of Module Transferability in Single Image Super-Resolution: Universality Assessment and Cycle Residual Blocks
要約 ディープラーニングは、単一の画像超解像度(SISR)を大幅に進めています。 … 続きを読む
A Cognitive Paradigm Approach to Probe the Perception-Reasoning Interface in VLMs
要約 人工知能の基本的な課題は、ビジョン言語モデル(VLM)などの洗練されたモデ … 続きを読む
Beyond Bare Queries: Open-Vocabulary Object Grounding with 3D Scene Graph
要約 自然言語で説明されているオブジェクトを見つけることは、自律剤にとって重要な … 続きを読む
Generating Synthetic Data via Augmentations for Improved Facial Resemblance in DreamBooth and InstantID
要約 アマチュア写真からプロのポートレートを生成するための安定した拡散のパーソナ … 続きを読む
Real-Time Person Image Synthesis Using a Flow Matching Model
要約 ポーズガイド付きの人の画像合成(PGPI)は、ターゲットポーズとソース画像 … 続きを読む