-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Safe Explicable Planning
要約 人間の期待は、他者や世界を理解することから生まれます。 人間と AI の対 … 続きを読む
Gecko: Versatile Text Embeddings Distilled from Large Language Models
要約 コンパクトで多用途なテキスト埋め込みモデルである Gecko を紹介します … 続きを読む
ReALM: Reference Resolution As Language Modeling
要約 参照解決は重要な問題であり、さまざまな種類のコンテキストを理解し、適切に処 … 続きを読む
HARMamba: Efficient Wearable Sensor Human Activity Recognition Based on Bidirectional Selective SSM
要約 ウェアラブル センサーの人間活動認識 (HAR) は、活動センシングにおけ … 続きを読む
Rapid Motor Adaptation for Robotic Manipulator Arms
要約 一般化可能な操作スキルを開発することは、身体化された AI における中心的 … 続きを読む
GlitchBench: Can large multimodal models detect video game glitches?
要約 大規模マルチモーダル モデル (LMM) は、視覚入力などの複数の入力モダ … 続きを読む
SeaBird: Segmentation in Bird’s View with Dice Loss Improves Monocular 3D Detection of Large Objects
要約 単眼 3D 検出器は、自動車や小さな物体に対して優れたパフォーマンスを実現 … 続きを読む
SERNet-Former: Semantic Segmentation by Efficient Residual Network with Attention-Boosting Gates and Attention-Fusion Networks
要約 セマンティック セグメンテーションにおける最先端の手法の効率を向上させるに … 続きを読む
MTLoRA: A Low-Rank Adaptation Approach for Efficient Multi-Task Learning
要約 大規模なデータセットで事前トレーニングされたモデルをさまざまな下流タスクに … 続きを読む
Language Model Beats Diffusion — Tokenizer is Key to Visual Generation
要約 大規模言語モデル (LLM) は、言語の生成タスクでは主要なモデルですが、 … 続きを読む