-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
QKFormer: Hierarchical Spiking Transformer using Q-K Attention
要約 スパイキング ニューラル ネットワーク (SNN) とトランスフォーマー … 続きを読む
SegICL: A Universal In-context Learning Framework for Enhanced Segmentation in Medical Imaging
要約 医用画像セグメンテーション モデルは、コンテキスト内学習を通じてトレーニン … 続きを読む
In the Search for Optimal Multi-view Learning Models for Crop Classification with Global Remote Sensing Data
要約 作物の分類は、作物のパターンの変化、資源管理、炭素隔離の研究においてその役 … 続きを読む
SVGDreamer: Text Guided SVG Generation with Diffusion Model
要約 最近、テキストガイドによるスケーラブル ベクター グラフィックス (SVG … 続きを読む
Unveiling the Blind Spots: A Critical Examination of Fairness in Autonomous Driving Systems
要約 自動運転システムは、インテリジェント車両向けの Web of Things … 続きを読む
Word4Per: Zero-shot Composed Person Retrieval
要約 特定の人物の検索には大きな社会的利点とセキュリティ上の価値があり、多くの場 … 続きを読む
An Image is Worth 1/2 Tokens After Layer 2: Plug-and-Play Inference Acceleration for Large Vision-Language Models
要約 この研究では、大規模視覚言語モデル (LVLM)、特に LLaVA-1.5 … 続きを読む
Meet JEANIE: a Similarity Measure for 3D Skeleton Sequences via Temporal-Viewpoint Alignment
要約 ビデオ シーケンスは、アクションの速度、時間的位置、および被験者のポーズに … 続きを読む
The Anatomy of Adversarial Attacks: Concept-based XAI Dissection
要約 敵対的攻撃 (AA) は、ディープ ニューラル ネットワークの信頼性と堅牢 … 続きを読む
Align-to-Distill: Trainable Attention Alignment for Knowledge Distillation in Neural Machine Translation
要約 スケーラブルなディープ モデルと大規模なデータセットの出現により、ニューラ … 続きを読む