-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
A Rate-Distortion-Classification Approach for Lossy Image Compression
要約 非可逆画像圧縮では、指定されたビットレートに画像を圧縮しながら、最小限の信 … 続きを読む
Boosting Single Positive Multi-label Classification with Generalized Robust Loss
要約 マルチラベル学習(MLL)は、包括的な多義的注釈を必要とするが、この注釈を … 続きを読む
Uncovering What, Why and How: A Comprehensive Benchmark for Causation Understanding of Video Anomaly
要約 ビデオ異常理解(VAU)は、ビデオ内の異常発生を自動的に理解することを目的 … 続きを読む
RepVGG-GELAN: Enhanced GELAN with VGG-STYLE ConvNets for Brain Tumour Detection
要約 物体検出アルゴリズム、特にYOLOに基づくアルゴリズムは、速度と精度のバラ … 続きを読む
Frozen Transformers in Language Models Are Effective Visual Encoder Layers
要約 本論文は、大規模言語モデル(LLM)が、テキストデータのみで訓練されている … 続きを読む
SCULPT: Shape-Conditioned Unpaired Learning of Pose-dependent Clothed and Textured Human Meshes
要約 人間の衣服とテクスチャを持つ3Dメッシュのための新しい3D生成モデルSCU … 続きを読む
MoA: Mixture-of-Attention for Subject-Context Disentanglement in Personalized Image Generation
要約 我々は、Mixture-of-Attention(MoA)と呼ばれる、テキ … 続きを読む
MemoryMamba: Memory-Augmented State Space Model for Defect Recognition
要約 製造業の自動化が進むにつれて、精密で洗練された欠陥検出技術への需要が高まっ … 続きを読む
Language-Image Models with 3D Understanding
要約 マルチモーダル大規模言語モデル(MLLM)は、様々な2次元視覚と言語タスク … 続きを読む