-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
CountPath: Automating Fragment Counting in Digital Pathology
要約 医療画像の品質管理は、デジタル病理の重要な要素であり、診断画像が必要な基準 … 続きを読む
PiSA: A Self-Augmented Data Engine and Training Strategy for 3D Understanding with Large Models
要約 3Dマルチモーダル大手言語モデル(MLLM)は最近、実質的な進歩を遂げまし … 続きを読む
Lightweight Models for Emotional Analysis in Video
要約 この研究では、MobileNETV4とマルチスケール3D MLPミキサーベ … 続きを読む
VisualWebInstruct: Scaling up Multimodal Instruction Data through Web Search
要約 ビジョン言語モデルは、多くの知覚に焦点を当てたタスクで大きな進歩を遂げてい … 続きを読む
TruthPrInt: Mitigating LVLM Object Hallucination Via Latent Truthful-Guided Pre-Intervention
要約 オブジェクト幻覚(OH)は、大規模な視覚言語モデル(LVLMS)における主 … 続きを読む
Dual-Stage Cross-Modal Network with Dynamic Feature Fusion for Emotional Mimicry Intensity Estimation
要約 感情的な模倣強度(EMI)推定は、人間の社会的行動を理解し、人間とコンピュ … 続きを読む
Transformers without Normalization
要約 正規化層は、現代のニューラルネットワークで遍在しており、長い間不可欠である … 続きを読む
ETCH: Generalizing Body Fitting to Clothed Humans via Equivariant Tightness
要約 ボディを3D服を着た人間のポイントクラウドに取り付けることは、一般的であり … 続きを読む
LHM: Large Animatable Human Reconstruction Model from a Single Image in Seconds
要約 単一の画像からのアニメーション可能な3Dヒト再構築は、ジオメトリ、外観、お … 続きを読む