-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
IntegratedPIFu: Integrated Pixel Aligned Implicit Function for Single-view Human Reconstruction
要約 私たちは、PIFuHD によって設定された基盤上に構築される新しいピクセル … 続きを読む
Unified Lexical Representation for Interpretable Visual-Language Alignment
要約 Visual-Language Alignment (VLA) は、CLI … 続きを読む
MixMask: Revisiting Masking Strategy for Siamese ConvNets
要約 自己教師あり学習の最近の進歩により、マスクド イメージ モデリング (MI … 続きを読む
Fine Structure-Aware Sampling: A New Sampling Training Scheme for Pixel-Aligned Implicit Models in Single-View Human Reconstruction
要約 PIFu、PIFuHD、ICON などのピクセル位置合わせされた暗黙的モデ … 続きを読む
MAN TruckScenes: A multimodal dataset for autonomous trucking in diverse conditions
要約 自動運転トラック輸送は、現代の物流と環境に大きな影響を与える可能性がある有 … 続きを読む
ZAHA: Introducing the Level of Facade Generalization and the Large-Scale Point Cloud Facade Semantic Segmentation Benchmark Dataset
要約 ファサードのセマンティック セグメンテーションは、写真測量とコンピュータ … 続きを読む
An Interpretable X-ray Style Transfer via Trainable Local Laplacian Filter
要約 放射線科医は、診断パフォーマンスをサポートするためにニーズに合わせて手動で … 続きを読む
StoryTeller: Improving Long Video Description through Global Audio-Visual Character Identification
要約 既存の大規模ビジョン言語モデル (LVLM) は、数秒程度の短いビデオの処 … 続きを読む
Token Merging for Training-Free Semantic Binding in Text-to-Image Synthesis
要約 text-to-image (T2I) モデルは優れた生成機能を示しますが … 続きを読む
Edify 3D: Scalable High-Quality 3D Asset Generation
要約 高品質の 3D アセット生成のために設計された高度なソリューションである … 続きを読む