-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Adaptive Visual Imitation Learning for Robotic Assisted Feeding Across Varied Bowl Configurations and Food Types
要約 この研究では、ロボット支援給餌 (RAF) のための空間注意モジュールを備 … 続きを読む
SynCDR : Training Cross Domain Retrieval Models with Synthetic Data
要約 クロスドメイン検索では、2 つの視覚ドメインにわたって同じ意味カテゴリから … 続きを読む
Vertical Federated Image Segmentation
要約 画像ベースの問題に対する AI ソリューションの普及に伴い、データのプライ … 続きを読む
Align before Adapt: Leveraging Entity-to-Region Alignments for Generalizable Video Action Recognition
要約 大規模な視覚言語の事前トレーニング済みモデルは、さまざまなビデオ タスクで … 続きを読む
Exploring Facial Expression Recognition through Semi-Supervised Pretraining and Temporal Modeling
要約 顔表情認識 (FER) は、コンピュータ ビジョンにおいて重要な役割を果た … 続きを読む
Just Shift It: Test-Time Prototype Shifting for Zero-Shot Generalization with Vision-Language Models
要約 ビジョン言語モデル (VLM) の進歩により、特にゼロショット学習設定にお … 続きを読む
WHAC: World-grounded Humans and Cameras
要約 単眼ビデオからワールド座標系で正確なスケールで人間とカメラの軌跡を推定する … 続きを読む
TexTile: A Differentiable Metric for Texture Tileability
要約 我々は、繰り返しアーティファクトを導入することなくテクスチャ画像をそれ自体 … 続きを読む
SmartRefine: A Scenario-Adaptive Refinement Framework for Efficient Motion Prediction
要約 自動運転車 (AV) が動的で人間とロボットが混在する環境で安全に動作する … 続きを読む
Meta-Prompting for Automating Zero-shot Visual Recognition with LLMs
要約 大規模言語モデル (LLM) で生成されたカテゴリ固有のプロンプトのプロン … 続きを読む