-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年5月
What matters when building vision-language models?
要約 視覚言語モデル(VLM)への関心の高まりは、大規模言語モデルや視覚変換器の … 続きを読む
On the test-time zero-shot generalization of vision-language models: Do we really need prompt learning?
要約 CLIPに代表される大規模な視覚言語モデルの開発は、特にソフトプロンプトチ … 続きを読む
カテゴリー: cs.CV
On the test-time zero-shot generalization of vision-language models: Do we really need prompt learning? はコメントを受け付けていません
DreamScene4D: Dynamic Multi-Object Scene Generation from Monocular Videos
要約 既存のVLMは、野生の2D映像オブジェクトを追跡することができる一方、現在 … 続きを読む
カテゴリー: cs.CV
DreamScene4D: Dynamic Multi-Object Scene Generation from Monocular Videos はコメントを受け付けていません
Vibe-Eval: A hard evaluation suite for measuring progress of multimodal language models
要約 Vibe-Evalは、マルチモーダルチャットモデルを評価するための新しいオ … 続きを読む
BrainSCUBA: Fine-Grained Natural Language Captions of Visual Cortex Selectivity
要約 高次視覚野の機能的構成を理解することは、神経科学の中心的課題である。これま … 続きを読む
Accelerating Convergence in Bayesian Few-Shot Classification
要約 ベイズ型少数ショット分類は、少数ショット学習の分野で焦点となっている。本稿 … 続きを読む
A Careful Examination of Large Language Model Performance on Grade School Arithmetic
要約 大規模言語モデル(LLM)は、数学的推論に関する多くのベンチマークで目覚ま … 続きを読む
SATO: Stable Text-to-Motion Framework
要約 Text to Motionモデルはロバストか?最近のText to Mo … 続きを読む
カテゴリー: cs.CV
SATO: Stable Text-to-Motion Framework はコメントを受け付けていません
A separability-based approach to quantifying generalization: which layer is best?
要約 ディープラーニングの分類モデルや基礎モデルにおいて、未知のデータへの汎化に … 続きを読む
UniGen: Universal Domain Generalization for Sentiment Classification via Zero-shot Dataset Generation
要約 事前学習された言語モデルは、プロンプトベースの少数ショット学習により優れた … 続きを読む