-
最近の投稿
- Critique-GRPO: Advancing LLM Reasoning with Natural Language and Numerical Feedback
- UniWorld: High-Resolution Semantic Encoders for Unified Visual Understanding and Generation
- FlySearch: Exploring how vision-language models explore
- On the class of coding optimality of human languages and the origins of Zipf’s law
- Multi Layered Autonomy and AI Ecologies in Robotic Art Installations
-
最近のコメント
表示できるコメントはありません。 cs.AI (39140) cs.CL (29610) cs.CV (44535) cs.HC (2976) cs.LG (44046) cs.RO (23351) cs.SY (3564) eess.IV (5121) eess.SY (3556) stat.ML (5728)
「68T45」カテゴリーアーカイブ
Mitigating Covariate Shift in Imitation Learning for Autonomous Vehicles Using Latent Space Generative World Models
要約 自律運転における共変量シフト問題に対処するために、潜在空間生成世界モデルの … 続きを読む
Socratic Planner: Self-QA-Based Zero-Shot Planning for Embodied Instruction Following
要約 次の具体化された命令(EIF)は、インタラクティブな環境でオブジェクトをナ … 続きを読む
Harmony: A Joint Self-Supervised and Weakly-Supervised Framework for Learning General Purpose Visual Representations
要約 クリップなどのビジョン言語対照学習フレームワークは、自然言語の監督から学習 … 続きを読む
Quality Over Quantity? LLM-Based Curation for a Data-Efficient Audio-Video Foundation Model
要約 マルチモーダルの基礎モデルをトレーニングするためのオーディオとビジュアルデ … 続きを読む
ForAug: Recombining Foregrounds and Backgrounds to Improve Vision Transformer Training with Bias Mitigation
要約 トランス、特にビジョントランス(VITS)は、大規模な画像分類で最先端のパ … 続きを読む
Fast 3D point clouds retrieval for Large-scale 3D Place Recognition
要約 3Dポイントクラウドでの検索は、3Dポイントの参照内で最も類似したポイント … 続きを読む
Distilling foundation models for robust and efficient models in digital pathology
要約 近年、デジタル病理のための基礎モデル(FM)の出現は、トレーニング前のデー … 続きを読む
Physics-informed Variational Autoencoders for Improved Robustness to Environmental Factors of Variation
要約 機械学習モデルと物理モデルの組み合わせは、堅牢なデータ表現を学習するための … 続きを読む
Sequence Transferability and Task Order Selection in Continual Learning
要約 継続的な学習では、タスクシーケンスの特性とモデルパフォーマンスとの関係を理 … 続きを読む
GP-GS: Gaussian Processes for Enhanced Gaussian Splatting
要約 3Dガウスのスプラッティングは、効率的なフォトリアリスティックな新規ビュー … 続きを読む