-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
投稿者「jarxiv」のアーカイブ
Optimizing Length Compression in Large Reasoning Models
要約 大規模な推論モデル(LRM)は驚くべき成功を収めていますが、しばしば不必要 … 続きを読む
SOPBench: Evaluating Language Agents at Following Standard Operating Procedures and Constraints
要約 言語エージェントが重要なタスクをますます自動化するにつれて、ドメイン固有の … 続きを読む
Controllable and Reliable Knowledge-Intensive Task-Oriented Conversational Agents with Declarative Genie Worksheets
要約 大規模な言語モデルは、タスクと知識のユーザー要求に応答して、さまざまな設定 … 続きを読む
From Bytes to Ideas: Language Modeling with Autoregressive U-Nets
要約 トークン化は、入力テキストに固定された粒度を課し、言語モデルがデータでどの … 続きを読む
A Variational Framework for Improving Naturalness in Generative Spoken Language Models
要約 テキスト処理における大規模な言語モデルの成功により、音声モデリングへの適応 … 続きを読む
Chain-of-Thought Reasoning In The Wild Is Not Always Faithful
要約 チェーンオブシャーチ(COT)の推論は、最先端のAI機能を大幅に進めていま … 続きを読む
Foundation Model Insights and a Multi-Model Approach for Superior Fine-Grained One-shot Subset Selection
要約 ワンショットサブセット選択は、情報抽出器(つまり)によって抽出された情報に … 続きを読む
DexHandDiff: Interaction-aware Diffusion Planning for Adaptive Dexterous Manipulation
要約 高度なロボット工学にとって、接触豊富な相互作用による器用な操作が重要です。 … 続きを読む
FlowAlign: Trajectory-Regularized, Inversion-Free Flow-based Image Editing
要約 Floweditなどのフローベースの画像編集方法は、安定した拡散3などの事 … 続きを読む
I Speak and You Find: Robust 3D Visual Grounding with Noisy and Ambiguous Speech Inputs
要約 既存の3Dビジュアル接地方法は、3Dシーン内でオブジェクトを見つけるために … 続きを読む
カテゴリー: cs.CV
I Speak and You Find: Robust 3D Visual Grounding with Noisy and Ambiguous Speech Inputs はコメントを受け付けていません