-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CL」カテゴリーアーカイブ
Transformers Learn Low Sensitivity Functions: Investigations and Implications
要約 トランスは、多くのタスクにわたって最先端の精度と堅牢性を実現しますが、それ … 続きを読む
Theoretical Benefit and Limitation of Diffusion Language Model
要約 拡散言語モデルは、テキスト生成の有望なアプローチとして浮上しています。 複 … 続きを読む
Pixel-Level Reasoning Segmentation via Multi-turn Conversations
要約 既存の視覚認識システムは、複雑で明示的なクエリの指示に依存して、一ターンダ … 続きを読む
EmbodiedBench: Comprehensive Benchmarking Multi-modal Large Language Models for Vision-Driven Embodied Agents
要約 具体化されたエージェントを作成するためにマルチモーダルの大手言語モデル(M … 続きを読む
Optimizing GPT for Video Understanding: Zero-Shot Performance and Prompt Engineering
要約 この調査では、ビデオ品質の7つの重要なカテゴリにわたってゼロショット分類の … 続きを読む
Exploring the Potential of Encoder-free Architectures in 3D LMMs
要約 エンコーダーフリーのアーキテクチャは、2Dビジュアルドメインで事前に検討さ … 続きを読む
MME-CoT: Benchmarking Chain-of-Thought in Large Multimodal Models for Reasoning Quality, Robustness, and Efficiency
要約 チェーンオブシュート(COT)で質問に答えることで、大規模な言語モデル(L … 続きを読む
Salamandra Technical Report
要約 この作業では、3つの異なるサイズのオープンソースデコーダーのみの大型言語モ … 続きを読む
カテゴリー: cs.CL
Salamandra Technical Report はコメントを受け付けていません
Faithful, Unfaithful or Ambiguous? Multi-Agent Debate with Initial Stance for Summary Evaluation
要約 大規模な言語モデル(LLM)に基づいた忠実さの評価者は、テキストの流enc … 続きを読む
カテゴリー: cs.CL
Faithful, Unfaithful or Ambiguous? Multi-Agent Debate with Initial Stance for Summary Evaluation はコメントを受け付けていません
Better Embeddings with Coupled Adam
要約 それらの驚くべき能力にもかかわらず、LLMSは、異方性の望ましくないが理解 … 続きを読む