-
最近の投稿
- Geometric Scattering on Measure Spaces
- Speedup Techniques for Switchable Temporal Plan Graph Optimization
- Application of Vision-Language Model to Pedestrians Behavior and Scene Understanding in Autonomous Driving
- Vid2Sim: Realistic and Interactive Simulation from Video for Urban Navigation
- Hierarchical Sampling-based Planner with LTL Constraints and Text Prompting
-
最近のコメント
表示できるコメントはありません。 cs.AI (32178) cs.CL (24331) cs.CR (2500) cs.CV (38427) cs.LG (37057) cs.RO (18798) cs.SY (2872) eess.IV (4613) eess.SY (2866) stat.ML (4892)
投稿者「jarxiv」のアーカイブ
Can Vision-Language Models Evaluate Handwritten Math?
要約 視覚言語モデル (VLM) の最近の進歩により、特に数学において、生徒の手 … 続きを読む
Audio-CoT: Exploring Chain-of-Thought Reasoning in Large Audio Language Model
要約 Large Audio-Language Model (LALM) は、音 … 続きを読む
Comparative analysis of optical character recognition methods for Sámi texts from the National Library of Norway
要約 光学式文字認識 (OCR) は、スキャンされた文書を機械可読テキストに変換 … 続きを読む
Don’t Command, Cultivate: An Exploratory Study of System-2 Alignment
要約 o1 システム カードは、o1 モデルが OpenAI 内で最も堅牢である … 続きを読む
FinerWeb-10BT: Refining Web Data with LLM-Based Line-Level Filtering
要約 大規模言語モデル (LLM) をトレーニングするには、データ品質が非常に重 … 続きを読む
Joint Automatic Speech Recognition And Structure Learning For Better Speech Understanding
要約 音声言語理解 (SLU) は、音声の分野における構造予測タスクです。 最近 … 続きを読む
Eradicating Social Biases in Sentiment Analysis using Semantic Blinding and Semantic Propagation Graph Neural Networks
要約 この論文では、構文構造と単語レベルの感情的手がかりのみに依存してテキスト内 … 続きを読む
Are queries and keys always relevant? A case study on Transformer wave functions
要約 ドット積アテンション メカニズムは、もともと自然言語処理タスク用に設計され … 続きを読む
カテゴリー: cond-mat.dis-nn, cs.CL, physics.comp-ph
コメントする
Controlling Equational Reasoning in Large Language Models with Prompt Interventions
要約 この論文では、大規模言語モデル (LLM) における幻覚率が記号データ生成 … 続きを読む
Investigating Large Language Models in Inferring Personality Traits from User Conversations
要約 大規模言語モデル (LLM) は、心理的評価を含むさまざまな領域にわたって … 続きを読む