-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
投稿者「jarxiv」のアーカイブ
Aguvis: Unified Pure Vision Agents for Autonomous GUI Interaction
要約 GUIタスクの自動化は、テキスト表現への依存、プラットフォーム固有のアクシ … 続きを読む
カテゴリー: cs.CL
Aguvis: Unified Pure Vision Agents for Autonomous GUI Interaction はコメントを受け付けていません
ReplaceMe: Network Simplification via Layer Pruning and Linear Transformations
要約 本論文では、低圧縮率でも高い性能を維持しながら、変換ブロックを線形演算で効 … 続きを読む
カテゴリー: cs.CL
ReplaceMe: Network Simplification via Layer Pruning and Linear Transformations はコメントを受け付けていません
FairTranslate: An English-French Dataset for Gender Bias Evaluation in Machine Translation by Overcoming Gender Binarity
要約 大規模言語モデル(LLM)は翻訳タスクにますます活用されるようになってきて … 続きを読む
Study of the influence of a biased database on the prediction of standard algorithms for selecting the best candidate for an interview
要約 人工知能は採用プロセスのさまざまな段階で、ポジションに最適な候補者を自動的 … 続きを読む
The Effectiveness of Large Language Models in Transforming Unstructured Text to Standardized Formats
要約 非構造化テキストデータの急激な増加は、現代のデータ管理と情報検索における基 … 続きを読む
VL-Rethinker: Incentivizing Self-Reflection of Vision-Language Models with Reinforcement Learning
要約 最近、GPT-o1やDeepSeek-R1のようなゆっくり考えるシステムは … 続きを読む
LLaMA-Omni2: LLM-based Real-time Spoken Chatbot with Autoregressive Streaming Speech Synthesis
要約 リアルタイムでインテリジェントかつ自然な音声対話は、次世代の人間とコンピュ … 続きを読む
A Theoretical Analysis of Compositional Generalization in Neural Networks: A Necessary and Sufficient Condition
要約 構成的汎化は人工知能において極めて重要な特性であり、モデルが既知の構成要素 … 続きを読む
Large Language Models Understanding: an Inherent Ambiguity Barrier
要約 大規模言語モデル(LLM)の驚異的な出現以来、世界を理解し、LLMが関与す … 続きを読む
Enhancing Chemical Reaction and Retrosynthesis Prediction with Large Language Model and Dual-task Learning
要約 化学反応と逆合成の予測は、創薬における基本的なタスクである。近年、大規模言 … 続きを読む