-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CL」カテゴリーアーカイブ
CaLMQA: Exploring culturally specific long-form question answering across 23 languages
要約 大規模な言語モデル(LLMS)のグローバルな使用量が増えているにもかかわら … 続きを読む
Let’s Fuse Step by Step: A Generative Fusion Decoding Algorithm with LLMs for Robust and Instruction-Aware ASR and OCR
要約 「生成融合デコード」(GFD)を提案します。これは、大規模な言語モデル(L … 続きを読む
VerIF: Verification Engineering for Reinforcement Learning in Instruction Following
要約 検証可能な報酬(RLVR)による強化学習は、大規模な言語モデル(LLMS) … 続きを読む
7B Fully Open Source Moxin-LLM/VLM — From Pretraining to GRPO-based Reinforcement Learning Enhancement
要約 最近、大規模な言語モデル(LLM)は、人気と能力の両方が急速に上昇すること … 続きを読む
Language Models Resist Alignment: Evidence From Data Compression
要約 大規模な言語モデル(LLMS)は、意図しないまたは望ましくない行動を示す場 … 続きを読む
Trustworthy AI: Safety, Bias, and Privacy — A Survey
要約 人工知能システムの能力は大幅に進歩していますが、これらのシステムは依然とし … 続きを読む
Dataset of News Articles with Provenance Metadata for Media Relevance Assessment
要約 コンテキスト外および誤った画像は、今日の誤った情報と偽情報の状況におけるメ … 続きを読む
ImageChain: Advancing Sequential Image-to-Text Reasoning in Multimodal Large Language Models
要約 画像のシーケンス上の推論は、マルチモーダルの大手言語モデル(MLLMS)に … 続きを読む
Outside Knowledge Conversational Video (OKCV) Dataset — Dialoguing over Videos
要約 外部の知識視覚的質問(OK-VQA)では、モデルは画像内に関連する視覚情報 … 続きを読む
Same Task, Different Circuits: Disentangling Modality-Specific Mechanisms in VLMs
要約 Vision-Language Models(VLMS)は、視覚入力に関す … 続きを読む