cs.CL」カテゴリーアーカイブ

RoboTwin: Dual-Arm Robot Benchmark with Generative Digital Twins (early version)

要約 双腕ロボットとそのツール使用能力の効果的な連携は、ロボット工学の進歩におい … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.RO | RoboTwin: Dual-Arm Robot Benchmark with Generative Digital Twins (early version) はコメントを受け付けていません

MMMU-Pro: A More Robust Multi-discipline Multimodal Understanding Benchmark

要約 このペーパーでは、Massive Multi-discipline Mul … 続きを読む

カテゴリー: cs.CL, cs.CV | MMMU-Pro: A More Robust Multi-discipline Multimodal Understanding Benchmark はコメントを受け付けていません

LongLLaVA: Scaling Multi-modal LLMs to 1000 Images Efficiently via Hybrid Architecture

要約 マルチモーダル大規模言語モデル (MLLM) のロングコンテキスト機能を拡 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM | LongLLaVA: Scaling Multi-modal LLMs to 1000 Images Efficiently via Hybrid Architecture はコメントを受け付けていません

LADDER: Language Driven Slice Discovery and Error Rectification

要約 エラースライス検出は、構造化パターンをモデルエラーと関連付けます。 既存の … 続きを読む

カテゴリー: cs.CL, cs.CV | LADDER: Language Driven Slice Discovery and Error Rectification はコメントを受け付けていません

Interpretation of Intracardiac Electrograms Through Textual Representations

要約 心房細動(AFib)の不規則な電気的活動を理解することは、心電図における重 … 続きを読む

カテゴリー: cs.CL, eess.SP, I.2.7 | Interpretation of Intracardiac Electrograms Through Textual Representations はコメントを受け付けていません

Investigating the Robustness of LLMs on Math Word Problems

要約 大規模言語モデル(Large Language Models: LLM)は … 続きを読む

カテゴリー: cs.CL | Investigating the Robustness of LLMs on Math Word Problems はコメントを受け付けていません

RLAIF vs. RLHF: Scaling Reinforcement Learning from Human Feedback with AI Feedback

要約 人間のフィードバックからの強化学習(RLHF)は、大規模な言語モデル(LL … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | RLAIF vs. RLHF: Scaling Reinforcement Learning from Human Feedback with AI Feedback はコメントを受け付けていません

A Survey on Responsible Generative AI: What to Generate and What Not

要約 近年、大規模言語モデルやテキスト画像モデルのような生成AI(GenAI)は … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.CY | A Survey on Responsible Generative AI: What to Generate and What Not はコメントを受け付けていません

MedFuzz: Exploring the Robustness of Large Language Models in Medical Question Answering

要約 大規模言語モデル(LLM)は、医学的な質問応答ベンチマークにおいて目覚まし … 続きを読む

カテゴリー: cs.CL, cs.LG, I.2.7 | MedFuzz: Exploring the Robustness of Large Language Models in Medical Question Answering はコメントを受け付けていません

REBEL: Reinforcement Learning via Regressing Relative Rewards

要約 プロキシマル・ポリシー最適化(PPO)は、元々は連続制御問題のために開発さ … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | REBEL: Reinforcement Learning via Regressing Relative Rewards はコメントを受け付けていません