「cs.CL」カテゴリーアーカイブ

RoboTwin: Dual-Arm Robot Benchmark with Generative Digital Twins (early version)

投稿日: 2024年9月5日作成者: jarxiv

要約双腕ロボットとそのツール使用能力の効果的な連携は、ロボット工学の進歩におい … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.RO | コメントを受け付けていません

MMMU-Pro: A More Robust Multi-discipline Multimodal Understanding Benchmark

投稿日: 2024年9月5日作成者: jarxiv

要約このペーパーでは、Massive Multi-discipline Mul … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

LongLLaVA: Scaling Multi-modal LLMs to 1000 Images Efficiently via Hybrid Architecture

投稿日: 2024年9月5日作成者: jarxiv

要約マルチモーダル大規模言語モデル (MLLM) のロングコンテキスト機能を拡 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM | コメントを受け付けていません

LADDER: Language Driven Slice Discovery and Error Rectification

投稿日: 2024年9月5日作成者: jarxiv

要約エラースライス検出は、構造化パターンをモデルエラーと関連付けます。既存の … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

Interpretation of Intracardiac Electrograms Through Textual Representations

投稿日: 2024年9月4日作成者: jarxiv

要約心房細動（AFib）の不規則な電気的活動を理解することは、心電図における重 … 続きを読む →

カテゴリー: cs.CL, eess.SP, I.2.7 | コメントを受け付けていません

Investigating the Robustness of LLMs on Math Word Problems

投稿日: 2024年9月4日作成者: jarxiv

要約大規模言語モデル（Large Language Models: LLM）は … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

RLAIF vs. RLHF: Scaling Reinforcement Learning from Human Feedback with AI Feedback

投稿日: 2024年9月4日作成者: jarxiv

要約人間のフィードバックからの強化学習（RLHF）は、大規模な言語モデル（LL … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

A Survey on Responsible Generative AI: What to Generate and What Not

投稿日: 2024年9月4日作成者: jarxiv

要約近年、大規模言語モデルやテキスト画像モデルのような生成AI（GenAI）は … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.CY | コメントを受け付けていません

MedFuzz: Exploring the Robustness of Large Language Models in Medical Question Answering

投稿日: 2024年9月4日作成者: jarxiv

要約大規模言語モデル(LLM)は、医学的な質問応答ベンチマークにおいて目覚まし … 続きを読む →

カテゴリー: cs.CL, cs.LG, I.2.7 | コメントを受け付けていません

REBEL: Reinforcement Learning via Regressing Relative Rewards

投稿日: 2024年9月4日作成者: jarxiv

要約プロキシマル・ポリシー最適化(PPO)は、元々は連続制御問題のために開発さ … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.LG | コメントを受け付けていません

「cs.CL」カテゴリーアーカイブ

RoboTwin: Dual-Arm Robot Benchmark with Generative Digital Twins (early version)

MMMU-Pro: A More Robust Multi-discipline Multimodal Understanding Benchmark

LongLLaVA: Scaling Multi-modal LLMs to 1000 Images Efficiently via Hybrid Architecture

LADDER: Language Driven Slice Discovery and Error Rectification

Interpretation of Intracardiac Electrograms Through Textual Representations

Investigating the Robustness of LLMs on Math Word Problems

RLAIF vs. RLHF: Scaling Reinforcement Learning from Human Feedback with AI Feedback

A Survey on Responsible Generative AI: What to Generate and What Not

MedFuzz: Exploring the Robustness of Large Language Models in Medical Question Answering

REBEL: Reinforcement Learning via Regressing Relative Rewards

最近の投稿

最近のコメント

アーカイブ

カテゴリー