cs.AI」カテゴリーアーカイブ

Towards Robust Offline Reinforcement Learning under Diverse Data Corruption

要約 オフライン強化学習 (RL) は、コストがかかる、または環境との安全でない … 続きを読む

カテゴリー: cs.AI, cs.LG | Towards Robust Offline Reinforcement Learning under Diverse Data Corruption はコメントを受け付けていません

SAGE: Smart home Agent with Grounded Execution

要約 大規模言語モデル (LLM) に関する常識的な推論能力と広範な一般知識によ … 続きを読む

カテゴリー: cs.AI, cs.HC, cs.RO | SAGE: Smart home Agent with Grounded Execution はコメントを受け付けていません

Weathering Ongoing Uncertainty: Learning and Planning in a Time-Varying Partially Observable Environment

要約 最適な意思決定は、不確実で確率的かつ時間とともに変化する環境で動作する自律 … 続きを読む

カテゴリー: cs.AI, cs.RO, cs.SY, eess.SY | Weathering Ongoing Uncertainty: Learning and Planning in a Time-Varying Partially Observable Environment はコメントを受け付けていません

Choreographer: Learning and Adapting Skills in Imagination

要約 教師なしスキル学習は、外部の監督なしで行動の豊富なレパートリーを学習し、人 … 続きを読む

カテゴリー: cs.AI, cs.LG | Choreographer: Learning and Adapting Skills in Imagination はコメントを受け付けていません

LLMCarbon: Modeling the end-to-end Carbon Footprint of Large Language Models

要約 大規模言語モデル (LLM) に関連する二酸化炭素排出量は、運用および具体 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CY, cs.LG | LLMCarbon: Modeling the end-to-end Carbon Footprint of Large Language Models はコメントを受け付けていません

Using LLMs to discover emerging coded antisemitic hate-speech emergence in extremist social media

要約 オンラインでのヘイトスピーチの蔓延は、ソーシャルメディアプラットフォームに … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IR, cs.LG | Using LLMs to discover emerging coded antisemitic hate-speech emergence in extremist social media はコメントを受け付けていません

Advancements in eHealth Data Analytics through Natural Language Processing and Deep Learning

要約 医療環境は一般に「情報が豊富」であると同時に「知識が乏しい」とも言われます … 続きを読む

カテゴリー: cs.AI, cs.CL | Advancements in eHealth Data Analytics through Natural Language Processing and Deep Learning はコメントを受け付けていません

Pruning for Protection: Increasing Jailbreak Resistance in Aligned LLMs Without Fine-Tuning

要約 大規模言語モデル (LLM) は、これらのモデルを誘導して有害で違法なコン … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR, cs.LG | Pruning for Protection: Increasing Jailbreak Resistance in Aligned LLMs Without Fine-Tuning はコメントを受け付けていません

Reinforcement learning for question answering in programming domain using public community scoring as a human feedback

要約 この研究では、ヒューマン フィードバックからの強化学習 (RLHF) の統 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.HC | Reinforcement learning for question answering in programming domain using public community scoring as a human feedback はコメントを受け付けていません

A comprehensive study on fidelity metrics for XAI

要約 eXplainable Artificial Intelligence ( … 続きを読む

カテゴリー: cs.AI, cs.CV | A comprehensive study on fidelity metrics for XAI はコメントを受け付けていません