投稿者「jarxiv」のアーカイブ

‘Stupid robot, I want to speak to a human!’ User Frustration Detection in Task-Oriented Dialog Systems

要約 最新のタスク指向ダイアログ (TOD) システムにおけるユーザーのフラスト … 続きを読む

カテゴリー: cs.CL | コメントする

From Conversation to Automation: Leveraging Large Language Models to Analyze Strategies in Problem Solving Therapy

要約 問題解決療法 (PST) は、問題の特定、解決策のブレインストーミング、意 … 続きを読む

カテゴリー: cs.CL | コメントする

Merging Feed-Forward Sublayers for Compressed Transformers

要約 大規模な深層学習モデルが台頭し普及するにつれて、これらのモデルを広く展開す … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする

S2-Attention: Hardware-Aware Context Sharding Among Attention Heads

要約 コンテキスト内のトークンのサブセットに選択的に注意を向ける、まばらな注意が … 続きを読む

カテゴリー: cs.CL | コメントする

Diffusion Models for Smarter UAVs: Decision-Making and Modeling

要約 無人航空機 (UAV) は、現代の通信ネットワークでますます採用されていま … 続きを読む

カテゴリー: 53-01, cs.AI, cs.LG, I.2 | コメントする

AI-Driven Diabetic Retinopathy Screening: Multicentric Validation of AIDRSS in India

要約 目的: 糖尿病性網膜症 (DR) は、特にインドにおいては視力喪失の主な原 … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | コメントする

Towards a Multimodal Large Language Model with Pixel-Level Insight for Biomedicine

要約 近年、マルチモーダル大規模言語モデル (MLLM) が顕著な進歩を遂げ、イ … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする

MoColl: Agent-Based Specific and General Model Collaboration for Image Captioning

要約 画像キャプションは、コンピューター ビジョンと自然言語処理が交わる重要なタ … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする

Annealing Machine-assisted Learning of Graph Neural Network for Combinatorial Optimization

要約 アニーリング マシン (AM) は複雑な組み合わせ問題を解決する能力が向上 … 続きを読む

カテゴリー: cs.AI, cs.LG | コメントする

Long Story Short: Story-level Video Understanding from 20K Short Films

要約 視覚言語モデルの最近の開発により、ビデオの理解が大幅に進歩しました。 ただ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | コメントする