月別アーカイブ: 2024年3月

Investigating the Emergent Audio Classification Ability of ASR Foundation Models

要約 テキストおよびビジョン基盤モデルは、ゼロショット設定で多くのタスクを実行で … 続きを読む

カテゴリー: cs.CL | Investigating the Emergent Audio Classification Ability of ASR Foundation Models はコメントを受け付けていません

Improving Adversarial Data Collection by Supporting Annotators: Lessons from GAHD, a German Hate Speech Dataset

要約 ヘイトスピーチ検出モデルの性能は、トレーニングに使用されたデータによって決 … 続きを読む

カテゴリー: cs.CL | Improving Adversarial Data Collection by Supporting Annotators: Lessons from GAHD, a German Hate Speech Dataset はコメントを受け付けていません

Promptly Predicting Structures: The Return of Inference

要約 プロンプトベースの手法は、ゼロショットおよび少数ショットのラベル予測子を構 … 続きを読む

カテゴリー: cs.CL | Promptly Predicting Structures: The Return of Inference はコメントを受け付けていません

Asymmetric and trial-dependent modeling: the contribution of LIA to SdSV Challenge Task 2

要約 SdSv チャレンジのタスク 2 は、最新のテキストに依存しない話者検証シ … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Asymmetric and trial-dependent modeling: the contribution of LIA to SdSV Challenge Task 2 はコメントを受け付けていません

IVLMap: Instance-Aware Visual Language Grounding for Consumer Robot Navigation

要約 視覚と言語のナビゲーション (VLN) は、ロボットが人間の自然言語の指示 … 続きを読む

カテゴリー: cs.AI, cs.CV | IVLMap: Instance-Aware Visual Language Grounding for Consumer Robot Navigation はコメントを受け付けていません

Dataverse: Open-Source ETL (Extract, Transform, Load) Pipeline for Large Language Models

要約 大規模なデータ処理に関連する課題に対処するために、私たちは、ユーザーフレン … 続きを読む

カテゴリー: cs.AI, cs.CL | Dataverse: Open-Source ETL (Extract, Transform, Load) Pipeline for Large Language Models はコメントを受け付けていません

Intelligent Classification and Personalized Recommendation of E-commerce Products Based on Machine Learning

要約 インターネットの急速な進化と情報の急激な増加に伴い、ユーザーは情報過多と選 … 続きを読む

カテゴリー: cs.AI, cs.IR | Intelligent Classification and Personalized Recommendation of E-commerce Products Based on Machine Learning はコメントを受け付けていません

Breaking the Length Barrier: LLM-Enhanced CTR Prediction in Long Textual User Behaviors

要約 大規模言語モデル (LLM) の台頭により、最近の研究では LLM を活用 … 続きを読む

カテゴリー: cs.AI, cs.IR | Breaking the Length Barrier: LLM-Enhanced CTR Prediction in Long Textual User Behaviors はコメントを受け付けていません

NIGHT — Non-Line-of-Sight Imaging from Indirect Time of Flight Data

要約 カメラの視線外の物体の取得は、非常に興味深いものですが、非常に挑戦的な研究 … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | NIGHT — Non-Line-of-Sight Imaging from Indirect Time of Flight Data はコメントを受け付けていません

TimeChat: A Time-sensitive Multimodal Large Language Model for Long Video Understanding

要約 この研究では、長時間のビデオを理解するために特別に設計された、時間に敏感な … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | TimeChat: A Time-sensitive Multimodal Large Language Model for Long Video Understanding はコメントを受け付けていません