cs.AI」カテゴリーアーカイブ

SlotLifter: Slot-guided Feature Lifting for Learning Object-centric Radiance Fields

要約 複雑な視覚シーンからオブジェクト中心の抽象化を抽出する能力は、人間レベルの … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | SlotLifter: Slot-guided Feature Lifting for Learning Object-centric Radiance Fields はコメントを受け付けていません

Exploring Domain Shift on Radar-Based 3D Object Detection Amidst Diverse Environmental Conditions

要約 ディープラーニングの急速な進化と自動運転システムとの統合により、マルチモー … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Exploring Domain Shift on Radar-Based 3D Object Detection Amidst Diverse Environmental Conditions はコメントを受け付けていません

Dual-Space Knowledge Distillation for Large Language Models

要約 知識蒸留 (KD) は、大規模言語モデル (LLM) の知識をより小さなモ … 続きを読む

カテゴリー: cs.AI, cs.CL | Dual-Space Knowledge Distillation for Large Language Models はコメントを受け付けていません

Clinical information extraction for Low-resource languages with Few-shot learning using Pre-trained language models and Prompting

要約 臨床文書からの医療情報の自動抽出には、必要な臨床専門知識にかかるコストの高 … 続きを読む

カテゴリー: 68T50, cs.AI, cs.CL, cs.LG, I.2.7 | Clinical information extraction for Low-resource languages with Few-shot learning using Pre-trained language models and Prompting はコメントを受け付けていません

CEval: A Benchmark for Evaluating Counterfactual Text Generation

要約 反事実的なテキストの生成は、異なる分類方法でテキストを最小限に変更すること … 続きを読む

カテゴリー: cs.AI, cs.CL | CEval: A Benchmark for Evaluating Counterfactual Text Generation はコメントを受け付けていません

mPLUG-Owl3: Towards Long Image-Sequence Understanding in Multi-Modal Large Language Models

要約 マルチモーダル大規模言語モデル (MLLM) は、さまざまな単一イメージ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | mPLUG-Owl3: Towards Long Image-Sequence Understanding in Multi-Modal Large Language Models はコメントを受け付けていません

Navigating Cultural Chasms: Exploring and Unlocking the Cultural POV of Text-To-Image Models

要約 DALL-E や StableDiffusion などの Text-To- … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Navigating Cultural Chasms: Exploring and Unlocking the Cultural POV of Text-To-Image Models はコメントを受け付けていません

Enhancing Visual Dialog State Tracking through Iterative Object-Entity Alignment in Multi-Round Conversations

要約 ビジュアル ダイアログ (VD) は、エージェントが複数ラウンドのダイアロ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Enhancing Visual Dialog State Tracking through Iterative Object-Entity Alignment in Multi-Round Conversations はコメントを受け付けていません

Large language models can consistently generate high-quality content for election disinformation operations

要約 大規模言語モデルの進歩により、選挙に関する説得力のある偽情報を大規模に生成 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CY | Large language models can consistently generate high-quality content for election disinformation operations はコメントを受け付けていません

InterCLIP-MEP: Interactive CLIP and Memory-Enhanced Predictor for Multi-modal Sarcasm Detection

要約 テキストと画像の組み合わせを通じて伝えられるソーシャル メディアでの皮肉の … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | InterCLIP-MEP: Interactive CLIP and Memory-Enhanced Predictor for Multi-modal Sarcasm Detection はコメントを受け付けていません