cs.AI」カテゴリーアーカイブ

Evaluating the Correctness of Inference Patterns Used by LLMs for Judgment

要約 このホワイトペーパーでは、人間のドメインの知識に従って、LLMの潜在的な誤 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Evaluating the Correctness of Inference Patterns Used by LLMs for Judgment はコメントを受け付けていません

Automatic Synthetic Data and Fine-grained Adaptive Feature Alignment for Composed Person Retrieval

要約 人の検索は注目の高まりを引き付けました。 既存の方法は、主に2つの検索モー … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.IR | Automatic Synthetic Data and Fine-grained Adaptive Feature Alignment for Composed Person Retrieval はコメントを受け付けていません

KERL: Knowledge-Enhanced Personalized Recipe Recommendation using Large Language Models

要約 大規模な言語モデル(LLMS)の最近の進歩と食品データの豊富さにより、LL … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | KERL: Knowledge-Enhanced Personalized Recipe Recommendation using Large Language Models はコメントを受け付けていません

How Effective Can Dropout Be in Multiple Instance Learning ?

要約 複数のインスタンス学習(MIL)は、さまざまなアプリケーションに人気のある … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV, stat.ML | How Effective Can Dropout Be in Multiple Instance Learning ? はコメントを受け付けていません

CAD-Coder: An Open-Source Vision-Language Model for Computer-Aided Design Code Generation

要約 正確で編集可能な3D CADモデルの効率的な作成は、エンジニアリング設計に … 続きを読む

カテゴリー: cs.AI, cs.CV | CAD-Coder: An Open-Source Vision-Language Model for Computer-Aided Design Code Generation はコメントを受け付けていません

Beyond Words: Multimodal LLM Knows When to Speak

要約 大規模な言語モデル(LLM)ベースのチャットボットは、コヒーレントでコンテ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Beyond Words: Multimodal LLM Knows When to Speak はコメントを受け付けていません

EmoGist: Efficient In-Context Learning for Visual Emotion Understanding

要約 この論文では、LVLMSを使用して視覚的な感情分類を実行するためのトレーニ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | EmoGist: Efficient In-Context Learning for Visual Emotion Understanding はコメントを受け付けていません

AKRMap: Adaptive Kernel Regression for Trustworthy Visualization of Cross-Modal Embeddings

要約 クロスモーダル埋め込みは、マルチモーダルモデルの基礎を形成します。 ただし … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.HC, cs.LG | AKRMap: Adaptive Kernel Regression for Trustworthy Visualization of Cross-Modal Embeddings はコメントを受け付けていません

Training-Free Watermarking for Autoregressive Image Generation

要約 目に見えない画像の透かしは、画像の所有権を保護し、視覚生成モデルの悪意のあ … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.CV | Training-Free Watermarking for Autoregressive Image Generation はコメントを受け付けていません

Two Experts Are All You Need for Steering Thinking: Reinforcing Cognitive Effort in MoE Reasoning Models Without Additional Training

要約 大規模な推論モデル(LRM)内の専門家の混合(MOE)アーキテクチャは、専 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.IR, cs.LG | Two Experts Are All You Need for Steering Thinking: Reinforcing Cognitive Effort in MoE Reasoning Models Without Additional Training はコメントを受け付けていません