cs.AI」カテゴリーアーカイブ

Supervision-free Vision-Language Alignment

要約 視覚言語モデル (VLM) は、視覚情報と言語情報の統合において顕著な可能 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Supervision-free Vision-Language Alignment はコメントを受け付けていません

DRIVINGVQA: Analyzing Visual Chain-of-Thought Reasoning of Vision Language Models in Real-World Scenarios with Driving Theory Tests

要約 Large Vision-Language Model (LVLM) は、 … 続きを読む

カテゴリー: cs.AI, cs.CV | DRIVINGVQA: Analyzing Visual Chain-of-Thought Reasoning of Vision Language Models in Real-World Scenarios with Driving Theory Tests はコメントを受け付けていません

GLoG-CSUnet: Enhancing Vision Transformers with Adaptable Radiomic Features for Medical Image Segmentation

要約 ビジョン トランスフォーマー (ViT) は、長距離相関を捕捉することによ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | GLoG-CSUnet: Enhancing Vision Transformers with Adaptable Radiomic Features for Medical Image Segmentation はコメントを受け付けていません

Enhancing Financial VQA in Vision Language Models using Intermediate Structured Representations

要約 グラフの解釈は視覚的なデータ分析にとって重要ですが、グラフから情報を正確に … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Enhancing Financial VQA in Vision Language Models using Intermediate Structured Representations はコメントを受け付けていません

Grokking at the Edge of Numerical Stability

要約 グロッキング (長期にわたる過学習の後に起こる突然の一般化) は、深層学習 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, stat.ML | Grokking at the Edge of Numerical Stability はコメントを受け付けていません

Planarian Neural Networks: Evolutionary Patterns from Basic Bilateria Shaping Modern Artificial Neural Network Architectures

要約 この研究では、生物学的ニューラル ネットワークと同様の進化パターンを持つ人 … 続きを読む

カテゴリー: 68T07, cs.AI, cs.CV, cs.LG, cs.NE | Planarian Neural Networks: Evolutionary Patterns from Basic Bilateria Shaping Modern Artificial Neural Network Architectures はコメントを受け付けていません

Samba-ASR: State-Of-The-Art Speech Recognition Leveraging Structured State-Space Models

要約 私たちは、状態空間モデル (SSM) の基礎に基づいて構築された、新しい … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS | Samba-ASR: State-Of-The-Art Speech Recognition Leveraging Structured State-Space Models はコメントを受け付けていません

SenseRAG: Constructing Environmental Knowledge Bases with Proactive Querying for LLM-Based Autonomous Driving

要約 この研究は、大規模言語モデル (LLM) の文脈推論機能を活用することで、 … 続きを読む

カテゴリー: cs.AI, cs.RO | SenseRAG: Constructing Environmental Knowledge Bases with Proactive Querying for LLM-Based Autonomous Driving はコメントを受け付けていません

Existential Crisis: A Social Robot’s Reason for Being

要約 ロボットが私たちの日常生活においてますます重要になるにつれ、ロボットが人々 … 続きを読む

カテゴリー: cs.AI, cs.HC, cs.RO | Existential Crisis: A Social Robot’s Reason for Being はコメントを受け付けていません

Enhanced Importance Sampling through Latent Space Exploration in Normalizing Flows

要約 インポータンス サンプリングは、サンプリング分布を関心のある稀なイベントに … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | Enhanced Importance Sampling through Latent Space Exploration in Normalizing Flows はコメントを受け付けていません