「cs.AI」カテゴリーアーカイブ

Supervision-free Vision-Language Alignment

投稿日: 2025年1月9日作成者: jarxiv

要約視覚言語モデル (VLM) は、視覚情報と言語情報の統合において顕著な可能 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

DRIVINGVQA: Analyzing Visual Chain-of-Thought Reasoning of Vision Language Models in Real-World Scenarios with Driving Theory Tests

投稿日: 2025年1月9日作成者: jarxiv

要約 Large Vision-Language Model (LVLM) は、 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

GLoG-CSUnet: Enhancing Vision Transformers with Adaptable Radiomic Features for Medical Image Segmentation

投稿日: 2025年1月9日作成者: jarxiv

要約ビジョントランスフォーマー (ViT) は、長距離相関を捕捉することによ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Enhancing Financial VQA in Vision Language Models using Intermediate Structured Representations

投稿日: 2025年1月9日作成者: jarxiv

要約グラフの解釈は視覚的なデータ分析にとって重要ですが、グラフから情報を正確に … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

Grokking at the Edge of Numerical Stability

投稿日: 2025年1月9日作成者: jarxiv

要約グロッキング (長期にわたる過学習の後に起こる突然の一般化) は、深層学習 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, stat.ML | コメントを受け付けていません

Planarian Neural Networks: Evolutionary Patterns from Basic Bilateria Shaping Modern Artificial Neural Network Architectures

投稿日: 2025年1月9日作成者: jarxiv

要約この研究では、生物学的ニューラルネットワークと同様の進化パターンを持つ人 … 続きを読む →

カテゴリー: 68T07, cs.AI, cs.CV, cs.LG, cs.NE | コメントを受け付けていません

Samba-ASR: State-Of-The-Art Speech Recognition Leveraging Structured State-Space Models

投稿日: 2025年1月9日作成者: jarxiv

要約私たちは、状態空間モデル (SSM) の基礎に基づいて構築された、新しい … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS | コメントを受け付けていません

SenseRAG: Constructing Environmental Knowledge Bases with Proactive Querying for LLM-Based Autonomous Driving

投稿日: 2025年1月9日作成者: jarxiv

要約この研究は、大規模言語モデル (LLM) の文脈推論機能を活用することで、 … 続きを読む →

カテゴリー: cs.AI, cs.RO | コメントを受け付けていません

Existential Crisis: A Social Robot’s Reason for Being

投稿日: 2025年1月8日作成者: jarxiv

要約ロボットが私たちの日常生活においてますます重要になるにつれ、ロボットが人々 … 続きを読む →

カテゴリー: cs.AI, cs.HC, cs.RO | コメントを受け付けていません

Enhanced Importance Sampling through Latent Space Exploration in Normalizing Flows

投稿日: 2025年1月8日作成者: jarxiv

要約インポータンスサンプリングは、サンプリング分布を関心のある稀なイベントに … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.RO | コメントを受け付けていません

「cs.AI」カテゴリーアーカイブ

Supervision-free Vision-Language Alignment

DRIVINGVQA: Analyzing Visual Chain-of-Thought Reasoning of Vision Language Models in Real-World Scenarios with Driving Theory Tests

GLoG-CSUnet: Enhancing Vision Transformers with Adaptable Radiomic Features for Medical Image Segmentation

Enhancing Financial VQA in Vision Language Models using Intermediate Structured Representations

Grokking at the Edge of Numerical Stability

Planarian Neural Networks: Evolutionary Patterns from Basic Bilateria Shaping Modern Artificial Neural Network Architectures

Samba-ASR: State-Of-The-Art Speech Recognition Leveraging Structured State-Space Models

SenseRAG: Constructing Environmental Knowledge Bases with Proactive Querying for LLM-Based Autonomous Driving

Existential Crisis: A Social Robot’s Reason for Being

Enhanced Importance Sampling through Latent Space Exploration in Normalizing Flows

最近の投稿

最近のコメント

アーカイブ

カテゴリー