月別アーカイブ: 2025年4月

Generative AI Act II: Test Time Scaling Drives Cognition Engineering

要約 生成AI(2020-2023)の「Act I」と呼ばれる可能性のある大規模 … 続きを読む

カテゴリー: cs.AI, cs.CL | コメントする

MIG: Automatic Data Selection for Instruction Tuning by Maximizing Information Gain in Semantic Space

要約 データの品質と多様性は、効果的な命令調整データセットの構築の鍵です。 %オ … 続きを読む

カテゴリー: cs.AI, cs.CL | コメントする

FocusNet: Transformer-enhanced Polyp Segmentation with Local and Pooling Attention

要約 大腸内視鏡検査は、結腸直腸ポリープの早期診断に不可欠です。 定期的なスクリ … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | コメントする

Unleashing the Power of CNN and Transformer for Balanced RGB-Event Video Recognition

要約 RGB-Eventデータに基づいたパターン認識は、新たに発生する研究トピッ … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする

ViG3D-UNet: Volumetric Vascular Connectivity-Aware Segmentation via 3D Vision Graph Representation

要約 正確な血管セグメンテーションは、冠動脈視覚化と冠動脈性心疾患の診断に不可欠 … 続きを読む

カテゴリー: cs.CV, eess.IV | コメントする

FocusTrack: A Self-Adaptive Local Sampling Algorithm for Efficient Anti-UAV Tracking

要約 Anti-UAV追跡は、ターゲットサイズの小さなサイズ、急激なカメラの動き … 続きを読む

カテゴリー: cs.CV | コメントする

Cross-Hierarchical Bidirectional Consistency Learning for Fine-Grained Visual Classification

要約 Fine-Grained Visual分類(FGVC)は、密接に関連するサ … 続きを読む

カテゴリー: cs.CV | コメントする

Compile Scene Graphs with Reinforcement Learning

要約 次のトークン予測は、大規模な言語モデル(LLMS)をトレーニングするための … 続きを読む

カテゴリー: cs.CV | コメントする

Visual Intention Grounding for Egocentric Assistants

要約 Visual Groundingは、テキストの説明を画像内のオブジェクトと … 続きを読む

カテゴリー: cs.CV | コメントする

SupResDiffGAN a new approach for the Super-Resolution task

要約 この作業では、超解像度タスクの生成的敵対ネットワーク(GANS)と拡散モデ … 続きを読む

カテゴリー: cs.CV, eess.IV | コメントする