月別アーカイブ: 2025年4月

DropMAE: Learning Representations via Masked Autoencoders with Spatial-Attention Dropout for Temporal Matching Tasks

要約 本論文では、様々な時間マッチングに基づく下流タスク、すなわち、ビデオオブジ … 続きを読む

カテゴリー: cs.CV | DropMAE: Learning Representations via Masked Autoencoders with Spatial-Attention Dropout for Temporal Matching Tasks はコメントを受け付けていません

Agentic Knowledgeable Self-awareness

要約 大規模言語モデル(LLM)は、様々なエージェント計画タスクにおいてかなりの … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MA | Agentic Knowledgeable Self-awareness はコメントを受け付けていません

Quantifying Knowledge Distillation Using Partial Information Decomposition

要約 知識蒸留は、複雑な教師モデルの内部表現をエミュレートするために、より小さな … 続きを読む

カテゴリー: cs.CV, cs.IT, cs.LG, eess.IV, math.IT, stat.ML | Quantifying Knowledge Distillation Using Partial Information Decomposition はコメントを受け付けていません

SynWorld: Virtual Scenario Synthesis for Agentic Action Knowledge Refinement

要約 エージェントとその環境との相互作用において、エージェントは行動を計画し実行 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MA | SynWorld: Virtual Scenario Synthesis for Agentic Action Knowledge Refinement はコメントを受け付けていません

PF3Det: A Prompted Foundation Feature Assisted Visual LiDAR 3D Detector

要約 3D物体検出は、正確な深度情報を得るためのLiDAR点群と、豊富な意味情報 … 続きを読む

カテゴリー: cs.CV | PF3Det: A Prompted Foundation Feature Assisted Visual LiDAR 3D Detector はコメントを受け付けていません

Streaming Generation of Co-Speech Gestures via Accelerated Rolling Diffusion

要約 音声合成ジェスチャーをリアルタイムで生成するには、時間的コヒーレンスと効率 … 続きを読む

カテゴリー: cs.CV, cs.HC, cs.LG | Streaming Generation of Co-Speech Gestures via Accelerated Rolling Diffusion はコメントを受け付けていません

Intuitionistic Fuzzy Cognitive Maps for Interpretable Image Classification

要約 画像分類タスクを扱うために、いくつかの深層学習(DL)アプローチが提案され … 続きを読む

カテゴリー: cs.AI, cs.CV | Intuitionistic Fuzzy Cognitive Maps for Interpretable Image Classification はコメントを受け付けていません

AutoSSVH: Exploring Automated Frame Sampling for Efficient Self-Supervised Video Hashing

要約 Self-Supervised Video Hashing (SSVH)は … 続きを読む

カテゴリー: cs.CV, cs.IR, cs.MM | AutoSSVH: Exploring Automated Frame Sampling for Efficient Self-Supervised Video Hashing はコメントを受け付けていません

AdaViT: Adaptive Vision Transformer for Flexible Pretrain and Finetune with Variable 3D Medical Image Modalities

要約 教師あり、または自己教師ありにかかわらず、事前学習技術は、モデルの性能を向 … 続きを読む

カテゴリー: cs.CV, eess.IV | AdaViT: Adaptive Vision Transformer for Flexible Pretrain and Finetune with Variable 3D Medical Image Modalities はコメントを受け付けていません

A Hitchhiker’s Guide to Understanding Performances of Two-Class Classifiers

要約 分類器の性能を正しく理解することは、様々なシナリオにおいて不可欠である。し … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.PF | A Hitchhiker’s Guide to Understanding Performances of Two-Class Classifiers はコメントを受け付けていません