月別アーカイブ: 2024年8月

MCTR: Multi Camera Tracking Transformer

要約 マルチカメラ追跡は、現実世界のさまざまなアプリケーションにおいて極めて重要 … 続きを読む

カテゴリー: cs.CV | MCTR: Multi Camera Tracking Transformer はコメントを受け付けていません

Foundational Model for Electron Micrograph Analysis: Instruction-Tuning Small-Scale Language-and-Vision Assistant for Enterprise Adoption

要約 半導体のイメージングと分析は重要であるにもかかわらず、ディープラーニングの … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Foundational Model for Electron Micrograph Analysis: Instruction-Tuning Small-Scale Language-and-Vision Assistant for Enterprise Adoption はコメントを受け付けていません

Re-evaluation of Face Anti-spoofing Algorithm in Post COVID-19 Era Using Mask Based Occlusion Attack

要約 顔のなりすまし防止アルゴリズムは、プレゼンテーション攻撃に対する顔認識シス … 続きを読む

カテゴリー: cs.CV | Re-evaluation of Face Anti-spoofing Algorithm in Post COVID-19 Era Using Mask Based Occlusion Attack はコメントを受け付けていません

LayerPano3D: Layered 3D Panorama for Hyper-Immersive Scene Generation

要約 3D イマーシブ シーンの生成は、コンピュータ ビジョンとグラフィックスに … 続きを読む

カテゴリー: cs.CV | LayerPano3D: Layered 3D Panorama for Hyper-Immersive Scene Generation はコメントを受け付けていません

Ensemble Modeling of Multiple Physical Indicators to Dynamically Phenotype Autism Spectrum Disorder

要約 社会的コミュニケーションの困難を特徴とする神経発達障害である自閉症は、タイ … 続きを読む

カテゴリー: cs.AI, cs.CV | Ensemble Modeling of Multiple Physical Indicators to Dynamically Phenotype Autism Spectrum Disorder はコメントを受け付けていません

How Diffusion Models Learn to Factorize and Compose

要約 拡散モデルは、トレーニング セットに一緒に表示されない可能性が高い要素を組 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | How Diffusion Models Learn to Factorize and Compose はコメントを受け付けていません

MME-RealWorld: Could Your Multimodal LLM Challenge High-Resolution Real-World Scenarios that are Difficult for Humans?

要約 マルチモーダル大規模言語モデル (MLLM) の包括的な評価は、最近研究コ … 続きを読む

カテゴリー: cs.CV | MME-RealWorld: Could Your Multimodal LLM Challenge High-Resolution Real-World Scenarios that are Difficult for Humans? はコメントを受け付けていません

Tactile-Morph Skills: Energy-Based Control Meets Data-Driven Learning

要約 ロボット操作は、工場を近代化し、高度な触覚能力を必要とする研磨などの工業作 … 続きを読む

カテゴリー: cs.RO | Tactile-Morph Skills: Energy-Based Control Meets Data-Driven Learning はコメントを受け付けていません

Non-Homophilic Graph Pre-Training and Prompt Learning

要約 グラフは、さまざまな分野にわたるオブジェクト間の複雑な関係をモデル化するた … 続きを読む

カテゴリー: cs.LG | Non-Homophilic Graph Pre-Training and Prompt Learning はコメントを受け付けていません

Large Language Models as Foundations for Next-Gen Dense Retrieval: A Comprehensive Empirical Assessment

要約 BERT や T5 などの事前トレーニング済み言語モデルは、高密度検索のた … 続きを読む

カテゴリー: cs.CL | Large Language Models as Foundations for Next-Gen Dense Retrieval: A Comprehensive Empirical Assessment はコメントを受け付けていません