投稿者「jarxiv」のアーカイブ

SST-EM: Advanced Metrics for Evaluating Semantic, Spatial and Temporal Aspects in Video Editing

要約 ビデオ編集モデルは大幅に進歩しましたが、そのパフォーマンスを評価することは … 続きを読む

カテゴリー: cs.CL, cs.CV | SST-EM: Advanced Metrics for Evaluating Semantic, Spatial and Temporal Aspects in Video Editing はコメントを受け付けていません

MatchAnything: Universal Cross-Modality Image Matching with Large-Scale Pre-Training

要約 画像間の対応するピクセル位置を特定することを目的とした画像マッチングは、画 … 続きを読む

カテゴリー: cs.CV | MatchAnything: Universal Cross-Modality Image Matching with Large-Scale Pre-Training はコメントを受け付けていません

Training-Free Motion-Guided Video Generation with Enhanced Temporal Consistency Using Motion Consistency Loss

要約 この論文では、モーション ガイダンスを備えた時間的に一貫したビデオを生成す … 続きを読む

カテゴリー: cs.CV | Training-Free Motion-Guided Video Generation with Enhanced Temporal Consistency Using Motion Consistency Loss はコメントを受け付けていません

UnCommon Objects in 3D

要約 3D ディープ ラーニングと 3D 生成 AI 用の新しいオブジェクト中心 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR | UnCommon Objects in 3D はコメントを受け付けていません

Dataset Distillation via Committee Voting

要約 データセットの蒸留は、元のデータの重要な特性を保持する、より小さく代表的な … 続きを読む

カテゴリー: cs.AI, cs.CV | Dataset Distillation via Committee Voting はコメントを受け付けていません

Class Distance Weighted Cross Entropy Loss for Classification of Disease Severity

要約 各クラスが増加する重症度レベルを反映する順序クラスを使用して疾患の重症度を … 続きを読む

カテゴリー: cs.CV | Class Distance Weighted Cross Entropy Loss for Classification of Disease Severity はコメントを受け付けていません

CoNOAir: A Neural Operator for Forecasting Carbon Monoxide Evolution in Cities

要約 一酸化炭素 (CO) は、産業、自動車、家庭の需要に応じて化石燃料からエネ … 続きを読む

カテゴリー: cs.LG | CoNOAir: A Neural Operator for Forecasting Carbon Monoxide Evolution in Cities はコメントを受け付けていません

A monthly sub-national Harmonized Food Insecurity Dataset for comprehensive analysis and predictive modeling

要約 食料安全保障は複雑で多次元の概念であり、包括的に測定することが困難です。 … 続きを読む

カテゴリー: cs.LG | A monthly sub-national Harmonized Food Insecurity Dataset for comprehensive analysis and predictive modeling はコメントを受け付けていません

DiReCT: Diagnostic Reasoning for Clinical Notes via Large Language Models

要約 大規模言語モデル (LLM) は最近、医療分野を含む幅広いタスクやアプリケ … 続きを読む

カテゴリー: cs.AI, cs.CL | DiReCT: Diagnostic Reasoning for Clinical Notes via Large Language Models はコメントを受け付けていません

Migician: Revealing the Magic of Free-Form Multi-Image Grounding in Multimodal Large Language Models

要約 マルチモーダル大規模言語モデル (MLLM) の最近の進歩により、単一画像 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Migician: Revealing the Magic of Free-Form Multi-Image Grounding in Multimodal Large Language Models はコメントを受け付けていません