投稿者「jarxiv」のアーカイブ

SST-EM: Advanced Metrics for Evaluating Semantic, Spatial and Temporal Aspects in Video Editing

投稿日: 2025年1月14日作成者: jarxiv

要約ビデオ編集モデルは大幅に進歩しましたが、そのパフォーマンスを評価することは … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

MatchAnything: Universal Cross-Modality Image Matching with Large-Scale Pre-Training

投稿日: 2025年1月14日作成者: jarxiv

要約画像間の対応するピクセル位置を特定することを目的とした画像マッチングは、画 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Training-Free Motion-Guided Video Generation with Enhanced Temporal Consistency Using Motion Consistency Loss

投稿日: 2025年1月14日作成者: jarxiv

要約この論文では、モーションガイダンスを備えた時間的に一貫したビデオを生成す … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

UnCommon Objects in 3D

投稿日: 2025年1月14日作成者: jarxiv

要約 3D ディープラーニングと 3D 生成 AI 用の新しいオブジェクト中心 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.GR | コメントを受け付けていません

Dataset Distillation via Committee Voting

投稿日: 2025年1月14日作成者: jarxiv

要約データセットの蒸留は、元のデータの重要な特性を保持する、より小さく代表的な … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Class Distance Weighted Cross Entropy Loss for Classification of Disease Severity

投稿日: 2025年1月14日作成者: jarxiv

要約各クラスが増加する重症度レベルを反映する順序クラスを使用して疾患の重症度を … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

CoNOAir: A Neural Operator for Forecasting Carbon Monoxide Evolution in Cities

投稿日: 2025年1月14日作成者: jarxiv

要約一酸化炭素 (CO) は、産業、自動車、家庭の需要に応じて化石燃料からエネ … 続きを読む →

カテゴリー: cs.LG | コメントを受け付けていません

A monthly sub-national Harmonized Food Insecurity Dataset for comprehensive analysis and predictive modeling

投稿日: 2025年1月14日作成者: jarxiv

要約食料安全保障は複雑で多次元の概念であり、包括的に測定することが困難です。 … 続きを読む →

カテゴリー: cs.LG | コメントを受け付けていません

DiReCT: Diagnostic Reasoning for Clinical Notes via Large Language Models

投稿日: 2025年1月14日作成者: jarxiv

要約大規模言語モデル (LLM) は最近、医療分野を含む幅広いタスクやアプリケ … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Migician: Revealing the Magic of Free-Form Multi-Image Grounding in Multimodal Large Language Models

投稿日: 2025年1月14日作成者: jarxiv

要約マルチモーダル大規模言語モデル (MLLM) の最近の進歩により、単一画像 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

投稿者「jarxiv」のアーカイブ

SST-EM: Advanced Metrics for Evaluating Semantic, Spatial and Temporal Aspects in Video Editing

MatchAnything: Universal Cross-Modality Image Matching with Large-Scale Pre-Training

Training-Free Motion-Guided Video Generation with Enhanced Temporal Consistency Using Motion Consistency Loss

UnCommon Objects in 3D

Dataset Distillation via Committee Voting

Class Distance Weighted Cross Entropy Loss for Classification of Disease Severity

CoNOAir: A Neural Operator for Forecasting Carbon Monoxide Evolution in Cities

A monthly sub-national Harmonized Food Insecurity Dataset for comprehensive analysis and predictive modeling

DiReCT: Diagnostic Reasoning for Clinical Notes via Large Language Models

Migician: Revealing the Magic of Free-Form Multi-Image Grounding in Multimodal Large Language Models

最近の投稿

最近のコメント

アーカイブ

カテゴリー