cs.MM」カテゴリーアーカイブ

GSVC: Efficient Video Representation and Compression Through 2D Gaussian Splatting

要約 3D ガウス スプラットは、静的な 3D シーンの革新的で効果的な学習され … 続きを読む

カテゴリー: cs.CV, cs.MM | GSVC: Efficient Video Representation and Compression Through 2D Gaussian Splatting はコメントを受け付けていません

Sketch and Patch: Efficient 3D Gaussian Representation for Man-Made Scenes

要約 3D ガウス スプラッティング (3DGS) は、3D シーンのフォトリア … 続きを読む

カテゴリー: cs.CV, cs.MM | Sketch and Patch: Efficient 3D Gaussian Representation for Man-Made Scenes はコメントを受け付けていません

SMPLest-X: Ultimate Scaling for Expressive Human Pose and Shape Estimation

要約 表情豊かな人間の姿勢と形状の推定 (EHPS) は、体、手、顔のモーション … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.HC, cs.MM, cs.RO | SMPLest-X: Ultimate Scaling for Expressive Human Pose and Shape Estimation はコメントを受け付けていません

CLIP-PCQA: Exploring Subjective-Aligned Vision-Language Modeling for Point Cloud Quality Assessment

要約 近年、無参照点群品質評価 (NR-PCQA) 研究は大きな進歩を遂げていま … 続きを読む

カテゴリー: cs.CV, cs.MM | CLIP-PCQA: Exploring Subjective-Aligned Vision-Language Modeling for Point Cloud Quality Assessment はコメントを受け付けていません

Robust Change Captioning in Remote Sensing: SECOND-CC Dataset and MModalCC Framework

要約 リモート センシング変化キャプション (RSICC) は、両時間画像間の変 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM | Robust Change Captioning in Remote Sensing: SECOND-CC Dataset and MModalCC Framework はコメントを受け付けていません

Frechet Music Distance: A Metric For Generative Symbolic Music Evaluation

要約 この論文では、コンピューター ビジョンの Frechet Inceptio … 続きを読む

カテゴリー: cs.AI, cs.MM, cs.SD, eess.AS | Frechet Music Distance: A Metric For Generative Symbolic Music Evaluation はコメントを受け付けていません

Metric Learning with Progressive Self-Distillation for Audio-Visual Embedding Learning

要約 メトリクス学習はサンプルを埋め込み空間に投影し、そこで学習された表現に基づ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.IR, cs.MM, cs.SD, eess.AS | Metric Learning with Progressive Self-Distillation for Audio-Visual Embedding Learning はコメントを受け付けていません

Multimodal LLMs Can Reason about Aesthetics in Zero-Shot

要約 我々は、芸術作品の美しさを評価するためにマルチモーダルLLM(MLLM)の … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM | Multimodal LLMs Can Reason about Aesthetics in Zero-Shot はコメントを受け付けていません

Audio-visual Deepfake Detection With Local Temporal Inconsistencies

要約 この論文では、オーディオとビジュアルのモダリティ間のきめ細かい時間的不一致 … 続きを読む

カテゴリー: cs.CR, cs.CV, cs.MM, cs.SD, eess.AS | Audio-visual Deepfake Detection With Local Temporal Inconsistencies はコメントを受け付けていません

Audio-CoT: Exploring Chain-of-Thought Reasoning in Large Audio Language Model

要約 Large Audio-Language Model (LALM) は、音 … 続きを読む

カテゴリー: cs.CL, cs.MM, cs.SD, eess.AS | Audio-CoT: Exploring Chain-of-Thought Reasoning in Large Audio Language Model はコメントを受け付けていません