月別アーカイブ: 2024年2月

MLLM-as-a-Judge: Assessing Multimodal LLM-as-a-Judge with Vision-Language Benchmark

要約 マルチモーダル大規模言語モデル (MLLM) は最近大きな注目を集めており … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | MLLM-as-a-Judge: Assessing Multimodal LLM-as-a-Judge with Vision-Language Benchmark はコメントを受け付けていません

Mesh-based Gaussian Splatting for Real-time Large-scale Deformation

要約 ニューラル ディスタンス フィールドやニューラル ラディアンス フィールド … 続きを読む

カテゴリー: cs.CV, cs.GR | Mesh-based Gaussian Splatting for Real-time Large-scale Deformation はコメントを受け付けていません

Spiking-PhysFormer: Camera-Based Remote Photoplethysmography with Parallel Spike-driven Transformer

要約 人工ニューラル ネットワーク (ANN) は、カメラベースの遠隔光電脈波計 … 続きを読む

カテゴリー: cs.CV | Spiking-PhysFormer: Camera-Based Remote Photoplethysmography with Parallel Spike-driven Transformer はコメントを受け付けていません

iDeLog: Iterative Dual Spatial and Kinematic Extraction of Sigma-Lognormal Parameters

要約 素早い動きの運動理論とそれに関連するシグマ対数正規モデルは、さまざまな用途 … 続きを読む

カテゴリー: cs.CV | iDeLog: Iterative Dual Spatial and Kinematic Extraction of Sigma-Lognormal Parameters はコメントを受け付けていません

Domain Adaptation based Interpretable Image Emotion Recognition using Facial Expression Recognition

要約 この論文では、顔および顔以外のオブジェクト、および人間以外のコンポーネント … 続きを読む

カテゴリー: cs.CV, cs.LG | Domain Adaptation based Interpretable Image Emotion Recognition using Facial Expression Recognition はコメントを受け付けていません

NeRF as Non-Distant Environment Emitter in Physics-based Inverse Rendering

要約 物理ベースの逆レンダリングは、キャプチャされた 2D 画像から形状、マテリ … 続きを読む

カテゴリー: cs.CV, cs.GR | NeRF as Non-Distant Environment Emitter in Physics-based Inverse Rendering はコメントを受け付けていません

SARI: Simplistic Average and Robust Identification based Noisy Partial Label Learning

要約 部分ラベル学習 (PLL) は、各トレーニング インスタンスが一連の候補ラ … 続きを読む

カテゴリー: cs.CV, cs.LG | SARI: Simplistic Average and Robust Identification based Noisy Partial Label Learning はコメントを受け付けていません

Data-efficient Large Vision Models through Sequential Autoregression

要約 言語入力を避け、純粋に逐次的な視覚データに基づいて汎用視覚モデルをトレーニ … 続きを読む

カテゴリー: cs.CV | Data-efficient Large Vision Models through Sequential Autoregression はコメントを受け付けていません

Fully Hyperbolic Convolutional Neural Networks for Computer Vision

要約 現実世界の視覚データは、双曲空間で効果的に表現できる固有の階層構造を示しま … 続きを読む

カテゴリー: cs.CV, cs.LG | Fully Hyperbolic Convolutional Neural Networks for Computer Vision はコメントを受け付けていません

Mixed Autoencoder for Self-supervised Visual Representation Learning

要約 Masked Autoencoder (MAE) は、画像パッチをランダム … 続きを読む

カテゴリー: cs.CV, cs.LG | Mixed Autoencoder for Self-supervised Visual Representation Learning はコメントを受け付けていません