「cs.CV」カテゴリーアーカイブ

3D-PNAS: 3D Industrial Surface Anomaly Synthesis with Perlin Noise

投稿日: 2025年4月18日作成者: jarxiv

要約大規模な前提型ビジョンファンデーションモデルは、さまざまなビジョンタスクで … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG, cs.RO, I.5.4 | コメントを受け付けていません

Taccel: Scaling Up Vision-based Tactile Robotics via High-performance GPU Simulation

投稿日: 2025年4月18日作成者: jarxiv

要約触覚センシングは、操作タスクで人間レベルのロボット機能を達成するために重要 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Disentangling Polysemantic Channels in Convolutional Neural Networks

投稿日: 2025年4月18日作成者: jarxiv

要約機械的解釈は、（畳み込み）ニューラルネットワーク（CNN）の個々のコンポー … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Vision and Language Integration for Domain Generalization

投稿日: 2025年4月18日作成者: jarxiv

要約ドメイン一般化は、ソースドメインのトレーニングをトレーニングしてドメイン不 … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

CameraBench: Benchmarking Visual Reasoning in MLLMs via Photography

投稿日: 2025年4月18日作成者: jarxiv

要約大規模な言語モデル（LLMS）およびマルチモーダル大型言語モデル（MLLM … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

A Robust Prototype-Based Network with Interpretable RBF Classifier Foundations

投稿日: 2025年4月18日作成者: jarxiv

要約プロトタイプベースの分類学習方法は、本質的に解釈可能であることが知られてい … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Hierarchical Feature Learning for Medical Point Clouds via State Space Model

投稿日: 2025年4月18日作成者: jarxiv

要約ディープラーニングベースのポイントクラウドモデリングは、一般的な形状分析の … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Long-Context Autoregressive Video Modeling with Next-Frame Prediction

投稿日: 2025年4月18日作成者: jarxiv

要約ロングコンテキストの自動網性モデリングは、言語生成を大幅に高度にしています … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Pose and Facial Expression Transfer by using StyleGAN

投稿日: 2025年4月18日作成者: jarxiv

要約顔の画像間でポーズと表現を転送する方法を提案します。ソースとターゲットフ … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Rethinking Few-Shot Image Fusion: Granular Ball Priors Enable General-Purpose Deep Fusion

投稿日: 2025年4月18日作成者: jarxiv

要約画像融合タスクでは、プライアーとしての実際の融合画像が存在しないことは、基 … 続きを読む →

カテゴリー: cs.CV, cs.GR, cs.LG, eess.IV, stat.ML | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

3D-PNAS: 3D Industrial Surface Anomaly Synthesis with Perlin Noise

Taccel: Scaling Up Vision-based Tactile Robotics via High-performance GPU Simulation

Disentangling Polysemantic Channels in Convolutional Neural Networks

Vision and Language Integration for Domain Generalization

CameraBench: Benchmarking Visual Reasoning in MLLMs via Photography

A Robust Prototype-Based Network with Interpretable RBF Classifier Foundations

Hierarchical Feature Learning for Medical Point Clouds via State Space Model

Long-Context Autoregressive Video Modeling with Next-Frame Prediction

Pose and Facial Expression Transfer by using StyleGAN

Rethinking Few-Shot Image Fusion: Granular Ball Priors Enable General-Purpose Deep Fusion

最近の投稿

最近のコメント

アーカイブ

カテゴリー