-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
3D-PNAS: 3D Industrial Surface Anomaly Synthesis with Perlin Noise
要約 大規模な前提型ビジョンファンデーションモデルは、さまざまなビジョンタスクで … 続きを読む
Taccel: Scaling Up Vision-based Tactile Robotics via High-performance GPU Simulation
要約 触覚センシングは、操作タスクで人間レベルのロボット機能を達成するために重要 … 続きを読む
Disentangling Polysemantic Channels in Convolutional Neural Networks
要約 機械的解釈は、(畳み込み)ニューラルネットワーク(CNN)の個々のコンポー … 続きを読む
Vision and Language Integration for Domain Generalization
要約 ドメイン一般化は、ソースドメインのトレーニングをトレーニングしてドメイン不 … 続きを読む
CameraBench: Benchmarking Visual Reasoning in MLLMs via Photography
要約 大規模な言語モデル(LLMS)およびマルチモーダル大型言語モデル(MLLM … 続きを読む
A Robust Prototype-Based Network with Interpretable RBF Classifier Foundations
要約 プロトタイプベースの分類学習方法は、本質的に解釈可能であることが知られてい … 続きを読む
Hierarchical Feature Learning for Medical Point Clouds via State Space Model
要約 ディープラーニングベースのポイントクラウドモデリングは、一般的な形状分析の … 続きを読む
カテゴリー: cs.CV
Hierarchical Feature Learning for Medical Point Clouds via State Space Model はコメントを受け付けていません
Long-Context Autoregressive Video Modeling with Next-Frame Prediction
要約 ロングコンテキストの自動網性モデリングは、言語生成を大幅に高度にしています … 続きを読む
カテゴリー: cs.CV
Long-Context Autoregressive Video Modeling with Next-Frame Prediction はコメントを受け付けていません
Pose and Facial Expression Transfer by using StyleGAN
要約 顔の画像間でポーズと表現を転送する方法を提案します。 ソースとターゲットフ … 続きを読む