-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年2月
MLLM-as-a-Judge: Assessing Multimodal LLM-as-a-Judge with Vision-Language Benchmark
要約 マルチモーダル大規模言語モデル (MLLM) は最近大きな注目を集めており … 続きを読む
Mesh-based Gaussian Splatting for Real-time Large-scale Deformation
要約 ニューラル ディスタンス フィールドやニューラル ラディアンス フィールド … 続きを読む
Spiking-PhysFormer: Camera-Based Remote Photoplethysmography with Parallel Spike-driven Transformer
要約 人工ニューラル ネットワーク (ANN) は、カメラベースの遠隔光電脈波計 … 続きを読む
カテゴリー: cs.CV
Spiking-PhysFormer: Camera-Based Remote Photoplethysmography with Parallel Spike-driven Transformer はコメントを受け付けていません
iDeLog: Iterative Dual Spatial and Kinematic Extraction of Sigma-Lognormal Parameters
要約 素早い動きの運動理論とそれに関連するシグマ対数正規モデルは、さまざまな用途 … 続きを読む
カテゴリー: cs.CV
iDeLog: Iterative Dual Spatial and Kinematic Extraction of Sigma-Lognormal Parameters はコメントを受け付けていません
Domain Adaptation based Interpretable Image Emotion Recognition using Facial Expression Recognition
要約 この論文では、顔および顔以外のオブジェクト、および人間以外のコンポーネント … 続きを読む
NeRF as Non-Distant Environment Emitter in Physics-based Inverse Rendering
要約 物理ベースの逆レンダリングは、キャプチャされた 2D 画像から形状、マテリ … 続きを読む
SARI: Simplistic Average and Robust Identification based Noisy Partial Label Learning
要約 部分ラベル学習 (PLL) は、各トレーニング インスタンスが一連の候補ラ … 続きを読む
Data-efficient Large Vision Models through Sequential Autoregression
要約 言語入力を避け、純粋に逐次的な視覚データに基づいて汎用視覚モデルをトレーニ … 続きを読む
カテゴリー: cs.CV
Data-efficient Large Vision Models through Sequential Autoregression はコメントを受け付けていません
Fully Hyperbolic Convolutional Neural Networks for Computer Vision
要約 現実世界の視覚データは、双曲空間で効果的に表現できる固有の階層構造を示しま … 続きを読む
Mixed Autoencoder for Self-supervised Visual Representation Learning
要約 Masked Autoencoder (MAE) は、画像パッチをランダム … 続きを読む