-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Deep neural network-based detection of counterfeit products from smartphone images
要約 医薬品やワクチンなどの偽造品や、ファッション性の高いハンドバッグ、時計、宝 … 続きを読む
カテゴリー: cs.CV
Deep neural network-based detection of counterfeit products from smartphone images はコメントを受け付けていません
DMPlug: A Plug-in Method for Solving Inverse Problems with Diffusion Models
要約 事前学習済み拡散モデル (DM) は、最近、逆問題 (IP) を解く際に広 … 続きを読む
LDTrack: Dynamic People Tracking by Service Robots using Diffusion Models
要約 雑然とした混雑した人間中心の環境でダイナミックな人々を追跡することは、オク … 続きを読む
Multi-branch Spatio-Temporal Graph Neural Network For Efficient Ice Layer Thickness Prediction
要約 極地の氷層の時空間パターンを理解することは、氷床のバランスの変化を追跡し、 … 続きを読む
bit2bit: 1-bit quanta video reconstruction via self-supervised photon prediction
要約 SPAD アレイなどの Quanta イメージ センサーは、数ナノ秒という … 続きを読む
Pseudo-labeling with Keyword Refining for Few-Supervised Video Captioning
要約 ビデオのキャプションは、ビデオの内容を説明する文章を生成します。 既存の方 … 続きを読む
カテゴリー: cs.CV
Pseudo-labeling with Keyword Refining for Few-Supervised Video Captioning はコメントを受け付けていません
H-POPE: Hierarchical Polling-based Probing Evaluation of Hallucinations in Large Vision-Language Models
要約 ラージ ビジョン言語モデル (LVLM) は、テキストと画像の両方を活用す … 続きを読む
カテゴリー: cs.CV
H-POPE: Hierarchical Polling-based Probing Evaluation of Hallucinations in Large Vision-Language Models はコメントを受け付けていません
Textual Decomposition Then Sub-motion-space Scattering for Open-Vocabulary Motion Generation
要約 テキストからモーションの生成は、コンピューター ビジョンにおいて重要なタス … 続きを読む
カテゴリー: cs.CV
Textual Decomposition Then Sub-motion-space Scattering for Open-Vocabulary Motion Generation はコメントを受け付けていません
Gaussian Deja-vu: Creating Controllable 3D Gaussian Head-Avatars with Enhanced Generalization and Personalization Abilities
要約 3D ガウス スプラッティング (3DGS) の最近の進歩により、3D 頭 … 続きを読む
カテゴリー: cs.CV
Gaussian Deja-vu: Creating Controllable 3D Gaussian Head-Avatars with Enhanced Generalization and Personalization Abilities はコメントを受け付けていません
RaVL: Discovering and Mitigating Spurious Correlations in Fine-Tuned Vision-Language Models
要約 微調整された視覚言語モデル (VLM) は、画像の特徴とテキスト属性の間の … 続きを読む