-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
DualPM: Dual Posed-Canonical Point Maps for 3D Shape and Pose Reconstruction
要約 データ表現の選択は、幾何学的タスクにおける深層学習の成功の重要な要素です。 … 続きを読む
カテゴリー: cs.CV
DualPM: Dual Posed-Canonical Point Maps for 3D Shape and Pose Reconstruction はコメントを受け付けていません
UnZipLoRA: Separating Content and Style from a Single Image
要約 このペーパーでは、画像をその構成要素である主題とスタイルに分解する手法であ … 続きを読む
カテゴリー: cs.CV
UnZipLoRA: Separating Content and Style from a Single Image はコメントを受け付けていません
VisionZip: Longer is Better but Not Necessary in Vision Language Models
要約 ビジョン言語モデルの最近の進歩により、ビジュアル トークンの長さがテキスト … 続きを読む
QUEEN: QUantized Efficient ENcoding of Dynamic Gaussians for Streaming Free-viewpoint Videos
要約 オンラインの自由視点ビデオ (FVV) ストリーミングは、比較的研究が進ん … 続きを読む
NVILA: Efficient Frontier Visual Language Models
要約 近年、視覚言語モデル (VLM) の精度が大幅に向上しました。 しかし、そ … 続きを読む
カテゴリー: cs.CV
NVILA: Efficient Frontier Visual Language Models はコメントを受け付けていません
Turbo3D: Ultra-fast Text-to-3D Generation
要約 Turbo3D は、1 秒未満で高品質のガウス スプラッティング アセット … 続きを読む
カテゴリー: cs.CV
Turbo3D: Ultra-fast Text-to-3D Generation はコメントを受け付けていません
PaintScene4D: Consistent 4D Scene Generation from Text Prompts
要約 拡散モデルの最近の進歩は 2D および 3D コンテンツの作成に革命をもた … 続きを読む
Stereo Anywhere: Robust Zero-Shot Deep Stereo Matching Even Where Either Stereo or Mono Fail
要約 Stereo Anywhere は、幾何学的制約と単眼深度ビジョン基盤モデ … 続きを読む
カテゴリー: cs.CV
Stereo Anywhere: Robust Zero-Shot Deep Stereo Matching Even Where Either Stereo or Mono Fail はコメントを受け付けていません
A Bidirectional Siamese Recurrent Neural Network for Accurate Gait Recognition Using Body Landmarks
要約 歩行認識は、特に他の生理学的生体認証が非実用的または無効であるシナリオにお … 続きを読む
Hijacking Vision-and-Language Navigation Agents with Adversarial Environmental Attacks
要約 オープンワールド環境でタスクを実行するように自然言語で指示できる身体支援エ … 続きを読む