cs.CV」カテゴリーアーカイブ

Stable Flow: Vital Layers for Training-Free Image Editing

要約 拡散モデルは、コンテンツの合成と編集の分野に革命をもたらしました。 最近の … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.LG | Stable Flow: Vital Layers for Training-Free Image Editing はコメントを受け付けていません

Insight-V: Exploring Long-Chain Visual Reasoning with Multimodal Large Language Models

要約 大規模言語モデル (LLM) は、より推論することで強化された機能と信頼性 … 続きを読む

カテゴリー: cs.CV | Insight-V: Exploring Long-Chain Visual Reasoning with Multimodal Large Language Models はコメントを受け付けていません

ViSTa Dataset: Do vision-language models understand sequential tasks?

要約 強化学習の報酬モデルとしてビジョン言語モデル (VLM) を使用すると、コ … 続きを読む

カテゴリー: cs.CV, cs.LG | ViSTa Dataset: Do vision-language models understand sequential tasks? はコメントを受け付けていません

Pushing the Limits of Sparsity: A Bag of Tricks for Extreme Pruning

要約 ディープ ニューラル ネットワークのプルーニングは、高密度ネットワークのパ … 続きを読む

カテゴリー: cs.CV | Pushing the Limits of Sparsity: A Bag of Tricks for Extreme Pruning はコメントを受け付けていません

Geometric Algebra Planes: Convex Implicit Neural Volumes

要約 ボリュームのパラメータ化は、古典的なボクセル グリッドから暗黙的なニューラ … 続きを読む

カテゴリー: cs.CV | Geometric Algebra Planes: Convex Implicit Neural Volumes はコメントを受け付けていません

Next Best Sense: Guiding Vision and Touch with FisherRF for 3D Gaussian Splatting

要約 3D ガウス スプラッティング (3DGS) を使用したロボット マニピュ … 続きを読む

カテゴリー: cs.CV, cs.RO | Next Best Sense: Guiding Vision and Touch with FisherRF for 3D Gaussian Splatting はコメントを受け付けていません

VADet: Multi-frame LiDAR 3D Object Detection using Variable Aggregation

要約 入力集約は、最先端の LiDAR 3D 物体検出器が検出を向上させるために … 続きを読む

カテゴリー: cs.CV | VADet: Multi-frame LiDAR 3D Object Detection using Variable Aggregation はコメントを受け付けていません

MagicDrive3D: Controllable 3D Generation for Any-View Rendering in Street Scenes

要約 画像やビデオの制御可能な生成モデルは目覚ましい成功を収めていますが、3D … 続きを読む

カテゴリー: cs.AI, cs.CV | MagicDrive3D: Controllable 3D Generation for Any-View Rendering in Street Scenes はコメントを受け付けていません

Intensity-Spatial Dual Masked Autoencoder for Multi-Scale Feature Learning in Chest CT Segmentation

要約 医療画像セグメンテーションの分野では、不明瞭な病変の特徴、曖昧な境界、マル … 続きを読む

カテゴリー: cs.CV, eess.IV | Intensity-Spatial Dual Masked Autoencoder for Multi-Scale Feature Learning in Chest CT Segmentation はコメントを受け付けていません

An Integrated Approach to Robotic Object Grasping and Manipulation

要約 倉庫業務における手作業と効率化という増大する課題に対応して、Amazon … 続きを読む

カテゴリー: cs.CV, cs.RO | An Integrated Approach to Robotic Object Grasping and Manipulation はコメントを受け付けていません