-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
PRIMA: Multi-Image Vision-Language Models for Reasoning Segmentation
要約 Large Vision-Language Model (LVLM) の大 … 続きを読む
Scaling 4D Representations
要約 ビデオからの純粋な自己教師あり学習については、スケーリングが説得力を持って … 続きを読む
Generative Multiview Relighting for 3D Reconstruction under Extreme Illumination Variation
要約 異なる環境で撮影された写真から物体の幾何学形状や外観を再構成することは、照 … 続きを読む
カテゴリー: cs.CV
Generative Multiview Relighting for 3D Reconstruction under Extreme Illumination Variation はコメントを受け付けていません
LeviTor: 3D Trajectory Oriented Image-to-Video Synthesis
要約 ドラッグベースのインタラクションの直観的な性質により、画像からビデオへの合 … 続きを読む
カテゴリー: cs.CV
LeviTor: 3D Trajectory Oriented Image-to-Video Synthesis はコメントを受け付けていません
Flowing from Words to Pixels: A Framework for Cross-Modality Evolution
要約 拡散モデルとその一般化であるフロー マッチングは、メディア生成の分野に顕著 … 続きを読む
カテゴリー: cs.CV
Flowing from Words to Pixels: A Framework for Cross-Modality Evolution はコメントを受け付けていません
EnvGS: Modeling View-Dependent Appearance with Environment Gaussian
要約 現実世界のシーンの複雑な反射を 2D 画像から再構築することは、フォトリア … 続きを読む
カテゴリー: cs.CV
EnvGS: Modeling View-Dependent Appearance with Environment Gaussian はコメントを受け付けていません
UIP2P: Unsupervised Instruction-based Image Editing via Cycle Edit Consistency
要約 私たちは、トレーニング中にグラウンドトゥルース編集された画像の必要性を排除 … 続きを読む
カテゴリー: cs.CV
UIP2P: Unsupervised Instruction-based Image Editing via Cycle Edit Consistency はコメントを受け付けていません
A Black-Box Evaluation Framework for Semantic Robustness in Bird’s Eye View Detection
要約 カメラベースの鳥瞰図 (BEV) 認識モデルは、深層学習の堅牢性と信頼性に … 続きを読む
カテゴリー: cs.CV
A Black-Box Evaluation Framework for Semantic Robustness in Bird’s Eye View Detection はコメントを受け付けていません
GaraMoSt: Parallel Multi-Granularity Motion and Structural Modeling for Efficient Multi-Frame Interpolation in DSA Images
要約 デジタル サブトラクション アンギオグラフィー (DSA) 画像の迅速かつ … 続きを読む
カテゴリー: cs.CV
GaraMoSt: Parallel Multi-Granularity Motion and Structural Modeling for Efficient Multi-Frame Interpolation in DSA Images はコメントを受け付けていません
FashionComposer: Compositional Fashion Image Generation
要約 構成的なファッション画像を生成するための FashionComposer … 続きを読む
カテゴリー: cs.CV
FashionComposer: Compositional Fashion Image Generation はコメントを受け付けていません