-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
PCBEAR: Pose Concept Bottleneck for Explainable Action Recognition
要約 人間の行動認識(HAR)は、深い学習モデルで印象的な結果を達成していますが … 続きを読む
カテゴリー: cs.CV
PCBEAR: Pose Concept Bottleneck for Explainable Action Recognition はコメントを受け付けていません
$\texttt{Complex-Edit}$: CoT-Like Instruction Generation for Complexity-Controllable Image Editing Benchmark
要約 さまざまな複雑さの指示にわたって命令ベースの画像編集モデルを体系的に評価す … 続きを読む
Readable Twins of Unreadable Models
要約 責任ある人工知能(AI)システムの作成は、AIの作品の現代の研究開発におけ … 続きを読む
St4RTrack: Simultaneous 4D Reconstruction and Tracking in the World
要約 動的な3D再構成とビデオのポイント追跡は、通常、深いつながりにもかかわらず … 続きを読む
カテゴリー: cs.CV
St4RTrack: Simultaneous 4D Reconstruction and Tracking in the World はコメントを受け付けていません
Training-Free Hierarchical Scene Understanding for Gaussian Splatting with Superpoint Graphs
要約 自然言語と3Dジオメトリを橋渡しすることは、柔軟で言語主導のシーンの理解に … 続きを読む
カテゴリー: cs.CV
Training-Free Hierarchical Scene Understanding for Gaussian Splatting with Superpoint Graphs はコメントを受け付けていません
AerialMegaDepth: Learning Aerial-Ground Reconstruction and View Synthesis
要約 地面と空中の景色の混合物から撮影された画像の幾何学的再構成のタスクを探りま … 続きを読む
カテゴリー: cs.CV
AerialMegaDepth: Learning Aerial-Ground Reconstruction and View Synthesis はコメントを受け付けていません
Digital Twin Generation from Visual Data: A Survey
要約 この調査では、ビデオからデジタルツインを生成する最近の開発を調査します。 … 続きを読む
カテゴリー: cs.CV
Digital Twin Generation from Visual Data: A Survey はコメントを受け付けていません
Personalized Text-to-Image Generation with Auto-Regressive Models
要約 パーソナライズされた画像合成は、テキストから画像の生成における極めて重要な … 続きを読む
カテゴリー: cs.CV
Personalized Text-to-Image Generation with Auto-Regressive Models はコメントを受け付けていません
ODHSR: Online Dense 3D Reconstruction of Humans and Scenes from Monocular Videos
要約 人間中心の3D世界の認識において、単一の単眼内の野生のビデオフィギュアから … 続きを読む
Generate, but Verify: Reducing Hallucination in Vision-Language Models with Retrospective Resampling
要約 ビジョン言語モデル(VLM)は視覚的な理解に優れていますが、視覚的な幻覚に … 続きを読む
カテゴリー: cs.CV
Generate, but Verify: Reducing Hallucination in Vision-Language Models with Retrospective Resampling はコメントを受け付けていません