-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年7月
General Geometry-aware Weakly Supervised 3D Object Detection
要約 3D オブジェクト検出は、シーンを理解するために不可欠なコンポーネントです … 続きを読む
カテゴリー: cs.CV
General Geometry-aware Weakly Supervised 3D Object Detection はコメントを受け付けていません
Pose-guided multi-task video transformer for driver action recognition
要約 私たちは、車内ビデオの分析を通じて脇見運転の状況を特定するタスクを調査しま … 続きを読む
カテゴリー: cs.CV
Pose-guided multi-task video transformer for driver action recognition はコメントを受け付けていません
LogoSticker: Inserting Logos into Diffusion Models for Customized Generation
要約 テキストから画像へのモデルのカスタマイズにおける最近の進歩により、新しい概 … 続きを読む
カテゴリー: cs.CV
LogoSticker: Inserting Logos into Diffusion Models for Customized Generation はコメントを受け付けていません
Exploring Facial Biomarkers for Depression through Temporal Analysis of Action Units
要約 うつ病は、持続的な悲しみと興味の喪失を特徴とし、日常生活の機能を著しく損な … 続きを読む
カテゴリー: cs.CV
Exploring Facial Biomarkers for Depression through Temporal Analysis of Action Units はコメントを受け付けていません
Streetscapes: Large-scale Consistent Street View Generation Using Autoregressive Video Diffusion
要約 我々は、オンザフライで合成された都市スケールのシーンを通じて、街並みに相当 … 続きを読む
SegPoint: Segment Any Point Cloud via Large Language Model
要約 3D 点群セグメンテーションが大幅に進歩しているにもかかわらず、既存の方法 … 続きを読む
カテゴリー: cs.CV
SegPoint: Segment Any Point Cloud via Large Language Model はコメントを受け付けていません
Shape of Motion: 4D Reconstruction from a Single Video
要約 単眼の動的再構成は、非常に不適切な作業であるため、長年にわたる困難な視覚問 … 続きを読む
カテゴリー: cs.CV
Shape of Motion: 4D Reconstruction from a Single Video はコメントを受け付けていません
Visual Haystacks: Answering Harder Questions About Sets of Images
要約 大規模マルチモーダル モデル (LMM) の最近の進歩により、単一画像によ … 続きを読む
カテゴリー: cs.CV
Visual Haystacks: Answering Harder Questions About Sets of Images はコメントを受け付けていません
Transformers Get Stable: An End-to-End Signal Propagation Theory for Language Models
要約 変圧器モデルは大成功を収めているにもかかわらず、依然として詳細に拡張するこ … 続きを読む
Addressing Imbalance for Class Incremental Learning in Medical Image Classification
要約 ディープ畳み込みニューラル ネットワークは、すべてのクラスのトレーニング … 続きを読む
カテゴリー: cs.CV
Addressing Imbalance for Class Incremental Learning in Medical Image Classification はコメントを受け付けていません