-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年4月
HiScene: Creating Hierarchical 3D Scenes with Isometric View Generation
要約 シーンレベルの3D世代は、マルチメディアとコンピューターグラフィックスの重 … 続きを読む
SkyReels-V2: Infinite-length Film Generative Model
要約 ビデオ生成の最近の進歩は、拡散モデルと自己回帰フレームワークによって推進さ … 続きを読む
カテゴリー: cs.CV
SkyReels-V2: Infinite-length Film Generative Model はコメントを受け付けていません
Effective Dual-Region Augmentation for Reduced Reliance on Large Amounts of Labeled Data
要約 このペーパーでは、大規模なラベル付きデータセットへの依存を減らし、ソースフ … 続きを読む
カテゴリー: cs.CV
Effective Dual-Region Augmentation for Reduced Reliance on Large Amounts of Labeled Data はコメントを受け付けていません
Benchmarking the Spatial Robustness of DNNs via Natural and Adversarial Localized Corruptions
要約 DNNSの堅牢性は、特に局所的な腐敗が発生する可能性のある複雑で動的な環境 … 続きを読む
Enhancing Person-to-Person Virtual Try-On with Multi-Garment Virtual Try-Off
要約 コンピュータービジョンは、Virtual Try-On(VTON)と仮想ト … 続きを読む
EventVAD: Training-Free Event-Aware Video Anomaly Detection
要約 ビデオアノマリー検出〜(VAD)は、ビデオ内の異常の識別に焦点を当てていま … 続きを読む
カテゴリー: cs.CV
EventVAD: Training-Free Event-Aware Video Anomaly Detection はコメントを受け付けていません
RF-DETR Object Detection vs YOLOv12 : A Study of Transformer-based and CNN-based Architectures for Single-Class and Multi-Class Greenfruit Detection in Complex Orchard Environments Under Label Ambiguity
要約 この研究では、ラベルのあいまいさ、オクルージョン、およびバックグラウンドブ … 続きを読む
カテゴリー: cs.CV
RF-DETR Object Detection vs YOLOv12 : A Study of Transformer-based and CNN-based Architectures for Single-Class and Multi-Class Greenfruit Detection in Complex Orchard Environments Under Label Ambiguity はコメントを受け付けていません
Multimodal LLMs Can Reason about Aesthetics in Zero-Shot
要約 生成芸術の急速な進歩は、視覚的に心地よいイメージの作成を民主化しました。 … 続きを読む
UniEdit-Flow: Unleashing Inversion and Editing in the Era of Flow Models
要約 フローマッチングモデルは、拡散モデルの強力な代替品として浮上していますが、 … 続きを読む
カテゴリー: cs.CV
UniEdit-Flow: Unleashing Inversion and Editing in the Era of Flow Models はコメントを受け付けていません
Probing and Inducing Combinational Creativity in Vision-Language Models
要約 既存の概念を斬新なアイデアに組み合わせる能力は、人間の知性の基本的な特徴と … 続きを読む