-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年4月
MediSee: Reasoning-based Pixel-level Perception in Medical Images
要約 ピクセルレベルの医療画像認識の顕著な進歩にもかかわらず、既存の方法は特定の … 続きを読む
A Low-Cost Photogrammetry System for 3D Plant Modeling and Phenotyping
要約 3Dプラントモデリングと表現型のためのオープンソースの低コストの写真測量シ … 続きを読む
カテゴリー: cs.CV
A Low-Cost Photogrammetry System for 3D Plant Modeling and Phenotyping はコメントを受け付けていません
Hyperspectral Vision Transformers for Greenhouse Gas Estimations from Space
要約 Hyperspectralイメージングは、詳細なスペクトル情報を提供し … 続きを読む
カテゴリー: cs.CV
Hyperspectral Vision Transformers for Greenhouse Gas Estimations from Space はコメントを受け付けていません
A Novel Adaptive Hybrid Focal-Entropy Loss for Enhancing Diabetic Retinopathy Detection Using Convolutional Neural Networks
要約 糖尿病性網膜症は、世界中の失明の主な原因であり、AIベースの正確な診断ツー … 続きを読む
High-Quality Cloud-Free Optical Image Synthesis Using Multi-Temporal SAR and Contaminated Optical Data
要約 雲の覆いと衛星の長い再訪サイクルによって引き起こされるギャップに対処するこ … 続きを読む
カテゴリー: cs.CV
High-Quality Cloud-Free Optical Image Synthesis Using Multi-Temporal SAR and Contaminated Optical Data はコメントを受け付けていません
BadVideo: Stealthy Backdoor Attack against Text-to-Video Generation
要約 テキストツービデオ(T2V)の生成モデルは、急速に進歩し、エンターテイメン … 続きを読む
DreamO: A Unified Framework for Image Customization
要約 最近、画像のカスタマイズに関する広範な研究(例:アイデンティティ、主題、ス … 続きを読む
カテゴリー: cs.CV
DreamO: A Unified Framework for Image Customization はコメントを受け付けていません
DiffArtist: Towards Structure and Appearance Controllable Image Stylization
要約 芸術的なスタイルには、構造要素と外観の両方の要素が含まれます。 既存のニュ … 続きを読む
Critic-V: VLM Critics Help Catch VLM Errors in Multimodal Reasoning
要約 ビジョン言語モデル(VLM)は、マルチモーダル推論タスクの顕著な進歩を示し … 続きを読む
A Survey on Mixup Augmentations and Beyond
要約 深いニューラルネットワークが過去10年間でスリリングなブレークスルーを達成 … 続きを読む