-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年4月
Cross-Hierarchical Bidirectional Consistency Learning for Fine-Grained Visual Classification
要約 Fine-Grained Visual分類(FGVC)は、密接に関連するサ … 続きを読む
カテゴリー: cs.CV
Cross-Hierarchical Bidirectional Consistency Learning for Fine-Grained Visual Classification はコメントを受け付けていません
Compile Scene Graphs with Reinforcement Learning
要約 次のトークン予測は、大規模な言語モデル(LLMS)をトレーニングするための … 続きを読む
カテゴリー: cs.CV
Compile Scene Graphs with Reinforcement Learning はコメントを受け付けていません
Visual Intention Grounding for Egocentric Assistants
要約 Visual Groundingは、テキストの説明を画像内のオブジェクトと … 続きを読む
カテゴリー: cs.CV
Visual Intention Grounding for Egocentric Assistants はコメントを受け付けていません
SupResDiffGAN a new approach for the Super-Resolution task
要約 この作業では、超解像度タスクの生成的敵対ネットワーク(GANS)と拡散モデ … 続きを読む
DenSe-AdViT: A novel Vision Transformer for Dense SAR Object Detection
要約 視覚変圧器(VIT)は、グローバルな特徴を抽出する特別な能力により、合成開 … 続きを読む
カテゴリー: cs.CV
DenSe-AdViT: A novel Vision Transformer for Dense SAR Object Detection はコメントを受け付けていません
AnomalyControl: Learning Cross-modal Semantic Features for Controllable Anomaly Synthesis
要約 異常合成は、異常検査を進めるための異常なデータを増強するための重要なアプロ … 続きを読む
The Mirage of Performance Gains: Why Contrastive Decoding Fails to Address Multimodal Hallucination
要約 対照的なデコード戦略は、マルチモーダルの大手言語モデル(MLLM)の幻覚を … 続きを読む
IReNe: Instant Recoloring of Neural Radiance Fields
要約 NERFの進歩により、3Dシーンの再構築と新しいビューの合成が可能になりま … 続きを読む
カテゴリー: cs.CV
IReNe: Instant Recoloring of Neural Radiance Fields はコメントを受け付けていません
LeOCLR: Leveraging Original Images for Contrastive Learning of Visual Representations
要約 対照的なインスタンス識別方法は、画像分類やオブジェクト検出などの下流タ … 続きを読む
カテゴリー: cs.CV
LeOCLR: Leveraging Original Images for Contrastive Learning of Visual Representations はコメントを受け付けていません
DialogGen: Multi-modal Interactive Dialogue System for Multi-turn Text-to-Image Generation
要約 テキストからイメージ(T2I)生成モデルは、近年大幅に進歩しています。 た … 続きを読む
カテゴリー: cs.CV
DialogGen: Multi-modal Interactive Dialogue System for Multi-turn Text-to-Image Generation はコメントを受け付けていません