-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
VLEU: a Method for Automatic Evaluation for Generalizability of Text-to-Image Models
要約 Text-to-Image (T2I) モデルの進歩により、テキストの説明 … 続きを読む
Visual question answering based evaluation metrics for text-to-image generation
要約 テキストから画像への生成とテキストによる画像操作は、画像生成タスクの分野で … 続きを読む
カテゴリー: cs.CV
Visual question answering based evaluation metrics for text-to-image generation はコメントを受け付けていません
Efficient Progressive Image Compression with Variance-aware Masking
要約 学習型プログレッシブ画像圧縮は、受信機でデコードされるビットが増えるにつれ … 続きを読む
カテゴリー: cs.CV
Efficient Progressive Image Compression with Variance-aware Masking はコメントを受け付けていません
Try-On-Adapter: A Simple and Flexible Try-On Paradigm
要約 オンライン ショッピングで広く使用されている画像ベースの仮想試着は、特定の … 続きを読む
カテゴリー: cs.CV
Try-On-Adapter: A Simple and Flexible Try-On Paradigm はコメントを受け付けていません
NeISF++: Neural Incident Stokes Field for Polarized Inverse Rendering of Conductors and Dielectrics
要約 最近の逆レンダリング手法では、偏光キューを利用することで形状、材質、照明の … 続きを読む
カテゴリー: cs.CV
NeISF++: Neural Incident Stokes Field for Polarized Inverse Rendering of Conductors and Dielectrics はコメントを受け付けていません
DiMoDif: Discourse Modality-information Differentiation for Audio-visual Deepfake Detection and Localization
要約 ディープフェイク技術は急速に進歩し、情報の完全性と社会的信頼に重大な脅威を … 続きを読む
カテゴリー: cs.CV
DiMoDif: Discourse Modality-information Differentiation for Audio-visual Deepfake Detection and Localization はコメントを受け付けていません
STLight: a Fully Convolutional Approach for Efficient Predictive Learning by Spatio-Temporal joint Processing
要約 時空間予測学習は、過去のフレームに基づいて将来のフレームを予測することで、 … 続きを読む
カテゴリー: cs.CV
STLight: a Fully Convolutional Approach for Efficient Predictive Learning by Spatio-Temporal joint Processing はコメントを受け付けていません
Q-VLM: Post-training Quantization for Large Vision-Language Models
要約 この論文では、効率的なマルチモーダル推論のための大規模ビジョン言語モデル … 続きを読む
カテゴリー: cs.CV
Q-VLM: Post-training Quantization for Large Vision-Language Models はコメントを受け付けていません
Block based Adaptive Compressive Sensing with Sampling Rate Control
要約 圧縮センシング (CS) は、ナイキスト レート以下の信号を取得して再構築 … 続きを読む
カテゴリー: cs.CV
Block based Adaptive Compressive Sensing with Sampling Rate Control はコメントを受け付けていません
Learning Generalizable 3D Manipulation With 10 Demonstrations
要約 デモンストレーションから堅牢で汎用性のある操作スキルを学習することは、産業 … 続きを読む