-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2023年6月
Lesion Detection on Leaves using Class Activation Maps
要約 植物の葉の病変の検出は、植物病理学および農業研究において重要なタスクです。 … 続きを読む
Semi-Implicit Denoising Diffusion Models (SIDDMs)
要約 生成モデルの急増にもかかわらず、サンプルの多様性と品質を損なうことなく推論 … 続きを読む
First Place Solution to the CVPR’2023 AQTC Challenge: A Function-Interaction Centric Approach with Spatiotemporal Visual-Language Alignment
要約 アフォーダンス中心の質問主導型タスク完了 (AQTC) は、ビデオから知識 … 続きを読む
カテゴリー: cs.CV
First Place Solution to the CVPR’2023 AQTC Challenge: A Function-Interaction Centric Approach with Spatiotemporal Visual-Language Alignment はコメントを受け付けていません
DiffInfinite: Large Mask-Image Synthesis via Parallel Random Patch Diffusion in Histopathology
要約 我々は、長距離相関構造情報を保存しながら任意に大きな組織学的画像を生成する … 続きを読む
MME: A Comprehensive Evaluation Benchmark for Multimodal Large Language Models
要約 マルチモーダル大規模言語モデル (MLLM) は、強力な LLM に依存し … 続きを読む
カテゴリー: cs.CV
MME: A Comprehensive Evaluation Benchmark for Multimodal Large Language Models はコメントを受け付けていません
3D VR Sketch Guided 3D Shape Prototyping and Exploration
要約 3D 形状モデリングは多大な労力と時間がかかり、長年の専門知識が必要です。 … 続きを読む
カテゴリー: cs.CV
3D VR Sketch Guided 3D Shape Prototyping and Exploration はコメントを受け付けていません
PP-GAN : Style Transfer from Korean Portraits to ID Photos Using Landmark Extractor with GAN
要約 スタイル転送の目的は、別の画像のスタイルを転送しながら、画像のコンテンツを … 続きを読む
カテゴリー: cs.CV
PP-GAN : Style Transfer from Korean Portraits to ID Photos Using Landmark Extractor with GAN はコメントを受け付けていません
Towards Unseen Triples: Effective Text-Image-joint Learning for Scene Graph Generation
要約 シーン グラフ生成 (SGG) は、画像内のオブジェクトとその接続を構造的 … 続きを読む
カテゴリー: cs.CV
Towards Unseen Triples: Effective Text-Image-joint Learning for Scene Graph Generation はコメントを受け付けていません
Day2Dark: Pseudo-Supervised Activity Recognition beyond Silent Daylight
要約 この論文は、日中だけでなく暗闇での活動を認識することに努めています。 私た … 続きを読む
カテゴリー: cs.CV
Day2Dark: Pseudo-Supervised Activity Recognition beyond Silent Daylight はコメントを受け付けていません
Summarize the Past to Predict the Future: Natural Language Descriptions of Context Boost Multimodal Object Interaction
要約 私たちは自己中心的なビデオにおけるオブジェクトの相互作用の予測を研究してい … 続きを読む