-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年1月
MM-Interleaved: Interleaved Image-Text Generative Modeling via Multi-modal Feature Synchronizer
要約 インターリーブされた画像とテキストのデータの生成モデルの開発には、研究と実 … 続きを読む
GPAvatar: Generalizable and Precise Head Avatar from Image(s)
要約 頭部アバターの再構成は、仮想現実、オンライン会議、ゲーム、映画業界のアプリ … 続きを読む
カテゴリー: cs.CV
GPAvatar: Generalizable and Precise Head Avatar from Image(s) はコメントを受け付けていません
Explaining the Implicit Neural Canvas: Connecting Pixels to Neurons by Tracing their Contributions
要約 ニューラル ネットワークが信号の連続表現としてトレーニングされる暗黙的ニュ … 続きを読む
カテゴリー: cs.CV
Explaining the Implicit Neural Canvas: Connecting Pixels to Neurons by Tracing their Contributions はコメントを受け付けていません
Edit One for All: Interactive Batch Image Editing
要約 近年、画像編集の進歩はめざましいものがあります。 人間による制御が強化され … 続きを読む
カテゴリー: cs.CV
Edit One for All: Interactive Batch Image Editing はコメントを受け付けていません
AutoFT: Robust Fine-Tuning by Optimizing Hyperparameters on OOD Data
要約 基盤モデルは、タスク固有のデータを微調整することで、目的のタスクに適応でき … 続きを読む
Supervised Fine-tuning in turn Improves Visual Foundation Models
要約 近年、CLIP のような画像テキスト トレーニングが視覚基礎モデルの事前ト … 続きを読む
The Manga Whisperer: Automatically Generating Transcriptions for Comics
要約 過去数十年の間に、一般にマンガと呼ばれる日本のコミックは、文化と言語の境界 … 続きを読む
カテゴリー: cs.CV
The Manga Whisperer: Automatically Generating Transcriptions for Comics はコメントを受け付けていません
Towards Language-Driven Video Inpainting via Multimodal Large Language Models
要約 新しいタスクである言語駆動型ビデオ修復を導入します。これは自然言語命令を使 … 続きを読む
カテゴリー: cs.CV
Towards Language-Driven Video Inpainting via Multimodal Large Language Models はコメントを受け付けていません
AGILE3D: Attention Guided Interactive Multi-object 3D Segmentation
要約 インタラクティブなセグメンテーションでは、モデルとユーザーが協力して、3D … 続きを読む
A Simple Latent Diffusion Approach for Panoptic Segmentation and Mask Inpainting
要約 パノプティック ネットワークとインスタンス セグメンテーション ネットワー … 続きを読む