-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2023年6月
ADDP: Learning General Representations for Image Recognition and Generation with Alternating Denoising Diffusion Process
要約 画像認識と生成は長い間、互いに独立して開発されてきました。 最近の汎用表現 … 続きを読む
カテゴリー: cs.CV
ADDP: Learning General Representations for Image Recognition and Generation with Alternating Denoising Diffusion Process はコメントを受け付けていません
MIMIC-IT: Multi-Modal In-Context Instruction Tuning
要約 インタラクティブな自然言語タスクにおける大規模な言語モデルのゼロショット … 続きを読む
Video-ChatGPT: Towards Detailed Video Understanding via Large Vision and Language Models
要約 大規模言語モデル (LLM) を活用した会話エージェントは、ビジュアル デ … 続きを読む
カテゴリー: cs.CV
Video-ChatGPT: Towards Detailed Video Understanding via Large Vision and Language Models はコメントを受け付けていません
Background Prompting for Improved Object Depth
要約 単一の画像からオブジェクトの深さを推定することは、多くのビジョン、ロボット … 続きを読む
カテゴリー: cs.CV
Background Prompting for Improved Object Depth はコメントを受け付けていません
Grounded Text-to-Image Synthesis with Attention Refocusing
要約 大規模なテキストと画像のペア データセットでトレーニングされたスケーラブル … 続きを読む
カテゴリー: cs.CV
Grounded Text-to-Image Synthesis with Attention Refocusing はコメントを受け付けていません
M$^3$IT: A Large-Scale Dataset towards Multi-Modal Multilingual Instruction Tuning
要約 命令チューニングでは、ChatGPT などの大規模言語モデル (LLM) … 続きを読む
GPT Self-Supervision for a Better Data Annotator
要約 データに注釈を付けて簡潔な要約を作成するタスクは、さまざまな領域にわたって … 続きを読む
Revising deep learning methods in parking lot occupancy detection
要約 駐車誘導システムは、スマートシティ開発パラダイムの一環として、最近人気のト … 続きを読む
Integrating Geometric Control into Text-to-Image Diffusion Models for High-Quality Detection Data Generation via Text Prompt
要約 拡散モデルは、コンテンツを作成し、画像分類などのタスク用のデータを生成する … 続きを読む
Reinforcement Learning-Based Control of CrazyFlie 2.X Quadrotor
要約 プロジェクトの目的は、PID などの古典的な制御アルゴリズムと現代の強化学 … 続きを読む