月別アーカイブ: 2023年6月

ADDP: Learning General Representations for Image Recognition and Generation with Alternating Denoising Diffusion Process

要約 画像認識と生成は長い間、互いに独立して開発されてきました。 最近の汎用表現 … 続きを読む

カテゴリー: cs.CV | ADDP: Learning General Representations for Image Recognition and Generation with Alternating Denoising Diffusion Process はコメントを受け付けていません

MIMIC-IT: Multi-Modal In-Context Instruction Tuning

要約 インタラクティブな自然言語タスクにおける大規模な言語モデルのゼロショット … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.HC | MIMIC-IT: Multi-Modal In-Context Instruction Tuning はコメントを受け付けていません

Video-ChatGPT: Towards Detailed Video Understanding via Large Vision and Language Models

要約 大規模言語モデル (LLM) を活用した会話エージェントは、ビジュアル デ … 続きを読む

カテゴリー: cs.CV | Video-ChatGPT: Towards Detailed Video Understanding via Large Vision and Language Models はコメントを受け付けていません

Background Prompting for Improved Object Depth

要約 単一の画像からオブジェクトの深さを推定することは、多くのビジョン、ロボット … 続きを読む

カテゴリー: cs.CV | Background Prompting for Improved Object Depth はコメントを受け付けていません

Grounded Text-to-Image Synthesis with Attention Refocusing

要約 大規模なテキストと画像のペア データセットでトレーニングされたスケーラブル … 続きを読む

カテゴリー: cs.CV | Grounded Text-to-Image Synthesis with Attention Refocusing はコメントを受け付けていません

M$^3$IT: A Large-Scale Dataset towards Multi-Modal Multilingual Instruction Tuning

要約 命令チューニングでは、ChatGPT などの大規模言語モデル (LLM) … 続きを読む

カテゴリー: cs.CL, cs.CV | M$^3$IT: A Large-Scale Dataset towards Multi-Modal Multilingual Instruction Tuning はコメントを受け付けていません

GPT Self-Supervision for a Better Data Annotator

要約 データに注釈を付けて簡潔な要約を作成するタスクは、さまざまな領域にわたって … 続きを読む

カテゴリー: cs.CL, cs.DB | GPT Self-Supervision for a Better Data Annotator はコメントを受け付けていません

Revising deep learning methods in parking lot occupancy detection

要約 駐車誘導システムは、スマートシティ開発パラダイムの一環として、最近人気のト … 続きを読む

カテゴリー: cs.CV, cs.LG | Revising deep learning methods in parking lot occupancy detection はコメントを受け付けていません

Integrating Geometric Control into Text-to-Image Diffusion Models for High-Quality Detection Data Generation via Text Prompt

要約 拡散モデルは、コンテンツを作成し、画像分類などのタスク用のデータを生成する … 続きを読む

カテゴリー: cs.AI, cs.CV | Integrating Geometric Control into Text-to-Image Diffusion Models for High-Quality Detection Data Generation via Text Prompt はコメントを受け付けていません

Reinforcement Learning-Based Control of CrazyFlie 2.X Quadrotor

要約 プロジェクトの目的は、PID などの古典的な制御アルゴリズムと現代の強化学 … 続きを読む

カテゴリー: cs.LG, cs.RO | Reinforcement Learning-Based Control of CrazyFlie 2.X Quadrotor はコメントを受け付けていません