NaVid: Video-based VLM Plans the Next Step for Vision-and-Language Navigation

要約 Vision-and-Language Navigation (VLN) … 続きを読む

Feedback Efficient Online Fine-Tuning of Diffusion Models

要約 拡散モデルは、画像、タンパク質、小分子などの複雑なデータ分布のモデル化に優 … 続きを読む

ID-XCB: Data-independent Debiasing for Fair and Accurate Transformer-based Cyberbullying Detection

要約 悪口は、ネットいじめ事件に関するデータセットを収集するための一般的な手段で … 続きを読む

Ask Again, Then Fail: Large Language Models’ Vacillations in Judgement

要約 ChatGPT のような生成会話型大規模言語モデル (LLM) が登場し、 … 続きを読む

RoboGrind: Intuitive and Interactive Surface Treatment with Industrial Robots

要約 研削、サンディング、研磨などの表面処理タスクは、多くの業界のバリュー チェ … 続きを読む

Cross-domain Chinese Sentence Pattern Parsing

要約 文パターン構造 (SPS) 解析は、主に言語教育で使用される構文解析手法で … 続きを読む

Stochastic Conditional Diffusion Models for Semantic Image Synthesis

要約 意味画像合成 (SIS) は、意味マップ (ラベル) に対応するリアルな画 … 続きを読む

DisenBooth: Identity-Preserving Disentangled Tuning for Subject-Driven Text-to-Image Generation

要約 主題主導のテキストから画像への生成は、テキストの説明に基づいて特定の主題の … 続きを読む

From Reals to Logic and Back: Inventing Symbolic Vocabularies, Actions, and Models for Planning from Raw Data

要約 手作業で作成されたロジックベースの状態およびアクション表現は、タスクや動作 … 続きを読む

Achieving $\tilde{O}(1/ε)$ Sample Complexity for Constrained Markov Decision Process

要約 我々は、逐次学習および意思決定における安全性またはリソースの制約を満たす上 … 続きを読む

