月別アーカイブ: 2024年7月

Looking at Model Debiasing through the Lens of Anomaly Detection

要約 ディープ ニューラル ネットワークがデータの偏りの影響を受けやすいことは広 … 続きを読む

カテゴリー: cs.CV, cs.LG, I.4 | Looking at Model Debiasing through the Lens of Anomaly Detection はコメントを受け付けていません

$VILA^2$: VILA Augmented VILA

要約 ビジュアル言語モデル (VLM) は、大規模言語モデル (LLM) の成功 … 続きを読む

カテゴリー: cs.CV | $VILA^2$: VILA Augmented VILA はコメントを受け付けていません

CSCPR: Cross-Source-Context Indoor RGB-D Place Recognition

要約 グローバルな検索と再ランキングを単一のエンドツーエンド モデルに統合する、 … 続きを読む

カテゴリー: cs.CV, cs.RO | CSCPR: Cross-Source-Context Indoor RGB-D Place Recognition はコメントを受け付けていません

SoNIC: Safe Social Navigation with Adaptive Conformal Inference and Constrained Reinforcement Learning

要約 強化学習 (RL) により、ソーシャル ロボットは人間が設計したルールや介 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO, cs.SY, eess.SY | SoNIC: Safe Social Navigation with Adaptive Conformal Inference and Constrained Reinforcement Learning はコメントを受け付けていません

SV4D: Dynamic 3D Content Generation with Multi-Frame and Multi-View Consistency

要約 我々は、マルチフレームおよびマルチビューの一貫した動的 3D コンテンツ生 … 続きを読む

カテゴリー: cs.CV | SV4D: Dynamic 3D Content Generation with Multi-Frame and Multi-View Consistency はコメントを受け付けていません

How Easily do Irrelevant Inputs Skew the Responses of Large Language Models?

要約 大規模言語モデル (LLM) は、外部知識データベースからの情報の取得を活 … 続きを読む

カテゴリー: cs.CL | How Easily do Irrelevant Inputs Skew the Responses of Large Language Models? はコメントを受け付けていません

AMONGAGENTS: Evaluating Large Language Models in the Interactive Text-Based Social Deduction Game

要約 戦略的社会演繹ゲームは、言語モデルの理解と推論スキルを評価するための貴重な … 続きを読む

カテゴリー: cs.CL | AMONGAGENTS: Evaluating Large Language Models in the Interactive Text-Based Social Deduction Game はコメントを受け付けていません

A Simulation Benchmark for Autonomous Racing with Large-Scale Human Data

要約 国際的な賞金競争、スケール調整された車両、シミュレーション環境が利用可能で … 続きを読む

カテゴリー: cs.LG, cs.RO | A Simulation Benchmark for Autonomous Racing with Large-Scale Human Data はコメントを受け付けていません

Audio Prompt Adapter: Unleashing Music Editing Abilities for Text-to-Music with Lightweight Finetuning

要約 テキストから音楽へのモデルを使用すると、ユーザーはテキスト コマンドを使用 … 続きを読む

カテゴリー: cs.AI, cs.SD, eess.AS | Audio Prompt Adapter: Unleashing Music Editing Abilities for Text-to-Music with Lightweight Finetuning はコメントを受け付けていません

Velocity Driven Vision: Asynchronous Sensor Fusion Birds Eye View Models for Autonomous Vehicles

要約 異なるセンサー モダリティを融合することは、特にセンサーが非同期である場合 … 続きを読む

カテゴリー: cs.CV, cs.RO | Velocity Driven Vision: Asynchronous Sensor Fusion Birds Eye View Models for Autonomous Vehicles はコメントを受け付けていません