月別アーカイブ: 2024年6月

Task and Motion Planning for Execution in the Real

要約 タスクおよびモーション プランニングは、個別のタスク ドメインに対する推論 … 続きを読む

カテゴリー: cs.AI, cs.RO, I.2.8 | Task and Motion Planning for Execution in the Real はコメントを受け付けていません

Action2Sound: Ambient-Aware Generation of Action Sounds from Egocentric Videos

要約 人間の対話のためのリアルなオーディオを生成することは、映画や仮想現実ゲーム … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.SD, eess.AS | Action2Sound: Ambient-Aware Generation of Action Sounds from Egocentric Videos はコメントを受け付けていません

HoneyBee: A Scalable Modular Framework for Creating Multimodal Oncology Datasets with Foundational Embedding Models

要約 腫瘍学向けの正確な機械学習モデルを開発するには、大規模で高品質のマルチモー … 続きを読む

カテゴリー: cs.AI, cs.DB, cs.LG | HoneyBee: A Scalable Modular Framework for Creating Multimodal Oncology Datasets with Foundational Embedding Models はコメントを受け付けていません

Understanding Jailbreak Success: A Study of Latent Space Dynamics in Large Language Models

要約 会話型大規模言語モデルは、有害な質問への回答を拒否するように訓練されていま … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Understanding Jailbreak Success: A Study of Latent Space Dynamics in Large Language Models はコメントを受け付けていません

Optimization Efficient Open-World Visual Region Recognition

要約 オープンワールドのオブジェクト検出など、制約のない画像の個々の領域またはパ … 続きを読む

カテゴリー: cs.AI, cs.CV | Optimization Efficient Open-World Visual Region Recognition はコメントを受け付けていません

Unlearning Traces the Influential Training Data of Language Models

要約 言語モデルの出力に影響を与えるトレーニング データセットを特定することは、 … 続きを読む

カテゴリー: cs.AI, cs.CL | Unlearning Traces the Influential Training Data of Language Models はコメントを受け付けていません

Neural Assets: 3D-Aware Multi-Object Scene Synthesis with Image Diffusion Models

要約 画像拡散モデルにおける複数オブジェクトの 3D 姿勢制御の問題に取り組みま … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Neural Assets: 3D-Aware Multi-Object Scene Synthesis with Image Diffusion Models はコメントを受け付けていません

Parameter-Efficient Active Learning for Foundational models

要約 基本的なビジョン トランスフォーマー モデルは、多くのビジョン タスクで数 … 続きを読む

カテゴリー: cs.AI, cs.CV | Parameter-Efficient Active Learning for Foundational models はコメントを受け付けていません

DiffuSyn Bench: Evaluating Vision-Language Models on Real-World Complexities with Diffusion-Generated Synthetic Benchmarks

要約 この研究では、AI が生成した画像と人間が生成した画像を区別するラージ ビ … 続きを読む

カテゴリー: cs.AI, cs.CV | DiffuSyn Bench: Evaluating Vision-Language Models on Real-World Complexities with Diffusion-Generated Synthetic Benchmarks はコメントを受け付けていません

ThermoHands: A Benchmark for 3D Hand Pose Estimation from Egocentric Thermal Images

要約 この研究では、変化する照明条件や障害物 (ハンドウェアなど) などの課題を … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.HC, cs.LG | ThermoHands: A Benchmark for 3D Hand Pose Estimation from Egocentric Thermal Images はコメントを受け付けていません