月別アーカイブ: 2024年7月

Tuning Vision-Language Models with Candidate Labels by Prompt Alignment

要約 ビジョン言語モデル (VLM) は、画像とテキストのペアの大規模なトレーニ … 続きを読む

カテゴリー: cs.AI, cs.CV | Tuning Vision-Language Models with Candidate Labels by Prompt Alignment はコメントを受け付けていません

Evaluating Large Language Models with Grid-Based Game Competitions: An Extensible LLM Benchmark and Leaderboard

要約 三目並べ、コネクトフォー、五目並べなどのグリッドベースのゲームを通じて、大 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.NE | Evaluating Large Language Models with Grid-Based Game Competitions: An Extensible LLM Benchmark and Leaderboard はコメントを受け付けていません

Progressive Growing of Patch Size: Resource-Efficient Curriculum Learning for Dense Prediction Tasks

要約 この研究では、高密度予測タスクに対するリソース効率の高い暗黙的なカリキュラ … 続きを読む

カテゴリー: cs.CV | Progressive Growing of Patch Size: Resource-Efficient Curriculum Learning for Dense Prediction Tasks はコメントを受け付けていません

AVCap: Leveraging Audio-Visual Features as Text Tokens for Captioning

要約 近年、表現学習と言語モデルの進歩により、自動キャプション (AC) が新た … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | AVCap: Leveraging Audio-Visual Features as Text Tokens for Captioning はコメントを受け付けていません

SaMoye: Zero-shot Singing Voice Conversion Based on Feature Disentanglement and Synthesis

要約 歌声変換 (SVC) は、元の内容を維持したまま、特定の音楽作品内の歌手の … 続きを読む

カテゴリー: 68Txx(Primary)14F05, 91Fxx(Secondary), cs.AI, cs.MM, cs.SD, eess.AS, I.2.7 | SaMoye: Zero-shot Singing Voice Conversion Based on Feature Disentanglement and Synthesis はコメントを受け付けていません

RASP: A Drone-based Reconfigurable Actuation and Sensing Platform for Engaging Physical Environments with Foundation Models

要約 基礎モデルと大規模言語モデルは、テキストやデジタル メディアを生成するため … 続きを読む

カテゴリー: cs.AI, cs.HC, cs.RO | RASP: A Drone-based Reconfigurable Actuation and Sensing Platform for Engaging Physical Environments with Foundation Models はコメントを受け付けていません

Guessing human intentions to avoid dangerous situations in caregiving robots

要約 ロボットが社会的に対話するには、人間の意図を解釈し、その潜在的な結果を正確 … 続きを読む

カテゴリー: cs.AI, cs.RO | Guessing human intentions to avoid dangerous situations in caregiving robots はコメントを受け付けていません

Adaptive Backstepping and Non-singular Sliding Mode Control for Quadrotor UAVs with Unknown Time-varying Uncertainties

要約 この論文では、作動不足の垂直離着陸 (VTOL) 無人航空機 (UAV) … 続きを読む

カテゴリー: cs.RO, cs.SY, eess.SY | Adaptive Backstepping and Non-singular Sliding Mode Control for Quadrotor UAVs with Unknown Time-varying Uncertainties はコメントを受け付けていません

Barely-Visible Surface Crack Detection for Wind Turbine Sustainability

要約 風力エネルギーの生産は、持続可能な開発と化石燃料への依存の削減にとって重要 … 続きを読む

カテゴリー: cs.CV, cs.RO | Barely-Visible Surface Crack Detection for Wind Turbine Sustainability はコメントを受け付けていません

Semantic Belief Behavior Graph: Enabling Autonomous Robot Inspection in Unknown Environments

要約 この論文では、複雑で未知の環境における自律ロボット検査の問題について取り上 … 続きを読む

カテゴリー: cs.RO | Semantic Belief Behavior Graph: Enabling Autonomous Robot Inspection in Unknown Environments はコメントを受け付けていません