cs.AI」カテゴリーアーカイブ

RGB-Th-Bench: A Dense benchmark for Visual-Thermal Understanding of Vision Language Models

要約 RGB-Th-Benchは、RGBサーマル画像ペアを理解するための視覚言語 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | RGB-Th-Bench: A Dense benchmark for Visual-Thermal Understanding of Vision Language Models はコメントを受け付けていません

Towards Reliable Time Series Forecasting under Future Uncertainty: Ambiguity and Novelty Rejection Mechanisms

要約 現実世界の時系列予測では、不確実性と信頼できる評価の欠如は大きな課題をもた … 続きを読む

カテゴリー: cs.AI, cs.LG | Towards Reliable Time Series Forecasting under Future Uncertainty: Ambiguity and Novelty Rejection Mechanisms はコメントを受け付けていません

BiblioPage: A Dataset of Scanned Title Pages for Bibliographic Metadata Extraction

要約 書誌メタデータの手動デジタル化は、特に文書間で非常に可変的なフォーマットを … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | BiblioPage: A Dataset of Scanned Title Pages for Bibliographic Metadata Extraction はコメントを受け付けていません

Helvipad: A Real-World Dataset for Omnidirectional Stereo Depth Estimation

要約 ステレオ深度の推定の進行にもかかわらず、主に適切なデータがないため、全方向 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Helvipad: A Real-World Dataset for Omnidirectional Stereo Depth Estimation はコメントを受け付けていません

Deep Learning for Speech Emotion Recognition: A CNN Approach Utilizing Mel Spectrograms

要約 このペーパーでは、オーディオファイルのMELスペクトログラム表現を介して音 … 続きを読む

カテゴリー: cs.AI, cs.SD | Deep Learning for Speech Emotion Recognition: A CNN Approach Utilizing Mel Spectrograms はコメントを受け付けていません

Optimal Path Planning and Cost Minimization for a Drone Delivery System Via Model Predictive Control

要約 この研究では、ドローン送達の問題をコントロールの問題として定式化し、モデル … 続きを読む

カテゴリー: cs.AI, cs.MA | Optimal Path Planning and Cost Minimization for a Drone Delivery System Via Model Predictive Control はコメントを受け付けていません

Generative AI for Validating Physics Laws

要約 生成的人工知能(AI)を提示して、恒星の温度と光度をリンクするステファンボ … 続きを読む

カテゴリー: astro-ph.GA, astro-ph.SR, cs.AI | Generative AI for Validating Physics Laws はコメントを受け付けていません

Bootstrap Your Own Views: Masked Ego-Exo Modeling for Fine-grained View-invariant Video Representations

要約 エゴセントリック(ファーストパーソン、エゴ)およびエクソセントリック(サー … 続きを読む

カテゴリー: cs.AI, cs.CV | Bootstrap Your Own Views: Masked Ego-Exo Modeling for Fine-grained View-invariant Video Representations はコメントを受け付けていません

Writing as a testbed for open ended agents

要約 膨大なソリューションスペースのため、LLMSにとってオープンエンドのタスク … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.HC | Writing as a testbed for open ended agents はコメントを受け付けていません

Decoupled Dynamics Framework with Neural Fields for 3D Spatio-temporal Prediction of Vehicle Collisions

要約 この研究は、グローバルな剛体運動と局所構造変形を独立してモデル化することに … 続きを読む

カテゴリー: cs.AI, cs.CE | Decoupled Dynamics Framework with Neural Fields for 3D Spatio-temporal Prediction of Vehicle Collisions はコメントを受け付けていません