「cs.LG」カテゴリーアーカイブ

Where Do You Go? Pedestrian Trajectory Prediction using Scene Features

投稿日: 2025年1月24日作成者: jarxiv

要約歩行者の軌跡を正確に予測することは、自動運転車の安全性を高め、歩行者が巻き … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

First Lessons Learned of an Artificial Intelligence Robotic System for Autonomous Coarse Waste Recycling Using Multispectral Imaging-Based Methods

投稿日: 2025年1月24日作成者: jarxiv

要約粗粒の廃棄物の現在の廃棄施設は、重機を備えた材料の手動ソートを実行します。 … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.RO | コメントを受け付けていません

Multimodal Sensor Dataset for Monitoring Older Adults Post Lower-Limb Fractures in Community Settings

投稿日: 2025年1月24日作成者: jarxiv

要約下肢骨折（LLF）は高齢者にとって大きな健康上の懸念であり、多くの場合、可 … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Pix2Cap-COCO: Advancing Visual Comprehension via Pixel-Level Captioning

投稿日: 2025年1月24日作成者: jarxiv

要約私たちは、きめ細かい視覚的理解を促進するために設計された初のパノプティック … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

GUI-Bee: Align GUI Action Grounding to Novel Environments via Autonomous Exploration

投稿日: 2025年1月24日作成者: jarxiv

要約グラフィカルユーザーインターフェイス (GUI) アクションのグラウン … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

Improving Video Generation with Human Feedback

投稿日: 2025年1月24日作成者: jarxiv

要約ビデオ生成は、修正されたフロー技術によって大幅な進歩を遂げましたが、スムー … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG | コメントを受け付けていません

Truncated Consistency Models

投稿日: 2025年1月24日作成者: jarxiv

要約一貫性モデルが最近導入され、初期ノイズからの確率フローオード（PF ODE … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Temporal Preference Optimization for Long-Form Video Understanding

投稿日: 2025年1月24日作成者: jarxiv

要約ビデオの大規模なマルチモーダルモデル（ビデオLMMS）の大幅な進歩にもかか … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

IMAGINE-E: Image Generation Intelligence Evaluation of State-of-the-art Text-to-Image Models

投稿日: 2025年1月24日作成者: jarxiv

要約拡散モデルの急速な発展により、テキストからイメージ（T2I）モデルは大きな … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.LG | コメントを受け付けていません

Towards Robust Multimodal Open-set Test-time Adaptation via Adaptive Entropy-aware Optimization

投稿日: 2025年1月24日作成者: jarxiv

要約テスト時間適応（TTA）は、トレーニングとテストデータの間の分布シフトに対 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

「cs.LG」カテゴリーアーカイブ

Where Do You Go? Pedestrian Trajectory Prediction using Scene Features

First Lessons Learned of an Artificial Intelligence Robotic System for Autonomous Coarse Waste Recycling Using Multispectral Imaging-Based Methods

Multimodal Sensor Dataset for Monitoring Older Adults Post Lower-Limb Fractures in Community Settings

Pix2Cap-COCO: Advancing Visual Comprehension via Pixel-Level Captioning

GUI-Bee: Align GUI Action Grounding to Novel Environments via Autonomous Exploration

Improving Video Generation with Human Feedback

Truncated Consistency Models

Temporal Preference Optimization for Long-Form Video Understanding

IMAGINE-E: Image Generation Intelligence Evaluation of State-of-the-art Text-to-Image Models

Towards Robust Multimodal Open-set Test-time Adaptation via Adaptive Entropy-aware Optimization

最近の投稿

最近のコメント

アーカイブ

カテゴリー