「cs.AI」カテゴリーアーカイブ

Detect an Object At Once without Fine-tuning

投稿日: 2024年11月5日作成者: jarxiv

要約これまで見たことのないオブジェクトの 1 枚または数枚の写真が提示されると … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Double Descent Meets Out-of-Distribution Detection: Theoretical Insights and Empirical Analysis on the role of model complexity

投稿日: 2024年11月5日作成者: jarxiv

要約過剰パラメータ化は一般化に利益をもたらすことが知られていますが、配信外 ( … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, math.ST, stat.ML, stat.TH | コメントを受け付けていません

Fast yet Safe: Early-Exiting with Risk Control

投稿日: 2024年11月5日作成者: jarxiv

要約機械学習モデルのスケーリングは、その性能を大幅に向上させる。しかし、このよ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, stat.ML | コメントを受け付けていません

Hunyuan3D-1.0: A Unified Framework for Text-to-3D and Image-to-3D Generation

投稿日: 2024年11月5日作成者: jarxiv

要約 3D生成モデルはアーティストのワークフローを大きく改善したが、3D生成のた … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Taxonomy-Aware Continual Semantic Segmentation in Hyperbolic Spaces for Open-World Perception

投稿日: 2024年11月5日作成者: jarxiv

要約意味セグメンテーションモデルは通常、固定されたクラスセットで学習されるため … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

GenXD: Generating Any 3D and 4D Scenes

投稿日: 2024年11月5日作成者: jarxiv

要約近年の2D映像生成の発展は目覚ましい。しかし、3Dや4Dの生成は、大規模な … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

EMMA: End-to-End Multimodal Model for Autonomous Driving

投稿日: 2024年11月5日作成者: jarxiv

要約自律走行のためのエンドツーエンドのマルチモーダルモデルであるEMMAを紹介 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

How Far is Video Generation from World Model: A Physical Law Perspective

投稿日: 2024年11月5日作成者: jarxiv

要約 OpenAIのSoraは、基本的な物理法則に準拠した世界モデルを開発するた … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Adaptive Length Image Tokenization via Recurrent Allocation

投稿日: 2024年11月5日作成者: jarxiv

要約現在の視覚システムは通常、情報量に関係なく、画像に固定長の表現を割り当てて … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

SlowFast-VGen: Slow-Fast Learning for Action-Driven Long Video Generation

投稿日: 2024年11月4日作成者: jarxiv

要約人間には相補的な学習システムが備わっており、一般的な世界ダイナミクスのゆっ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

「cs.AI」カテゴリーアーカイブ

Detect an Object At Once without Fine-tuning

Double Descent Meets Out-of-Distribution Detection: Theoretical Insights and Empirical Analysis on the role of model complexity

Fast yet Safe: Early-Exiting with Risk Control

Hunyuan3D-1.0: A Unified Framework for Text-to-3D and Image-to-3D Generation

Taxonomy-Aware Continual Semantic Segmentation in Hyperbolic Spaces for Open-World Perception

GenXD: Generating Any 3D and 4D Scenes

EMMA: End-to-End Multimodal Model for Autonomous Driving

How Far is Video Generation from World Model: A Physical Law Perspective

Adaptive Length Image Tokenization via Recurrent Allocation

SlowFast-VGen: Slow-Fast Learning for Action-Driven Long Video Generation

最近の投稿

最近のコメント

アーカイブ

カテゴリー