cs.AI」カテゴリーアーカイブ

Detect an Object At Once without Fine-tuning

要約 これまで見たことのないオブジェクトの 1 枚または数枚の写真が提示されると … 続きを読む

カテゴリー: cs.AI, cs.CV | Detect an Object At Once without Fine-tuning はコメントを受け付けていません

Double Descent Meets Out-of-Distribution Detection: Theoretical Insights and Empirical Analysis on the role of model complexity

要約 過剰パラメータ化は一般化に利益をもたらすことが知られていますが、配信外 ( … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, math.ST, stat.ML, stat.TH | Double Descent Meets Out-of-Distribution Detection: Theoretical Insights and Empirical Analysis on the role of model complexity はコメントを受け付けていません

Fast yet Safe: Early-Exiting with Risk Control

要約 機械学習モデルのスケーリングは、その性能を大幅に向上させる。しかし、このよ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, stat.ML | Fast yet Safe: Early-Exiting with Risk Control はコメントを受け付けていません

Hunyuan3D-1.0: A Unified Framework for Text-to-3D and Image-to-3D Generation

要約 3D生成モデルはアーティストのワークフローを大きく改善したが、3D生成のた … 続きを読む

カテゴリー: cs.AI, cs.CV | Hunyuan3D-1.0: A Unified Framework for Text-to-3D and Image-to-3D Generation はコメントを受け付けていません

Taxonomy-Aware Continual Semantic Segmentation in Hyperbolic Spaces for Open-World Perception

要約 意味セグメンテーションモデルは通常、固定されたクラスセットで学習されるため … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Taxonomy-Aware Continual Semantic Segmentation in Hyperbolic Spaces for Open-World Perception はコメントを受け付けていません

GenXD: Generating Any 3D and 4D Scenes

要約 近年の2D映像生成の発展は目覚ましい。しかし、3Dや4Dの生成は、大規模な … 続きを読む

カテゴリー: cs.AI, cs.CV | GenXD: Generating Any 3D and 4D Scenes はコメントを受け付けていません

EMMA: End-to-End Multimodal Model for Autonomous Driving

要約 自律走行のためのエンドツーエンドのマルチモーダルモデルであるEMMAを紹介 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | EMMA: End-to-End Multimodal Model for Autonomous Driving はコメントを受け付けていません

How Far is Video Generation from World Model: A Physical Law Perspective

要約 OpenAIのSoraは、基本的な物理法則に準拠した世界モデルを開発するた … 続きを読む

カテゴリー: cs.AI, cs.CV | How Far is Video Generation from World Model: A Physical Law Perspective はコメントを受け付けていません

Adaptive Length Image Tokenization via Recurrent Allocation

要約 現在の視覚システムは通常、情報量に関係なく、画像に固定長の表現を割り当てて … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Adaptive Length Image Tokenization via Recurrent Allocation はコメントを受け付けていません

SlowFast-VGen: Slow-Fast Learning for Action-Driven Long Video Generation

要約 人間には相補的な学習システムが備わっており、一般的な世界ダイナミクスのゆっ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | SlowFast-VGen: Slow-Fast Learning for Action-Driven Long Video Generation はコメントを受け付けていません