cs.AI」カテゴリーアーカイブ

Improving Autoregressive Training with Dynamic Oracles

要約 NLP 内の多くのタスクは、シーケンスのタグ付けからテキスト生成に至るまで … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Improving Autoregressive Training with Dynamic Oracles はコメントを受け付けていません

Vertical LoRA: Dense Expectation-Maximization Interpretation of Transformers

要約 この論文では、トランスフォーマーをベイジアン ネット上で実行される高密度期 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Vertical LoRA: Dense Expectation-Maximization Interpretation of Transformers はコメントを受け付けていません

RadarOcc: Robust 3D Occupancy Prediction with 4D Imaging Radar

要約 3D 占有ベースの認識パイプラインは、詳細なシーンの説明をキャプチャし、さ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | RadarOcc: Robust 3D Occupancy Prediction with 4D Imaging Radar はコメントを受け付けていません

PianoMotion10M: Dataset and Benchmark for Hand Motion Generation in Piano Performance

要約 近年、教育における人工知能技術への注目が高まっていますが、効果的な楽器指導 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM, cs.SD, eess.AS | PianoMotion10M: Dataset and Benchmark for Hand Motion Generation in Piano Performance はコメントを受け付けていません

Exploring the Spectrum of Visio-Linguistic Compositionality and Recognition

要約 CLIP などの視覚および言語モデル (VLM) は、驚くべきゼロショット … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Exploring the Spectrum of Visio-Linguistic Compositionality and Recognition はコメントを受け付けていません

Aligning Vision Models with Human Aesthetics in Retrieval: Benchmarks and Algorithms

要約 最新の視覚モデルは、非常に大規模なノイズの多いデータセットでトレーニングさ … 続きを読む

カテゴリー: cs.AI, cs.CV | Aligning Vision Models with Human Aesthetics in Retrieval: Benchmarks and Algorithms はコメントを受け付けていません

Instruct 4D-to-4D: Editing 4D Scenes as Pseudo-3D Scenes Using 2D Diffusion

要約 この論文では、2D 拡散モデルの 4D 認識と時空間的一貫性を実現し、高品 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Instruct 4D-to-4D: Editing 4D Scenes as Pseudo-3D Scenes Using 2D Diffusion はコメントを受け付けていません

MMScan: A Multi-Modal 3D Scene Dataset with Hierarchical Grounded Language Annotations

要約 LLM の出現と他のデータ モダリティとの統合により、物理世界との接続性に … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | MMScan: A Multi-Modal 3D Scene Dataset with Hierarchical Grounded Language Annotations はコメントを受け付けていません

ConsistDreamer: 3D-Consistent 2D Diffusion for High-Fidelity Scene Editing

要約 この論文では、3D 認識と 3D 一貫性を備えた 2D 拡散モデルを強化す … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | ConsistDreamer: 3D-Consistent 2D Diffusion for High-Fidelity Scene Editing はコメントを受け付けていません

4M-21: An Any-to-Any Vision Model for Tens of Tasks and Modalities

要約 4M や UnifiedIO などの現在のマルチモーダルおよびマルチタスク … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | 4M-21: An Any-to-Any Vision Model for Tens of Tasks and Modalities はコメントを受け付けていません