月別アーカイブ: 2024年9月

LLaVA-3D: A Simple yet Effective Pathway to Empowering LMMs with 3D-awareness

要約 大規模マルチモーダル モデル (LMM) の最近の進歩により、2D 視覚理 … 続きを読む

カテゴリー: cs.CV | LLaVA-3D: A Simple yet Effective Pathway to Empowering LMMs with 3D-awareness はコメントを受け付けていません

EgoLM: Multi-Modal Language Model of Egocentric Motions

要約 ウェアラブルデバイスの普及に伴い、コンテキストAIの開発には自己中心的な動 … 続きを読む

カテゴリー: cs.CV | EgoLM: Multi-Modal Language Model of Egocentric Motions はコメントを受け付けていません

FlowTurbo: Towards Real-time Flow-Based Image Generation with Velocity Refiner

要約 ビジュアル生成における拡散モデルの成功を基礎として、フローベースのモデルは … 続きを読む

カテゴリー: cs.CV | FlowTurbo: Towards Real-time Flow-Based Image Generation with Velocity Refiner はコメントを受け付けていません

Force-Guided Bridge Matching for Full-Atom Time-Coarsened Dynamics of Peptides

要約 分子動力学 (MD) は、いくつか例を挙げると、材料科学、化学、薬学などの … 続きを読む

カテゴリー: cs.LG, physics.chem-ph, physics.comp-ph, q-bio.BM | Force-Guided Bridge Matching for Full-Atom Time-Coarsened Dynamics of Peptides はコメントを受け付けていません

Characterizing stable regions in the residual stream of LLMs

要約 トランスフォーマーの残留ストリーム内の「安定領域」を特定します。この領域で … 続きを読む

カテゴリー: cs.LG | Characterizing stable regions in the residual stream of LLMs はコメントを受け付けていません

Investigating OCR-Sensitive Neurons to Improve Entity Recognition in Historical Documents

要約 この論文では、Transformer アーキテクチャ内の OCR 感受性ニ … 続きを読む

カテゴリー: cs.AI, cs.CL | Investigating OCR-Sensitive Neurons to Improve Entity Recognition in Historical Documents はコメントを受け付けていません

LingoQA: Visual Question Answering for Autonomous Driving

要約 自動運転における視覚的な質問応答のための新しいデータセットおよびベンチマー … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | LingoQA: Visual Question Answering for Autonomous Driving はコメントを受け付けていません

Mitigating Covariate Shift in Imitation Learning for Autonomous Vehicles Using Latent Space Generative World Models

要約 自動運転における共変量シフト問題に対処するために、潜在空間生成世界モデルの … 続きを読む

カテゴリー: (Primary), 68T45, cs.CV, cs.LG, cs.RO, cs.SY, eess.SY, I.2.10 | Mitigating Covariate Shift in Imitation Learning for Autonomous Vehicles Using Latent Space Generative World Models はコメントを受け付けていません

INT-FlashAttention: Enabling Flash Attention for INT8 Quantization

要約 大規模言語モデル (LLM) の基礎として、セルフ アテンション モジュー … 続きを読む

カテゴリー: cs.AI, cs.LG | INT-FlashAttention: Enabling Flash Attention for INT8 Quantization はコメントを受け付けていません

ManiFoundation Model for General-Purpose Robotic Manipulation of Contact Synthesis with Arbitrary Objects and Robots

要約 ロボットの知能を大幅に強化するには、LLM が示す多用途のタスク計画能力と … 続きを読む

カテゴリー: cs.AI, cs.RO | ManiFoundation Model for General-Purpose Robotic Manipulation of Contact Synthesis with Arbitrary Objects and Robots はコメントを受け付けていません