月別アーカイブ: 2025年2月

High-Quality 3D Creation from A Single Image Using Subject-Specific Knowledge Prior

要約 この論文では、単一の画像から高品質の3Dモデルを生成するための新しい2段階 … 続きを読む

カテゴリー: cs.AI, cs.CV | High-Quality 3D Creation from A Single Image Using Subject-Specific Knowledge Prior はコメントを受け付けていません

IP-Composer: Semantic Composition of Visual Concepts

要約 コンテンツクリエーターは、多くの場合、複数の視覚ソースからインスピレーショ … 続きを読む

カテゴリー: cs.CV, cs.GR | IP-Composer: Semantic Composition of Visual Concepts はコメントを受け付けていません

IM360: Textured Mesh Reconstruction for Large-scale Indoor Mapping with 360$^\circ$ Cameras

要約 屋内環境の3Dマッピングとレンダリング用の360 $^\ circ $カメ … 続きを読む

カテゴリー: cs.CV | IM360: Textured Mesh Reconstruction for Large-scale Indoor Mapping with 360$^\circ$ Cameras はコメントを受け付けていません

A Training-Free Framework for Precise Mobile Manipulation of Small Everyday Objects

要約 毎日のモバイル操作タスクの多くは、ノブをつかんでキャビネットを開いたり、ラ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | A Training-Free Framework for Precise Mobile Manipulation of Small Everyday Objects はコメントを受け付けていません

FlexTok: Resampling Images into 1D Token Sequences of Flexible Length

要約 画像トークン化により、生のピクセルよりも処理するのが効率的な圧縮された離散 … 続きを読む

カテゴリー: cs.CV, cs.LG | FlexTok: Resampling Images into 1D Token Sequences of Flexible Length はコメントを受け付けていません

Betsu-Betsu: Multi-View Separable 3D Reconstruction of Two Interacting Objects

要約 マルチビューRGB画像からの複数のオブジェクトの分離可能な3D再構築 &# … 続きを読む

カテゴリー: cs.CV | Betsu-Betsu: Multi-View Separable 3D Reconstruction of Two Interacting Objects はコメントを受け付けていません

A Frontier AI Risk Management Framework: Bridging the Gap Between Current AI Practices and Established Risk Management

要約 強力なAIシステムの最近の開発は、AI業界における堅牢なリスク管理フレーム … 続きを読む

カテゴリー: cs.AI | A Frontier AI Risk Management Framework: Bridging the Gap Between Current AI Practices and Established Risk Management はコメントを受け付けていません

Selective Reviews of Bandit Problems in AI via a Statistical View

要約 Rehnection Learning(RL)は、環境との相互作用を通じて … 続きを読む

カテゴリー: cs.AI, cs.LG, econ.EM, math.PR, stat.ML | Selective Reviews of Bandit Problems in AI via a Statistical View はコメントを受け付けていません

Can a Single Model Master Both Multi-turn Conversations and Tool Use? CoALM: A Unified Conversational Agentic Language Model

要約 APIコール機能を備えた大規模な言語モデル(LLMS)により、効果的な言語 … 続きを読む

カテゴリー: cs.AI, cs.CL | Can a Single Model Master Both Multi-turn Conversations and Tool Use? CoALM: A Unified Conversational Agentic Language Model はコメントを受け付けていません

STAR: Scale-wise Text-conditioned AutoRegressive image generation

要約 スケールごとの自動回帰パラダイムを使用するテキストから画像モデルであるSt … 続きを読む

カテゴリー: cs.CV | STAR: Scale-wise Text-conditioned AutoRegressive image generation はコメントを受け付けていません