月別アーカイブ: 2023年6月

Measured Albedo in the Wild: Filling the Gap in Intrinsics Evaluation

要約 固有の画像分解と逆レンダリングは、コンピューター ビジョンにおける長年の問 … 続きを読む

カテゴリー: cs.CV | Measured Albedo in the Wild: Filling the Gap in Intrinsics Evaluation はコメントを受け付けていません

PoseDiffusion: Solving Pose Estimation via Diffusion-aided Bundle Adjustment

要約 カメラの姿勢推定はコンピューター ビジョンに関する長年の問題であり、これま … 続きを読む

カテゴリー: cs.CV | PoseDiffusion: Solving Pose Estimation via Diffusion-aided Bundle Adjustment はコメントを受け付けていません

Physion++: Evaluating Physical Scene Understanding that Requires Online Inference of Different Physical Properties

要約 一般的な物理シーンの理解には、単に物体の位置を特定して認識するだけでは不十 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.RO | Physion++: Evaluating Physical Scene Understanding that Requires Online Inference of Different Physical Properties はコメントを受け付けていません

Detector-Free Structure from Motion

要約 我々は、順序付けされていない画像から正確なカメラのポーズと点群を復元するた … 続きを読む

カテゴリー: cs.CV | Detector-Free Structure from Motion はコメントを受け付けていません

Symphonize 3D Semantic Scene Completion with Contextual Instance Queries

要約 3D セマンティック シーン補完 (SSC) は、部分的な LiDAR ま … 続きを読む

カテゴリー: cs.CV, cs.RO | Symphonize 3D Semantic Scene Completion with Contextual Instance Queries はコメントを受け付けていません

Towards Language-Based Modulation of Assistive Robots through Multimodal Models

要約 ジェリアトロニクスの分野では、人間とロボットの間の効果的かつ透過的なコミュ … 続きを読む

カテゴリー: cs.RO | Towards Language-Based Modulation of Assistive Robots through Multimodal Models はコメントを受け付けていません

Language Models are Bounded Pragmatic Speakers

要約 言語モデルはどのように「考える」のでしょうか? この論文は、言語モデルのさ … 続きを読む

カテゴリー: cs.CL, cs.LG | Language Models are Bounded Pragmatic Speakers はコメントを受け付けていません

Data-Driven Approach for Formality-Sensitive Machine Translation: Language-Specific Handling and Synthetic Data Generation

要約 このペーパーでは、4 つのターゲット言語の固有の言語特性に対応する、形式依 … 続きを読む

カテゴリー: cs.AI, cs.CL | Data-Driven Approach for Formality-Sensitive Machine Translation: Language-Specific Handling and Synthetic Data Generation はコメントを受け付けていません

Kosmos-2: Grounding Multimodal Large Language Models to the World

要約 私たちは、マルチモーダル大規模言語モデル (MLLM) である Kosmo … 続きを読む

カテゴリー: cs.CL, cs.CV | Kosmos-2: Grounding Multimodal Large Language Models to the World はコメントを受け付けていません

PMaF: Deep Declarative Layers for Principal Matrix Features

要約 主行列特徴量 (PMaF) を学習するために、2 つの微分可能な深い宣言層 … 続きを読む

カテゴリー: cs.LG | PMaF: Deep Declarative Layers for Principal Matrix Features はコメントを受け付けていません