-
最近の投稿
- Global-Local Interface with Selective Direct and Singularity-Avoiding Motion Mapping for Intuitive Teleoperation
- Data-Dependent Hidden Markov Model with Off-Road State Determination and Real-Time Viterbi Algorithm for Lane Determination in Autonomous Vehicles
- Prismatic-Bending Transformable (PBT) Joint for a Modular, Foldable Manipulator with Enhanced Reachability and Dexterity
- Simplification of Robotic System Model Analysis by Petri Net Meta-Model Property Transfer
- Steerable Scene Generation with Post Training and Inference-Time Search
-
最近のコメント
表示できるコメントはありません。 cs.AI (37825) cs.CL (28592) cs.CV (43449) cs.HC (2892) cs.LG (42754) cs.RO (22471) cs.SY (3449) eess.IV (5040) eess.SY (3441) stat.ML (5580)
「cs.MM」カテゴリーアーカイブ
WorDepth: Variational Language Prior for Monocular Depth Estimation
要約 単一の画像からの 3 次元 (3D) 再構成は、スケールなどの固有の曖昧さ … 続きを読む
Looking Backward: Streaming Video-to-Video Translation with Feature Banks
要約 このペーパーでは、ユーザー プロンプトを使用してリアルタイムのストリーミン … 続きを読む
OpFlowTalker: Realistic and Natural Talking Face Generation via Optical Flow Guidance
要約 リアルで自然な、唇で読み取れる話し顔ビデオを作成することは、依然として困難 … 続きを読む
A Dataset and Baselines for Measuring and Predicting the Music Piece Memorability
要約 今日、人類は自発的なストリーミング サービスやコマーシャルの休憩中の偶然の … 続きを読む
ProtT3: Protein-to-Text Generation for Text-based Protein Understanding
要約 言語モデル (LM) は、生物医学の質問応答タスクで明らかなように、タンパ … 続きを読む
Unsupervised Multimodal Clustering for Semantics Discovery in Multimodal Utterances
要約 マルチモーダルな発話の意味論を発見することは、人間の言語を理解し、人間と機 … 続きを読む
Alzheimer’s Magnetic Resonance Imaging Classification Using Deep and Meta-Learning Models
要約 最先端の機械学習アプローチであるディープラーニングは、特に医療分野において … 続きを読む
Images that Sound: Composing Images and Sounds on a Single Canvas
要約 スペクトログラムは、私たちの視覚世界にある画像とは大きく異なるサウンドの … 続きを読む
Picking watermarks from noise (PWFN): an improved robust watermarking model against intensive distortions
要約 電子透かしは、人間の目には検出できない方法で画像を変更することで秘密情報を … 続きを読む
Distilling Implicit Multimodal Knowledge into LLMs for Zero-Resource Dialogue Generation
要約 マルチモーダルな知識を大規模言語モデル (LLM) に統合することは、対話 … 続きを読む