-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應(yīng)用
-
>
決戰(zhàn)行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調(diào)優(yōu)實踐之路
-
>
第一行代碼Android
-
>
JAVA持續(xù)交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
視覺問答理論與實踐 版權(quán)信息
- ISBN:9787121475313
- 條形碼:9787121475313 ; 978-7-121-47531-3
- 裝幀:一般膠版紙
- 冊數(shù):暫無
- 重量:暫無
- 所屬分類:>
視覺問答理論與實踐 內(nèi)容簡介
視覺問答任務(wù)要求機器根據(jù)指定的視覺圖像內(nèi)容, 對單輪或多輪的自然語言問題進行作答。其本質(zhì)上是一個多學科的研究問題,涉及計算機視覺、自然語言處理、知識表示與推理等。本書共5 部分,第1 部分介紹在計算機視覺和自然語言處理領(lǐng)域廣泛使用的基本方法和技術(shù),包括卷積神經(jīng)網(wǎng)絡(luò)、序列建模和注意力機制等。本書將視覺問答分為圖像和視頻方法。第2 部分將圖像視覺問答進一步分為五類,即聯(lián)合嵌入、注意力機制、記憶網(wǎng)絡(luò)、組合推理和圖神經(jīng)網(wǎng)絡(luò)。此外,概述基于圖像的其他視覺問答任務(wù),例如基于知識的視覺問答、視覺問答的視覺和語言預(yù)訓(xùn)練。第3 部分討論基于視頻的視覺問答及其相關(guān)模型。第4 部分討論與視覺問答相關(guān)的高級任務(wù),包括具身視覺問答、醫(yī)學視覺問答、基于文本的視覺問答、視覺問題生成、視覺對話和指代表達理解,它們是視覺問答任務(wù)的擴展。第5 部分對該領(lǐng)域進行總結(jié)和展望,討論視覺問答領(lǐng)域的未來研究方向。
視覺問答理論與實踐 目錄
視覺問答理論與實踐 作者簡介
吳琦,澳大利亞阿德萊德大學高級講師(副教授),博士生導(dǎo)師,澳大利亞青年學者基金獲得者 (Australian Research Council DECRA Fellow),澳大利亞機器人視覺研究中心(ACRV)vision-language課題組組長,澳大利亞科學院羅素獎獲得者。吳琦博士于2015年在英國巴斯大學獲得博士學位,致力于計算機視覺領(lǐng)域研究,尤其關(guān)注于計算機視覺-自然語言相關(guān)領(lǐng)域的研究。吳琦博士在CVPR,ICCV,ECCV, NeurIPS, TPAMI等多個國際會議和期刊發(fā)表論文七十余篇,吳琦博士亦擔任TPAMI,IJCV,TIP,CVPR,NIPS,ACL等學術(shù)期刊會議審稿人以及ICCV2021 領(lǐng)域主席。
- >
經(jīng)典常談
- >
伊索寓言-世界文學名著典藏-全譯本
- >
朝聞道
- >
小考拉的故事-套裝共3冊
- >
李白與唐代文化
- >
苦雨齋序跋文-周作人自編集
- >
人文閱讀與收藏·良友文學叢書:一天的工作
- >
企鵝口袋書系列·偉大的思想20:論自然選擇(英漢雙語)