-
>
蜜蜂的寓言:私人的惡德,公眾的利益
-
>
世界貿易戰簡史
-
>
日本的凱恩斯:高橋是清傳:從足輕到藏相
-
>
近代天津工業與企業制度
-
>
貨幣之語
-
>
眉山金融論劍
-
>
圖解資本論
拆穿數據胡扯 版權信息
- ISBN:9787521738797
- 條形碼:9787521738797 ; 978-7-5217-3879-7
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
拆穿數據胡扯 本書特色
薛兆豐×涂子沛×王程韡×胡翌霖×徐瑾×吳靖×葉壯×汪冰×姚利芬×王大鵬,經濟學、科學史、心理學、傳播學多界聯袂推薦,多位諾獎得主贊賞,亞馬遜網站編輯優選非虛構類圖書;一門未開課即爆滿的華盛頓大學公開課,一本復雜世界的生存指南,戳穿數據謊言的利器,教你撕下數據噪聲的科學外衣,在算法時代做個游刃有余的明白人
拆穿數據胡扯 內容簡介
“用數據說話”是互聯網時代的通用思維方式,有人說數據不會騙人,真的是這樣嗎? X 讓人看不懂的數據分析和神奇算法 X 莫名奇妙的數學方程 X 強行聯系因果的統計學論文 X 某些新聞報道或PPT中花里胡哨的圖表 …… 我們都曾經或正在被這些東西蒙蔽,卻往往毫無察覺,甚至樂在其中! 一些貌似可靠的數據來源,也可能藏著一本正經的胡說八道。比如TED演講中的統計數字、《紐約時報》等媒體報道的大數據分析新算法、甚至是醫學期刊中的診斷數據……虛假信息都有可能魚目混珠,而你能分辨其中哪些是真正有用的信息,哪些只是胡扯嗎? 對此,華盛頓大學專門開發了一門尚未開課即爆滿的公開課,而這本書正是源自這門引發熱議的課程。 兩位作者花了多年時間研究打著數學和統計學幌子的胡扯,犀利幽默地對它們分門別類一一剖析,幫助我們培養批判性思維,有效分析海量數據和觀點,拆穿無用數據的精致偽裝,在信息時代做個游刃有余的明白人。 話說回來,除了教會你如何識別數據胡扯,當你迫不得已需要胡扯時,它也會成為一本實操性強的工具書呢!
拆穿數據胡扯 目錄
推薦序1 科學地對抗科學的胡扯的“胡扯” / V
推薦序2 撥開扯淡的迷霧 / IX
推薦序3 閑得沒事也別胡扯 / XIII
前 言 / XVII
第1 章 胡扯無處不在
慣于欺騙的甲殼類動物和狡猾的烏鴉 / 003
狡辯之詞和律師的語言 / 008
謊言傳千里,真相難出門 / 012
第2 章 媒體、信息和錯誤信息
印刷廠就是妓院 / 022
不加渲染的事實宛若鳳毛麟角 / 025
偏見性、個人化和對立 / 029
錯誤信息和虛假信息 / 033
新型造假者 / 037
第3 章 胡扯的本質
胡扯與黑箱 / 048
刑事機器學習 / 051
第4 章 因果關系
夜晚天空紅艷艷,水手臉上笑容現 / 060
關于因果關系的思考 / 064
相關性不會增加報紙銷量 / 068
延遲享樂與共同原因 / 076
偽相關性 / 078
吸煙不會導致死亡? / 083
如果其他方法都行不通,那就人為操控吧 / 084
第5 章 數字與胡扯
提取數字 / 095
有害的百分比 / 098
古德哈特定律 / 106
數學濫用 / 110
僵尸統計數據 / 115
第6 章 選擇偏倚
你看到什么取決于你看的是哪兒 / 126
隱藏在墨菲定律背后的原因 / 129
帥哥和頂級程序員 / 137
音樂才華的致命危險 / 143
消除選擇偏倚 / 148
第7 章 數據可視化
數據可視化的發端 / 158
鴨子! / 162
水晶鞋和丑陋的繼姐 / 166
邪惡的軸 / 177
比例油墨原理 / 192
第8 章 大數據與胡扯
機器是怎么看到東西的 / 213
廢料進,廢品出 / 219
同性戀雷達和胡扯的結論 / 221
機器是怎么思考的 / 226
機器為什么失敗 / 230
第9 章 科學的易感性
檢察官謬誤 / 242
p 值操縱和發表偏倚 / 251
點擊誘餌科學 / 260
胡扯科學的市場 / 265
科學為什么有用 / 271
第10 章 辨別胡扯
1. 質疑信息來源 / 278
2. 小心不公平的比較 / 281
3.如果好得或糟糕得不像是真的…… / 284
4. 從數量級考慮 / 287
5. 避免證真偏差 / 292
6. 考慮多個假設 / 295
辨別網上的胡扯 / 296
第11 章 駁斥胡扯
使用歸謬法 / 306
要讓人難以忘記 / 308
尋找反例 / 311
使用類比 / 312
重新繪制圖表 / 314
使用零模型 / 316
揭穿者心理 / 319
致 謝 / 329
注 釋 / 333
參考文獻 / 349
拆穿數據胡扯 節選
前言(節選) 當今社會胡扯現象隨處可見,令人不勝其煩。政治家無視事實信口開河,科研人員把發新聞稿視為科學研究,硅谷的初創公司將胡扯發展到了藝術的高度,大學獎勵的是胡扯而不是分析思維,大多數管理活動似乎只不過是一個對胡扯進行編排組合的復雜過程。心懷不軌的廣告商朝我們眨眨眼,誘導我們和他們一起把胡扯進行到底,而我們也眨眨眼表示回應——但與此同時,我們就會放松警惕,對他們奉送的修飾過的胡扯信以為真。胡扯在具體問題上誤導我們,破壞我們對一般信息的信任,因此會污染我們這個社會。盡管能力有限,但我們希望可以通過本書,對這一現象給予回擊。 ………… 要徹底消滅胡扯,就需要準確地了解它是什么。這就有點兒棘手了。 首先,“胡扯”(bullshit)既是名詞也是動詞。我不僅聽膩了你的胡扯(名詞),也可以反過來跟你胡扯(動詞)。這很好懂。簡單地說,胡扯作為動詞就是指說一些胡扯的話。 但是,“胡扯”這個名詞到底指的是什么呢?和許多人試圖用哲學概念匹配日常語言的努力一樣,試圖為它制定一個涇渭分明的定義的努力也必然徒勞無功。因此,我們將從例子著手,描述一些可以稱之為胡扯的東西。 大多數人都認為自己擅長發現胡扯。當胡扯以修辭或花哨的語言形式出現(我們稱之為老派胡扯)時,他們這樣想也許沒有錯。 老派胡扯似乎并沒有消失,但隨著新派胡扯的興起,它似乎沒有那么引人注目了。新派胡扯使用數學、科學和統計語言來制造嚴謹準確的印象。它們利用數字、統計數據和數據圖表粉飾那些可疑的論斷,給它們披上了一層合理的外衣。新派胡扯可能會采用下面這些形式: ??根據貨幣匯率加以調整后,我們表現出色的全球基金在過去9年中有7 年跑贏了市場。 (回報率到底是如何調整的?該公司有多少基金未能跑贏市場,相差多少?就這個問題而言,是某一只基金在9年中有7年跑贏了市場,還是在這7年中每年都有一只不同的基金跑贏了市場?) ??雖然沒有統計意義(p = 0.13),但我們取得的結果突出表明了我們靶向治療腫瘤的臨床意義(5年生存率比為 1.3),并對當前的治療范式提出了挑戰。 (如果一個結果沒有統計意義,那么討論它的臨床意義又有什么意義呢? 5年生存率是這種特定癌癥的相關指標,還是說大多數患者在3年內死亡?為什么我們要認為這“對當前的治療范式提出了挑戰”?) ??該團隊的卷積神經網絡算法可以從一個由人類代謝組、轉錄組和蛋白質組構成的多層網絡中提取底層控制邏輯。 (什么是多層網絡?這些不同的“組”之間的連接有什么重要意義?如何測量?作者所說的“控制邏輯”是什么意思?我們如何知道這些系統真的是通過一個底層控制邏輯連接到一起的?我們如何確證這種方法可以提取這個底層控制邏輯呢?) ??我們的系統篩查顯示,34%的有行為障礙的二年級學生承認在過去一年里至少聞過一次神奇馬克筆。 (這個數據很重要嗎?如果真的很重要,那么聞馬克筆這個行為是“行為障礙”的原因還是結果?有多少沒有行為障礙的二年級學生承認聞過馬克筆?也許這個比例更高!) 新派胡扯之所以特別有效,是因為我們中的許多人覺得沒有資格質疑以數量形式呈現的信息。這讓那些新派胡扯者們正中下懷。要反擊,就必須學會在合適的時機,以合適的方式質疑這些言論。 ………… 在教學中,我們一直在教導學生如何對數據進行邏輯和定量思考。本書源于我們在華盛頓大學教授的一門叫作“Calling Bullshit”(與本書同名)的課程,目的是說明一個事實:即使你不是一名專業的統計學家、計量經濟學家或數據科學家,你也能批判性地思考那些定量論證;無須大量數據和數周時間,也能看穿胡扯。只要有基本的邏輯推理,在需要的時候,再輔以通過搜索引擎輕松獲取的信息,通常就足以解決問題了。 新的信息技術已經改變了我們的科學和社會交流方式。隨著信息獲取途徑得到改善,信息超載的現象愈演愈烈。我們希望本書能幫助你面對。
拆穿數據胡扯 作者簡介
美國華盛頓大學生物學系教授。他研究流行病如何在人群中傳播,以及信息如何大規模地在生物和社會系統中流動——從細胞內對基因表達的控制到社交媒體上錯誤信息的傳播。他廣為人知的是跨界整合自然科學和社會科學思想的能力,特別是在信息研究領域造詣很深。他發表了多篇前瞻性的文章,涉及信息科學、計算機科學、控制論、進化生物學、信息論、科學哲學、物理學等方面,其中有很多發表在《自然》《科學》《美國國家科學院院刊》上。 美國華盛頓大學信息學院副教授、公眾知情中心主任。
- >
羅庸西南聯大授課錄
- >
唐代進士錄
- >
伯納黛特,你要去哪(2021新版)
- >
煙與鏡
- >
自卑與超越
- >
巴金-再思錄
- >
企鵝口袋書系列·偉大的思想20:論自然選擇(英漢雙語)
- >
詩經-先民的歌唱