💥 20 個 #常見的統計錯誤,你犯過,或是犯了卻不知道嗎?⠀
⠀
MedCalc 的作者 Frank,在 Facebook 分享了一篇跟統計相關的文章,叫做「生物醫學研究文章中,連你都可以發現的 20 個統計錯誤」,很有意思。(連結請見原始貼文)
⠀
我(蔡依橙)認真看完後,覺得蠻不錯的,於是把這 20 個統計錯誤的標題翻成中文,協助大家節省時間,如果剛好有興趣的,可再針對該部分去閱讀原文。接著,分享一些我看完之後的想法。
⠀
⠀
1. 數值報告時,提供了不必要的精確。例如 60 公斤體重,硬要寫成 60.18 公斤。
⠀
2. 將連續變項分組,變成次序變項,但沒有說明為什麼這樣分。像是 CRP 不以數值去統計,而分成低、中、高三組,卻沒說明為什麼這樣分。
⠀
3. 配對資料,只報告各組平均,卻沒報告其改變。也就是只報告治療前血壓、治療後血壓,卻沒報告有多少人上升、多少人下降、平均下降多少。
⠀
4. 描述性統計的誤用,尤其該用 median (interquartile range) 的,硬是用成 mean +- SD。
⠀
5. 使用 standard error of the mean (SEM) 描述量測的精確度,而非 95% CI。
⠀
6. 只報告 p 值,卻沒提到差值以及臨床意義。
⠀
7. 誤用統計方式。尤其常見的是混淆有母數跟無母數統計方法。
⠀
8. 使用線性迴歸,卻沒有先確定資料之間是真的有線性關係。
⠀
9. 沒有使用全部的資料,然後又沒把去掉的資料「為什麼被去掉」說清楚。
⠀
10. 多組比較的 p 值校正問題。
⠀
11. 在隨機分組研究時,過於詳盡地比較了兩組受試者的基本資料,像是性別比例、年齡、體重、血壓等等,而且資料好得太奇怪。
⠀
12. 報告檢驗數值時,沒有定義 normal 與 abnormal。
⠀
13. 計算 sensitivity 與 specificity 時,沒有說明一些介在灰色地帶的檢查結果,如何呈現與去除。
⠀
14. 使用圖片與表格,只是為了儲存數據,而非以協助讀者理解為出發點。
⠀
15. 畫出來的數據圖,視覺主觀上給人的印象,竟然跟數據本身不同。
⠀
16. 在報告數據與解讀時,搞不清楚 units of observation 是什麼,例如心臟病的觀察研究,在 1000 個患者中有 18 位心臟病發,那 units of observation 就是 18。但如果這個研究是以診斷正確率為主,那 sample size 就是 1000。
⠀
17. 把不顯著的統計,或 low power,解讀成 negative,而非 inconclusive。
⠀
18. 分不清楚解釋性研究與實務性研究,前者為 explanatory / efficacy / laboratory,後者為 pragmatic / effectiveness / real world。嘗試兩種混著做,結果兩邊都做不好。
⠀
19. 沒有用臨床能理解的方式來報告最終結果。
⠀
20. 把統計的顯著性,當成臨床的重要性。例如:癌症用新藥治療,統計上很顯著的好,但追蹤了五年,患者只延長了七天的壽命。這就是統計有顯著,但臨床意義不大的例子。
⠀
⠀
🗨 我(蔡依橙)的一些想法
⠀
由統計專業人的角度,來看生物醫學發表,是很有警惕意義的,能讓準備發表的朋友,仔細看看自己是不是也犯了相關的錯誤。
⠀
但另一個角度看,作者也提到,這些錯誤在幾乎一半的生物醫學論文上反覆出現!這就代表,其實生物醫學論文要刊登,並不代表我們什麼錯都不能犯,相反地,這 20 個錯誤裡頭,有些就算犯了,也還是能被刊登。
⠀
以我們自己發表,以及過去協助同學的經驗來說,我會認為 2、7、10、14、15,是初學者也 #必須理解並避開的,其他的則是發表起步了之後,陸陸續續去注意,在往更高分期刊挑戰時,逐漸進步就行。
⠀
實務上,3 分以下的醫學期刊,幾乎沒有專門的統計查核,你只要能通過「一般同行」的統計知識審查就行。也就是說,我是一個放射科醫師,剛開始起步,投稿到放射科 3 分以下期刊,文章中的統計,只要「#一般有在做研究的放射科醫師」覺得可以就行,不見得要到「統計專家看過並挑不出毛病」。
⠀
對於初學者如何起步,實務的協助,新思惟規劃了各種類型的研究課程,歡迎有興趣的朋友可以參考。目前正在開放報名中的,有以下三場工作坊,歡迎您瞭解各課程的課綱後,評估挑選最符合您需求的內容,前來上課,讓我們協助您成功起步。
⠀
🟠 2021 / 11 / 7(日)統合分析工作坊
無經費、資源少也能發表,不用 IRB 且免收案的好選擇。
https://meta-analysis.innovarad.tw/event/
⠀
🔵 2021 / 10 / 17(日)臨床研究與發表工作坊
全新改款!跟著國際學者走,讓你寫作投稿都上手。
https://clip2014.innovarad.tw/event/
⠀
🟢 2021 / 10 / 16(六)個案報告、技術發表與文獻回顧工作坊
把臨床上的各種想法,在 PubMed 化作專業生涯上的里程碑。
https://casereport.innovarad.tw/event/
⠀ ⠀
不只是說說而已,我們會舉實例,說明其意義、如何避開,在互動實作過程,實際由各位在自己的電腦上操作,從數據到軟體,從統計到繪圖,一次搞定,並避開常見錯誤,是真正以 #初學者起步 為核心的規劃。
⠀
⠀
二十個常見的統計錯誤,與實務寫作時的考量。
🔗 原始貼文 │ https://bit.ly/2WESphu
操作型定義論文 在 新思惟國際 Facebook 的最佳解答
💥 20 個 #常見的統計錯誤,你犯過,或是犯了卻不知道嗎?⠀
⠀
MedCalc 的作者 Frank,在 Facebook 分享了一篇跟統計相關的文章,叫做「生物醫學研究文章中,連你都可以發現的 20 個統計錯誤」,很有意思。(連結請見原始貼文)
⠀
我(蔡依橙)認真看完後,覺得蠻不錯的,於是把這 20 個統計錯誤的標題翻成中文,協助大家節省時間,如果剛好有興趣的,可再針對該部分去閱讀原文。接著,分享一些我看完之後的想法。
⠀
⠀
1. 數值報告時,提供了不必要的精確。例如 60 公斤體重,硬要寫成 60.18 公斤。
⠀
2. 將連續變項分組,變成次序變項,但沒有說明為什麼這樣分。像是 CRP 不以數值去統計,而分成低、中、高三組,卻沒說明為什麼這樣分。
⠀
3. 配對資料,只報告各組平均,卻沒報告其改變。也就是只報告治療前血壓、治療後血壓,卻沒報告有多少人上升、多少人下降、平均下降多少。
⠀
4. 描述性統計的誤用,尤其該用 median (interquartile range) 的,硬是用成 mean +- SD。
⠀
5. 使用 standard error of the mean (SEM) 描述量測的精確度,而非 95% CI。
⠀
6. 只報告 p 值,卻沒提到差值以及臨床意義。
⠀
7. 誤用統計方式。尤其常見的是混淆有母數跟無母數統計方法。
⠀
8. 使用線性迴歸,卻沒有先確定資料之間是真的有線性關係。
⠀
9. 沒有使用全部的資料,然後又沒把去掉的資料「為什麼被去掉」說清楚。
⠀
10. 多組比較的 p 值校正問題。
⠀
11. 在隨機分組研究時,過於詳盡地比較了兩組受試者的基本資料,像是性別比例、年齡、體重、血壓等等,而且資料好得太奇怪。
⠀
12. 報告檢驗數值時,沒有定義 normal 與 abnormal。
⠀
13. 計算 sensitivity 與 specificity 時,沒有說明一些介在灰色地帶的檢查結果,如何呈現與去除。
⠀
14. 使用圖片與表格,只是為了儲存數據,而非以協助讀者理解為出發點。
⠀
15. 畫出來的數據圖,視覺主觀上給人的印象,竟然跟數據本身不同。
⠀
16. 在報告數據與解讀時,搞不清楚 units of observation 是什麼,例如心臟病的觀察研究,在 1000 個患者中有 18 位心臟病發,那 units of observation 就是 18。但如果這個研究是以診斷正確率為主,那 sample size 就是 1000。
⠀
17. 把不顯著的統計,或 low power,解讀成 negative,而非 inconclusive。
⠀
18. 分不清楚解釋性研究與實務性研究,前者為 explanatory / efficacy / laboratory,後者為 pragmatic / effectiveness / real world。嘗試兩種混著做,結果兩邊都做不好。
⠀
19. 沒有用臨床能理解的方式來報告最終結果。
⠀
20. 把統計的顯著性,當成臨床的重要性。例如:癌症用新藥治療,統計上很顯著的好,但追蹤了五年,患者只延長了七天的壽命。這就是統計有顯著,但臨床意義不大的例子。
⠀
⠀
🗨 我(蔡依橙)的一些想法
⠀
由統計專業人的角度,來看生物醫學發表,是很有警惕意義的,能讓準備發表的朋友,仔細看看自己是不是也犯了相關的錯誤。
⠀
但另一個角度看,作者也提到,這些錯誤在幾乎一半的生物醫學論文上反覆出現!這就代表,其實生物醫學論文要刊登,並不代表我們什麼錯都不能犯,相反地,這 20 個錯誤裡頭,有些就算犯了,也還是能被刊登。
⠀
以我們自己發表,以及過去協助同學的經驗來說,我會認為 2、7、10、14、15,是初學者也 #必須理解並避開的,其他的則是發表起步了之後,陸陸續續去注意,在往更高分期刊挑戰時,逐漸進步就行。
⠀
實務上,3 分以下的醫學期刊,幾乎沒有專門的統計查核,你只要能通過「一般同行」的統計知識審查就行。也就是說,我是一個放射科醫師,剛開始起步,投稿到放射科 3 分以下期刊,文章中的統計,只要「#一般有在做研究的放射科醫師」覺得可以就行,不見得要到「統計專家看過並挑不出毛病」。
⠀
對於初學者如何起步,實務的協助,新思惟規劃了各種類型的研究課程,歡迎有興趣的朋友可以參考。目前正在開放報名中的,有以下三場工作坊,歡迎您瞭解各課程的課綱後,評估挑選最符合您需求的內容,前來上課,讓我們協助您成功起步。
⠀
🟠 2021 / 11 / 7(日)統合分析工作坊
無經費、資源少也能發表,不用 IRB 且免收案的好選擇。
https://meta-analysis.innovarad.tw/event/
⠀
🔵 2021 / 10 / 17(日)臨床研究與發表工作坊
全新改款!跟著國際學者走,讓你寫作投稿都上手。
https://clip2014.innovarad.tw/event/
⠀
🟢 2021 / 10 / 16(六)個案報告、技術發表與文獻回顧工作坊
把臨床上的各種想法,在 PubMed 化作專業生涯上的里程碑。
https://casereport.innovarad.tw/event/
⠀ ⠀
不只是說說而已,我們會舉實例,說明其意義、如何避開,在互動實作過程,實際由各位在自己的電腦上操作,從數據到軟體,從統計到繪圖,一次搞定,並避開常見錯誤,是真正以 #初學者起步 為核心的規劃。
⠀
⠀
二十個常見的統計錯誤,與實務寫作時的考量。
🔗 原始貼文 │ https://bit.ly/2WESphu
操作型定義論文 在 Facebook 的最佳貼文
創新工場和BCG諮詢合作的「+AI改造者」系列:創新工場投資的Insilico Medicine,看AI新藥研發平臺如何賦能傳統藥企,一起進行“AI+生命科學”的顛覆式創新!
改造者系列:AI醫藥的下一站是長壽 -- 本文来自BCG微信公眾號,經授權轉載。
近期,創新工場聯合BCG波士頓咨詢旗下亨德森智庫,推出「AI融合產業:『改造者』如何促進AI普惠」系列研究。人工智能在中國大陸有著明確的落地應用場景,大量的AI企業活躍於這些垂直場景中,我們定義這些企業為「改造者」。「改造者」通過傳授其AI技術和垂直行業理解,極大地打破了傳統企業應用AI的瓶頸。
作為擅於趨勢前瞻的TechVC,創新工場長期看好AI領域,深入佈局,至今已經投出了7只AI獨角獸。在系列研究中,我們采訪了數家創新系AI企業,通過這些「改造者」的視角,探究傳統企業擁抱AI的範式與路徑。
創新工場投資的英矽智能(Insilico Medicine)是一家由人工智能驅動的全球領先生物技術公司,通過發明和迭代人工智能藥物研發平臺,變革創新藥物和療法的發現方式。
英矽智能的AI藥物研發平臺已經證明了自己的能力:在今年2月和8月,半年的時間內,先後公佈了兩種臨床前候選藥物,分別用於治療特發性肺纖維化和腎臟纖維化。
在采訪中,英矽智能創始人兼首席執行官Alex Zhavoronkov博士表示,AI醫藥企業的下一個重要問題將是如何更好地理解生物學和跨物種生物學,長壽業或者抗衰老技術將會是未來的方向。以下:
■系列導讀
本系列由BCG亨德森智庫與創新工場董事長兼首席執行官李開復博士帶領的創新工場團隊共同推出,圍繞「AI融合產業:『改造者』1如何促進AI普惠」的課題,我們致力於探究傳統企業在應用AI過程中的關鍵要素與合作夥伴,以及傳統企業擁抱AI的範式與路徑。
AI製藥領域於2014年左右興起,在2018—2020年間全面爆發。AI能夠快速識別大量樣本中的客觀規律,加速尋找和測試潛在靶點的過程。「有了AI,我們50個人可以做到的事情,比得上一個典型的製藥公司5000人所做的事情」,英矽智能創始人Alex Zhavoronkov在「未來呼嘯而來」一書中如是分享。2
1 「改造者」 通過傳授其AI技術和垂直行業理解,極大地打破了傳統企業應用AI的瓶頸,充當產業中傳統企業應用AI的橋樑。「改造者」包括AI企業與成功轉型AI的傳統企業。
2「未來呼嘯而來」,彼得·戴曼迪斯(Peter H.Diamandis)和史蒂芬·科特勒(Steven Kotler)著。
■本期受訪嘉賓:Alex Zhavoronkov
英矽智能(Insilico Medicine)是一家由人工智能驅動的全球領先生物技術公司,通過發明和迭代人工智能藥物研發平臺,變革創新藥物和療法的發現方式,加速研發進程,為癌症、纖維化、抗感染、免疫和抗衰老等未被滿足的臨床治療需求提供創新的藥物和療法方案。
Alex Zhavoronkov是英矽智能的創始人兼首席執行官。他擁有皇后大學學士學位,約翰·霍普金斯大學生物技術碩士學位,以及莫斯科國立大學物理和數學博士學位。
■對談實錄
Q1 英矽智能原來在美國創立,後來為什麼選擇遷至中國?
Alex:中國構建了一套完善的體系和土壤,吸引創業企業、大型企業紛紛入駐。中國大陸多樣化的投資者,包括傳統藥企、科技巨頭、PE/VC等各類投資者,能將最優質的AI人才、CRO、藥企融合在一起。投資者能為初創企業提供資質牌照、幫助招聘、企業管理和宣傳等等。英矽還與許多學校開展了合作研究,擁有豐富的內部研發管線。中國完整的生態夥伴體系使得像我們這樣的企業能夠迅速擴大研發規模,甚至與大藥廠競爭。
Q2 英矽智能和輝瑞、安斯泰來、楊森製藥等諸多藥企都有合作,在和大型藥企合作的過程中有什麼心得或者經驗?
Alex:創新型的AI生物技術公司按照創立時間可以分為三大類:2014年之前成立、2014年—2015年左右成立、最近5年成立。2014年之前成立的企業通常不運用深度學習(deep learning),或者不具備向藥企提供解決方案所需的行業知識。2014—2015年間成立的企業則創立的正是時候,生成式對抗網絡(Generative Adversarial Network)出現,AI製藥開始興起。同時,許多藥企缺乏AI的專業知識和AI團隊,如果想要獲取AI方面的知識和技能,就必須與初創企業合作。作為交換,那時候的藥企也通常願意向初創企業提供資料和各類資源。英矽智能很幸運,創立時間(2014)正處於大藥企對外部合作最為開放和寬鬆的時期。而最近幾年成立的企業就沒那麼幸運了,很多藥企已經開始自建AI團隊、自研AI應用,只有具備非常特定細分領域AI技術的初創企業才有可能成功撬動藥企,與之建立合作。
然而據我的觀察,儘管許多大藥企都建有自己的AI部門和數據科學家團隊,但他們並沒有足夠強的AI能力——他們往往缺乏具備足夠AI知識的團隊。以生物醫藥方面的論文發表為例,在2014—2019年間,英矽智能發佈了上百篇AI相關的論文,然而發表AI論文數量最多的藥企阿斯利康則只有65篇,位列其次的諾華有54篇。
藥企往往也不知道從何處開始應用AI,而這正是AI初創公司能夠創造價值的地方。但是,在AI初創公司開始接觸藥企和銷售方案之前,首先要充分理解大型藥企錯綜複雜的組織架構和部門分工,針對不同部門銷售定制化的模塊,而非從一開始就銷售整體性、綜合性的解決方案。這是因為藥企內部通常很難有一個部門能夠處理所有的模塊,部門之間的協同往往沒有那麼強。因此,AI初創公司在提供解決方案的時候也要靈活地劃分模塊,對症下藥,英矽智能通常一次只銷售一個模塊。
儘管銷售是模塊化的,AI初創公司需要具備端到端、全鏈路的解決方案。英矽根據不同的研發週期,設計了三大AI平臺——新藥靶點發現平臺、分子生成和設計平臺、臨床試驗預測平臺。據我們瞭解,中國還沒有任何一家同行,同時擁有生成生物學和生成化學兩大AI平臺,能把靶點發現和小分子化合物生成有機結合在一起的公司很少。此外,英矽智能的AI系統可以用軟件形式呈現,藥企可以自行操作,用自己的數據運算測試。這些都為我們創造了差異化的優勢。
最後,對於藥企而言,如果想要應用綜合的AI解決方案,需要有整體性的戰略為引領。咨詢公司可以充當整合各部門組織、統籌整體戰略的角色,AI企業可以選擇與之合作。
Q3 在您看來,未來AI醫藥領域的發展趨勢是什麼?
Alex:在未來,最重要的不是AI技術,而是如何將AI和行業特定的實驗數據或模型結合。現在市場上已經充滿了各種各樣的技術企業,他們在不斷精進演算法模型和數據。未來的競技不會是關乎演算法或者算力,而是新的商業模式或者應用AI的新方式。
AI初創公司需要積累足夠的行業專識,理解藥企的需求,學習藥企的經驗,並向藥企證明自己提供的模塊能夠在真實的商業環境下應用,並且模塊之間能夠很好地兼容,能融入業務流程,且符合監管要求。比如機器學習加速了藥物識別,但還有很多步驟和流程並不能被加速或跨越:實驗論文不能被跨越,你依然需要向藥物監管部門提供大量實驗數據和模型來證明研究的有效性;實驗中的生物過程不能被加速,你依然需要等待生物體自然的新陳代謝和細胞活動,你也不可能直接從大鼠實驗跨越到人類實驗。而這些都涉及到更細分的新技術問題。
所以,對於AI醫藥企業而言,下一個重要的問題將是如何能夠更好地理解生物學?如何理解跨物種生物學?正因如此,我判斷長壽業或者抗衰老技術將會是未來的方向,即如何運用AI來監督和追蹤生命體在漫長時間裡無數細微的實時變化,來創建數字孿生(digital twin),進行跨物種比較、跨疾病模型比較。我相信AI是説明我們更好地認識生命體的最佳工具。
■要點回顧
1、中國的資本環境天然地聚集了垂直產業領域的優質企業,幫助AI初創公司,即「改造者」,迅速汲取經驗、擴大規模,加速行業創新與賦能。
2、在與垂直行業企業合作時,「改造者」既要有端到端的解決方案,也要有靈活、敏捷的銷售和服務模式。端到端、全鏈路的方案有助於「改造者」更靈活地根據傳統企業的需求組合方案,能夠擴大服務範圍和客群,提升「改造者」的競爭優勢。
3、未來最重要的不是AI技術,而是如何將AI與行業特定的實驗數據或模型結合。限制因素並不是演算法或者算力,而是新的商業模式或者應用AI的方式來實現行業定制化。
操作型定義論文 在 [請益] 什麼是變數的操作型定義? - 看板Master_D - PTT網頁版 的必吃
翻成中文就是變數的操作型定義2.看一篇論文大概要從哪邊找出變數的操作型定義呢? Method裡面的participants背景??還是procedure??Analysis?? 最近在上研究方法還有一些 ... ... <看更多>
操作型定義論文 在 論文題目: 探討KOL 特質、品牌形象及行銷創意程度對廣告效果 ... 的必吃
品牌形象最早為美國行銷學會(American Marketing Association)定義品牌是一個名 ... 數越高代表受測者越同意該問項,表1為本研究構面的操作型定義及題項。 ... <看更多>
操作型定義論文 在 相關係數與區隔效度;控制變數與階層迴歸分析;問卷數量與題 ... 的必吃
2020年1083學期組織行為 論文 導讀郭彥谷博士第09講:相關係數與區隔效度;控制變數與階層迴歸分析;問卷數量與題項數量;橫斷與縱貫; 操作型定義. ... <看更多>