• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      大數(shù)據(jù)可以用來“證偽”卻不能用來證明

      2018-01-05 05:19李迅雷
      中國商人 2018年11期
      關(guān)鍵詞:歸納法邏輯

      李迅雷

      3年前,我曾經(jīng)以《相信奇跡還是相信邏輯》為題做過一次演講。核心觀點是,從古至今,國人的形象思維比較發(fā)達(dá),但形式邏輯偏弱,建議用數(shù)據(jù)說話,提倡理性思考。今天,在人人都講大數(shù)據(jù)的時代,我們該如何看待和運用大數(shù)據(jù)?當(dāng)大數(shù)據(jù)不合邏輯時,究竟是相信大數(shù)據(jù)還是相信邏輯?

      相信個案還是相信大數(shù)據(jù)

      大約從2009年開始,“大數(shù)據(jù)”成為互聯(lián)網(wǎng)信息技術(shù)行業(yè)的流行詞匯。美國互聯(lián)網(wǎng)數(shù)據(jù)中心指出,互聯(lián)網(wǎng)上的數(shù)據(jù)每年將增長50%,每兩年翻一番,目前世界上90%以上的數(shù)據(jù)是最近幾年才產(chǎn)生的。

      數(shù)據(jù)又并非單純指人們在互聯(lián)網(wǎng)上發(fā)布的信息,全世界的工業(yè)設(shè)備、汽車、電表上有著無數(shù)的數(shù)碼傳感器,隨時測量和傳遞著有關(guān)位置、運動、震動、溫度、濕度乃至空氣中化學(xué)物質(zhì)的變化,也產(chǎn)生了海量的數(shù)據(jù)信息。

      有人把數(shù)據(jù)比喻為蘊藏能量的煤礦。煤炭按照性質(zhì)有焦煤、無煙煤、肥煤、貧煤等分類,而露天煤礦、深山煤礦的挖掘成本又不一樣。與此類似,大數(shù)據(jù)并不在“大”,而在于“有用”。價值含量、挖掘成本比數(shù)量更為重要。對于很多行業(yè)而言,如何利用這些大規(guī)模數(shù)據(jù)成為贏得競爭的關(guān)鍵。

      2011年諾貝爾經(jīng)濟(jì)學(xué)獎獲得者托馬斯·薩金特近期在中國公開演講時認(rèn)為,人工智能實質(zhì)上就是統(tǒng)計學(xué)。我覺得他說的有一定道理,但過于簡單粗暴。其實他想表達(dá)的是,人工智能中運用的不少方法就是過去的統(tǒng)計方法。

      又有人認(rèn)為大數(shù)據(jù)就是全樣本統(tǒng)計,這樣理解大數(shù)據(jù)未免有點淺薄,全樣本統(tǒng)計只是大數(shù)據(jù)的一種形式而已。大數(shù)據(jù)的涵義要比傳統(tǒng)意義上的統(tǒng)計數(shù)據(jù)廣泛,但又具有統(tǒng)計數(shù)據(jù)的很多屬性,因此大數(shù)據(jù)需要通過合適的方法,才能發(fā)揮其作用。

      兩年半前,我曾從螞蟻金服公布的居民網(wǎng)絡(luò)消費數(shù)據(jù)中發(fā)現(xiàn)天津在網(wǎng)絡(luò)消費上的怪異現(xiàn)象:作為直轄市的天津,人均網(wǎng)消水平明顯低于上海、北京、浙江、江蘇、海南、福建、廣東,甚至低于全國平均水平(因為前七個省市的消費權(quán)重較大)。

      天津人均GDP在2016年及之前一直為全國省市自治區(qū)中排名第一,為何網(wǎng)購數(shù)據(jù)那么弱呢?我當(dāng)時認(rèn)為天津有夸大GDP的可能。因為查閱《統(tǒng)計年鑒》,發(fā)現(xiàn)天津的人均可支配收入與人均GDP水平不匹配。即人均可支配收入不僅低于北京和上海,而且低于浙江、江蘇。

      如2015年浙江城鎮(zhèn)居民可支配收入占GDP之比為56.3%,上海51.3%,但天津只有31.9%,與前者相差20%左右。如果說人均可支配收入偏低與通過大數(shù)據(jù)獲得的人均網(wǎng)購額比較匹配,那么,人均GDP或GDP總額就極大偏離正常水平了。

      今年年初,天津重新調(diào)整了其濱海新區(qū)2016年GDP的數(shù)據(jù),從過去公布的10002.31億元,調(diào)整為6654億元,縮水3348億元,縮水幅度達(dá)三分之一??梢?,如果把從支付寶獲得的網(wǎng)購大數(shù)據(jù)與統(tǒng)計部門公布的數(shù)據(jù)進(jìn)行相互比對,就可以及早發(fā)現(xiàn)問題所在。

      我曾舉過一個例子:讓1000只猴子擲硬幣,每次出現(xiàn)正面的概率為50%,如果讓所有猴子連續(xù)擲硬幣10次,那么,連續(xù)10次均為正面的概率就是50%的10次方,約等于千分之一,即一千只猴子中應(yīng)該有一只猴子會連擲硬幣10次均為正面。難道我們需要把這只猴子作為典型案例,號召所有猴子向它學(xué)習(xí),將其“成功”擲幣的經(jīng)驗進(jìn)行推廣嗎?

      在國內(nèi),類似“成功學(xué)”的書特別暢銷,但就“成功”本身而言,其比例很低,否則就不叫成功了。也就是說,成功只能是個案,但大部分人只對成功的個案有興趣,對成功率茫然無知。

      盲目相信大數(shù)據(jù)并不可取

      過度迷信大數(shù)據(jù)也有問題。以股市為例,目前A股市場的上市公司數(shù)量超過3000家,所有上市公司的盈利等財務(wù)數(shù)據(jù)累加起來,也構(gòu)成了大數(shù)據(jù)。

      從2016年開始,上市公司的整體ROE(股權(quán)收益率)都在上升,但為何股市的估值水平卻在下移呢?為何商品房銷量屢創(chuàng)新高,房企的盈利也出現(xiàn)了高增長,但房地產(chǎn)股卻大幅下跌?說明借助大數(shù)據(jù)預(yù)測未來,必須搞清楚數(shù)據(jù)與預(yù)測對象之間的邏輯關(guān)系。股價應(yīng)該是領(lǐng)先指標(biāo)(或稱晴雨表),大數(shù)據(jù)則是滯后指標(biāo)。房地產(chǎn)股的下跌,或是反映了股市投資者對國內(nèi)樓市未來下跌的擔(dān)憂。

      2017-2018年上市企業(yè)盈利整體增速超過兩位數(shù),但并不意味著2019年盈利增速不下降。當(dāng)投資者看到經(jīng)濟(jì)增速下行的長期趨勢,就會對企業(yè)未來的盈利前景感到擔(dān)憂。

      大數(shù)據(jù)總量數(shù)據(jù)固然重要,但“內(nèi)部結(jié)構(gòu)”還需要分析:為何這兩年股市中的“中小創(chuàng)”跌幅較大?是因為其歷史的估值水平較高,盡管其盈利增速并不低,但面臨市場趨向理性之后的估值水平下移壓力。

      所以,盲目偏信大數(shù)據(jù)反而容易產(chǎn)生誤判,只有運用合理的邏輯分析方法,才能把大數(shù)據(jù)的結(jié)構(gòu)和特征描述清楚。例如,由于A股中大市值公司的估值水平比較低,如銀行股的利潤總額加起來占所有上市公司總利潤的一半左右,且大部分銀行的PE只有5-7倍;所有上市公司PE加權(quán)平均之后,就很低了,但從PE的中位數(shù)看,估值水平仍然不低(目前23倍左右)。

      為何會發(fā)生黑天鵝事件

      17世紀(jì)之前,歐洲人都認(rèn)為天鵝都是白色的,因為他們所見到的各大洲(歐洲、亞洲、非洲)及各個地方的天鵝,無一例外地都是白色——這就是用歸納法對大數(shù)據(jù)處理所得出的結(jié)論。一直到人們在澳洲發(fā)現(xiàn)第一只黑天鵝之后,天鵝都是白色的結(jié)論才被推翻。

      從此之后,人們就把意想不到事件的發(fā)生,稱之為黑天鵝事件。這說明大數(shù)據(jù)的缺陷所在——樣本不能被窮盡,因此,大數(shù)據(jù)可以用來“證偽”,卻不能用來證明。

      而大數(shù)據(jù)的運用,大部分采用歸納法——人類思維中90%以上的機(jī)率都在使用歸納法,因為歸納法不需要運用太多知識。不像演繹法,它先要掌握不少知識或定理,然后再據(jù)此去推理。

      前段時間英國皇家學(xué)會前主席阿提亞爵士宣稱證明了黎曼猜想。是否真的證明了姑且不論,但證明過程所需要的深奧專業(yè)知識,肯定不是一般人所能觸及的。

      事實上,西方在基礎(chǔ)研究領(lǐng)域的巨大成就,大部分都是在17世紀(jì)之后取得的,遠(yuǎn)沒有跨入大數(shù)據(jù)時代,且大部分沒有采取實驗室研究的方式,但至今大部分成果都被廣泛應(yīng)用到社會經(jīng)濟(jì)、科技生產(chǎn)的各個領(lǐng)域。也就是說,17世紀(jì)之后,西方抽象思維得到極大發(fā)展,建立了數(shù)學(xué)、物理的科學(xué)體系,進(jìn)而又推動了科技進(jìn)步,從而拉大了中西方在科技領(lǐng)域的差距。

      相比之下,從中國歷史上所取得的科學(xué)成果看,能體現(xiàn)抽象思維的東西比較少,形式邏輯在中國沒有充分發(fā)展,如公孫龍(前320年-前250年)就提出了“白馬非馬”之說。因此,中國歷朝歷代的思維還是見長于歸納法和辯證法。

      由于形式邏輯、演繹法在中國五千年的漫長歷史中沒有得到充分發(fā)展,這才是導(dǎo)致我國近代科技發(fā)展遲緩的根本原因,而不是所謂的制度因素。為什么哲學(xué)、宗教、文化乃至醫(yī)學(xué)等都有中西方之分,但數(shù)理化就沒有“中國數(shù)理化”?因為這些學(xué)科都不能通過經(jīng)驗(或稱大數(shù)據(jù)歸納)、傳承或辯證法來創(chuàng)設(shè)。

      3年前,我提出要相信邏輯,不要相信奇跡(個案)。如今,進(jìn)入了大數(shù)據(jù)時代,我仍然提倡:在大數(shù)據(jù)面前,更要相信邏輯,雖然大數(shù)據(jù)比個案更有說服力,但大數(shù)據(jù)同樣存在失真、變異、滯后甚至被操縱的可能性。

      去年以來公布的統(tǒng)計數(shù)據(jù)顯示,企業(yè)的盈利增速大幅提高,但為何企業(yè)的投資增速卻大幅下降呢?大數(shù)據(jù)不能解釋,但邏輯卻可以作合理解釋:供給側(cè)改革、環(huán)保標(biāo)準(zhǔn)提高等導(dǎo)致供給端被壓縮,進(jìn)而導(dǎo)致上游商品價格上漲,大企業(yè)盈利增速上升。

      社會經(jīng)濟(jì)的發(fā)展,看似千姿百態(tài),但也有其共性。比如,二戰(zhàn)之后的今天,市場經(jīng)濟(jì)最終成為全球幾乎所有國家的共同體制,說明這個體制合乎經(jīng)濟(jì)可持續(xù)增長的邏輯。這正如價值投資成為全球絕大部分資本市場的共同理念一樣,唯有如此,才能獲得較大的回報。

      縱觀全球各國經(jīng)濟(jì)走勢,都會發(fā)生波動,盡管波動劇烈時政府部門會采取逆周期的政策,試圖通過干預(yù)市場避免發(fā)生危機(jī),但事實上卻很難避免。也有些國家盡管沒有爆發(fā)危機(jī),但其代價往往是經(jīng)濟(jì)停滯和債務(wù)高企。因此,就像價值投資理念對資本市場的影響一樣,邏輯產(chǎn)生作用可能會遲到,但不會缺席。

      猜你喜歡
      歸納法邏輯
      邏輯
      2021年高考“集合、簡易邏輯”經(jīng)典問題聚焦
      我們還能有邏輯地聊天嗎
      數(shù)學(xué)歸納法原理及應(yīng)用展示
      女生買買買時的神邏輯
      女人買買買的神邏輯
      高觀點下的數(shù)學(xué)歸納法
      數(shù)學(xué)歸納法常見錯誤剖析
      從邏輯隱喻看培根《散文集》翻譯的隱性邏輯連接
      用“不完全歸納法”解兩道物理高考題
      芦山县| 徐汇区| 阜阳市| 陈巴尔虎旗| 东源县| 朝阳区| 确山县| 印江| 藁城市| 贞丰县| 甘谷县| 甘肃省| 泗洪县| 开江县| 柏乡县| 罗江县| 镇原县| 长丰县| 来安县| 云龙县| 水富县| 垣曲县| 南乐县| 尤溪县| 黔江区| 焉耆| 英超| 澄迈县| 郴州市| 修水县| 安乡县| 黄石市| 韩城市| 富民县| 谷城县| 中卫市| 甘肃省| 安达市| 大邑县| 汤原县| 天津市|