收藏我們
Company Dynamics
從事物流系統(tǒng)設(shè)計(jì),物流園區(qū)規(guī)劃,首先就要進(jìn)行數(shù)據(jù)分析,這一觀點(diǎn)逐漸為行業(yè)所接受。數(shù)據(jù)分析分析什么,已經(jīng)有專門的教科書進(jìn)行講解,不是本文的重點(diǎn)。本文重點(diǎn)是談數(shù)據(jù)背后的邏輯問題。
對(duì)于數(shù)據(jù)分析,大家普遍感到困惑的是分析的是否正確有用和如何使用,哪些數(shù)據(jù)是不對(duì)的和失真的,哪些數(shù)據(jù)需要修正,哪些數(shù)據(jù)需要補(bǔ)充。對(duì)這些問題的回答,核心問題是探討數(shù)據(jù)背后的邏輯,理清數(shù)據(jù)關(guān)系,才能正本清源,數(shù)據(jù)分析的結(jié)果才有意義。
數(shù)據(jù)失真是一種客觀存在
數(shù)據(jù)作為反映客觀世界的一種方式,有時(shí)會(huì)失真,從而使真實(shí)世界發(fā)生扭曲。失真的原因很多,主要有以下幾種:其一是數(shù)據(jù)記錄問題,數(shù)據(jù)記錄有記錯(cuò)和數(shù)據(jù)丟失,這一問題發(fā)生的可能性非常大。數(shù)據(jù)不管是記錄在何種載體上,由于記錄手段問題,接口問題,傳感器問題,存儲(chǔ)媒介問題以及環(huán)境問題,錯(cuò)誤和丟失在所難免;其二是人為造假,這個(gè)更為普遍。造假是人類不可杜絕的一個(gè)現(xiàn)象,每個(gè)時(shí)期,每個(gè)國家,每個(gè)地方,每個(gè)角落都存在。無論是處于何種動(dòng)機(jī),造假的代價(jià)之一就是使真實(shí)世界不再真實(shí),這是十分令人痛惜的;其三是偶發(fā)數(shù)據(jù),雖然可能是真實(shí)反映,但又非常態(tài),或者是經(jīng)過調(diào)整后的數(shù)據(jù),并非第一手?jǐn)?shù)據(jù)。
人們有時(shí)候調(diào)侃,歷史沒有真相。是指歷史上的很多事件,真真假假,其真相成為永遠(yuǎn)的迷。這里既有歷史事件記載者的故意,也有以訛傳訛的原因。有的真相很簡單,但如果當(dāng)事人或傳播者故意誤導(dǎo),可能真相真的就成為歷史之謎,再也無人知曉。
現(xiàn)實(shí)中的實(shí)例也不勝枚舉。比如國民經(jīng)濟(jì)統(tǒng)計(jì),看起來很簡單的一件事,但實(shí)際就很難做到十分真實(shí)準(zhǔn)確,有時(shí)還相差甚遠(yuǎn)。物流行業(yè)數(shù)據(jù)統(tǒng)計(jì)也是如此。我們到現(xiàn)在也沒有一個(gè)權(quán)威的統(tǒng)計(jì)數(shù)據(jù),告訴人們每年的堆垛機(jī)的產(chǎn)量,輸送機(jī)的產(chǎn)量,分揀機(jī)的產(chǎn)量,貨架的產(chǎn)量等,都只是一個(gè)大概估計(jì)。
總之,數(shù)據(jù)失真,既有技術(shù)原因,也有人為因素,人的因素又分為主觀故意、無心之失或能力所不能及。這是一種客觀的存在,誰也改變不了。
數(shù)據(jù)之間的邏輯關(guān)系
面對(duì)一個(gè)不真實(shí)數(shù)據(jù)所描述的世界,人們往往難以分辨數(shù)據(jù)真假。其實(shí),熟悉數(shù)據(jù)分析的人,一般會(huì)從數(shù)據(jù)之間的邏輯關(guān)系中判斷出數(shù)據(jù)的可信程度。雖然我們不知道真相的具體細(xì)節(jié),但通過邏輯分析和比對(duì),會(huì)基本還原真實(shí)世界大致的情況。
一句謊話,往往要10句謊話去掩蓋。這句俗語說明了一個(gè)基本事實(shí),就是事物之間是有千絲萬縷的聯(lián)系的。反映到數(shù)據(jù),就是數(shù)據(jù)之間是具有邏輯關(guān)聯(lián)性的。這一事實(shí)為人們甄別數(shù)據(jù)的真?zhèn)翁峁┝藚⒖己头椒?,但有時(shí)也不是萬能的。
對(duì)物流數(shù)據(jù)分析來說,年銷售額、箱單價(jià)、日收貨量、日發(fā)貨量、庫存量、退貨量、庫存周轉(zhuǎn)天數(shù)等這幾個(gè)數(shù)據(jù)是互相影響的,所以我們可以從彼此的關(guān)系中,發(fā)現(xiàn)問題所在,可以判斷數(shù)據(jù)是否真實(shí)可靠。
特別是在大數(shù)據(jù)時(shí)代,對(duì)事物的真相判斷會(huì)更加準(zhǔn)確。因?yàn)榇髷?shù)據(jù)會(huì)從多個(gè)角度去描述同一件事情。比如一家企業(yè)的運(yùn)營狀況,可以從員工人數(shù)、營業(yè)額、收入、納稅額、工資、獎(jiǎng)金、辦公開銷、投資、研發(fā)經(jīng)費(fèi)、宣傳費(fèi)、差旅費(fèi)、按月度計(jì)算的流水等多個(gè)維度進(jìn)行分析,還可以從行業(yè)平均利潤分析其利潤額合理性等。一旦某些數(shù)據(jù)出現(xiàn)大的偏差,則可以判斷其數(shù)據(jù)真實(shí)性值得懷疑。
對(duì)一個(gè)物流中心來說,很多數(shù)據(jù)之間具有強(qiáng)相關(guān)的邏輯性。比如銷售額與發(fā)貨量的匹配,輸送線的輸送能力與系統(tǒng)產(chǎn)能的匹配,庫存與銷售的匹配,發(fā)貨區(qū)、發(fā)貨月臺(tái)與發(fā)貨量的匹配等,其中的邏輯關(guān)系其實(shí)并不復(fù)雜。然而,對(duì)一些用戶來說,并不完全知曉這些關(guān)系,從而對(duì)系統(tǒng)的能力產(chǎn)生認(rèn)知上的錯(cuò)誤。
有了數(shù)據(jù)間的邏輯,就為我們處理數(shù)據(jù)提供了參考。有些數(shù)據(jù)需要?jiǎng)h除,有些需要修正,有些則需要補(bǔ)充。
數(shù)據(jù)的偶然性與必然性
數(shù)學(xué)證明上有一個(gè)非常重要的證明方法-反證法。即要證明一個(gè)命題是否正確,只要證明其反命題不正確即可。而要證明一個(gè)命題不正確,則只需舉例一個(gè)反例即可。比如要證明是無理數(shù),只要證明其反命題,即是有理數(shù)這個(gè)命題是錯(cuò)誤的即可。這一方法對(duì)于數(shù)據(jù)分析也是非常有用的。
大千世界,變幻萬千。對(duì)數(shù)據(jù)分析者而言,識(shí)別數(shù)據(jù)的真?zhèn)问且环矫?,而如何正確的分析,則是更為重要的方面。數(shù)據(jù)分析為我們描述了一個(gè)歷史現(xiàn)狀作為前提。因此,不要站在一個(gè)錯(cuò)誤的前提下,對(duì)未來進(jìn)行預(yù)測,那樣會(huì)毫無意義,且非常危險(xiǎn)。
如何去偽存真,不是一件容易的事情,尤其對(duì)于初學(xué)者而言。比如要如何篩選和修正一些歷史的數(shù)據(jù),就是一項(xiàng)復(fù)雜且繁瑣的工作。有些數(shù)據(jù)是客觀存在的,也是真實(shí)的反映,但卻不具有普遍性,是一種偶然,一種異常。對(duì)這些數(shù)據(jù)的處理,即要求對(duì)偶然和必然的事件要有一個(gè)分析和判斷。
我們常??吹剑骋惶斓奈锪鲾?shù)據(jù)非常異常,但卻是客觀存在。比如某一商品銷量很大,或某一天的發(fā)貨量很大等,就可能是因?yàn)槟骋慌既皇录?。而這一事件有時(shí)并不具備普遍性。有點(diǎn)類似于電信號(hào)中的干擾信號(hào)。對(duì)這一類數(shù)據(jù)的過濾和修正是必要的。不要一葉障目,不見泰山。
另一方面,也不要輕易放過偶發(fā)事件背后的邏輯分析,有時(shí)甚至?xí)幸馔獾陌l(fā)現(xiàn)和作用。如對(duì)“雙十一”數(shù)據(jù)的分析,或?qū)δ骋痪W(wǎng)紅帶貨事件的分析等,就會(huì)指導(dǎo)物流設(shè)計(jì)在面對(duì)此類現(xiàn)象時(shí),如何有效處理。
在數(shù)據(jù)分析時(shí),一旦遇到特殊的數(shù)據(jù),既不能視而不見,也不能簡單的刪除。而是要做進(jìn)一步的甄別。這一點(diǎn)考驗(yàn)著分析師的敏銳和耐心。
有很多數(shù)學(xué)方法可以用于辨別偶然性和必然性,過濾一些干擾數(shù)據(jù)。比如,為了避免算術(shù)平均值法給人的一種假象,可以用階梯算術(shù)平均來修正,或采用均方差來評(píng)估數(shù)據(jù)分布的偏離程度。我們在統(tǒng)計(jì)個(gè)人收入時(shí),經(jīng)常看到平均數(shù)有時(shí)沒有多大意義,而階梯分析的數(shù)據(jù)更加容易看清楚數(shù)據(jù)的真相,如分析1%的高收入人群,其對(duì)財(cái)富的占比等。階梯算術(shù)平均法在分析物流數(shù)據(jù)時(shí),很容易得到庫存和發(fā)貨的ABC分布結(jié)果。更加深入細(xì)致的分析,還可以進(jìn)一步對(duì)標(biāo)準(zhǔn)差進(jìn)行分析,從而有助于確定設(shè)計(jì)指標(biāo)。例如在一個(gè)物流中心的設(shè)計(jì)中,人們常常需要一個(gè)較合適的設(shè)計(jì)目標(biāo)。這一目標(biāo)的確定就跟標(biāo)準(zhǔn)差有關(guān)。最簡單的做法是,約70%天數(shù)的作業(yè)在常規(guī)時(shí)間完成,其它30%天數(shù)的作業(yè)通過加班完成,這可能是一個(gè)比較合理的尺度。
物流數(shù)據(jù)背后的邏輯
在實(shí)際應(yīng)用中,抽樣統(tǒng)計(jì)在統(tǒng)計(jì)中有非常大的作用。比如市場調(diào)查和輿情調(diào)查,目前還基本采用這一方法。我們在物流作業(yè)中,往往也采用隨機(jī)抽樣的方法,對(duì)產(chǎn)品質(zhì)量進(jìn)行評(píng)估。為什么1%甚至更低的隨機(jī)抽樣會(huì)大致反映真實(shí)情況呢?這就是概率論給我們帶來的啟示。其實(shí),我們在做物流數(shù)據(jù)分析時(shí),隨機(jī)抽樣仍然不失為一種有效的方法。
對(duì)很多系統(tǒng)來說,數(shù)據(jù)反映的往往只是表象。比如,人們對(duì)于一個(gè)物流中心的評(píng)估,每年的發(fā)貨量反映的其實(shí)只是一個(gè)非常粗略的總數(shù),背后隱藏的真相往往大相徑庭,兩個(gè)具有同樣發(fā)貨能力的物流中心,往往不具有可比性。因?yàn)椴町愂嵌喾矫娴摹?
1)工作時(shí)間
從大的方面講,工作時(shí)間可能是單班、雙班和三班,其差異已經(jīng)是非常大的了。而進(jìn)一步分析,每個(gè)班次有的只有4~5小時(shí),有的會(huì)有9~10小時(shí),差異也很大。有的年工作360天,有的只有200多天。這些差異,會(huì)導(dǎo)致分析的結(jié)果出入很大。
2)單元貨物的價(jià)值
單箱價(jià)格也是影響非常大的因素。物流系統(tǒng)能夠比較的是物流量而非銷售額。但往往被人們忽視。就如同錯(cuò)把物流費(fèi)用與GDP做比較,不考慮產(chǎn)業(yè)結(jié)構(gòu)、地域、道路收費(fèi)、工資等差異,從而得出我國物流技術(shù)水平低的結(jié)論一樣,其實(shí)是不真實(shí)的。一個(gè)以日用、食品配送為主的配送中心,其單件價(jià)格只有幾十元,而一件藥品會(huì)高達(dá)上千元甚至幾千元,即使是同類商品,因?yàn)闃?gòu)成品質(zhì)不一致,產(chǎn)地不一樣,價(jià)格也會(huì)相差很大。比如進(jìn)口產(chǎn)品和國產(chǎn)的比較。
3)業(yè)務(wù)的均衡性
有的配送中心,其業(yè)務(wù)波動(dòng)性大,隨季節(jié)變化幅度非常大,而有的會(huì)比較均勻。這在數(shù)據(jù)分析時(shí)容易被忽視。但其影響巨大,比如圖書與醫(yī)藥。圖書,尤其是教材教輔類圖書表現(xiàn)出明顯的季節(jié)性,而藥品的季節(jié)性影響就要低很多。如果再細(xì)分到每一天,每一周,每一個(gè)月和每一季度的話,會(huì)得到非常驚人的結(jié)果。如何均衡業(yè)務(wù),其實(shí)對(duì)于提升物流系統(tǒng)的處理能力有非常大的作用。這就是物流反過來促進(jìn)管理,促進(jìn)市場的典型例子。與此類似的還有庫存周期和庫存量,這兩個(gè)指標(biāo)其實(shí)決定了物流中心處理能力的天花板,但又不是物流系統(tǒng)本身所能解決的問題,必須要與采購策略進(jìn)行聯(lián)動(dòng)??傮w來說,我國很多行業(yè)的物流管理還是粗放的,可以優(yōu)化的方面很多,而業(yè)務(wù)均衡性則是一個(gè)有很大潛力的優(yōu)化目標(biāo)。
4)拆零比
隨著電子商務(wù)的興起,拆零作業(yè)在物流配送中心的比重越來越大,也嚴(yán)重影響了物流作業(yè)的效率。一方面,人們看到定制化帶來的服務(wù)提升,另一方面,配送成本也隨之大幅度提升。特別是最近幾年,圍繞拆零揀選的技術(shù)投入大幅度提升。面對(duì)這一現(xiàn)狀,對(duì)于toB業(yè)務(wù),是否可以從提高整件配送比例出發(fā),降低物流成本,成為一個(gè)新的課題。即使對(duì)于拆零揀選,如何采用單元化技術(shù),使揀選更高效,其意義是多方面的,未來肯定會(huì)成為企業(yè)關(guān)注的方向。
除此之外,可比較的方面還有很多,如作業(yè)人員的數(shù)量,設(shè)備的投入,自動(dòng)化水平等,均影響物流配送中心的作業(yè)和業(yè)績,有些還互相關(guān)聯(lián)和影響。而這些都是表面數(shù)據(jù)看不到的,或表現(xiàn)不出來的。
總之,數(shù)據(jù)分析不是簡單的數(shù)據(jù)堆砌和結(jié)果呈現(xiàn),而是要挖掘其背后隱藏的真相。數(shù)據(jù)分析的價(jià)值在于發(fā)現(xiàn)數(shù)據(jù)背后的邏輯和特征,找出普遍性和規(guī)律性的東西,找出導(dǎo)致問題發(fā)生的根本原因和改進(jìn)方向,從而指導(dǎo)未來進(jìn)行的科學(xué)預(yù)測和規(guī)劃。
部分圖片來源于網(wǎng)絡(luò)