關于數(shù)據(jù)挖掘在某中小企業(yè)融資途徑選擇中的應用研究
摘要:本文以江蘇省中小企業(yè)為研究對象,調查其成功融資的融資途徑,樣本涉及江蘇省的南京、常州、南通、連云港、鹽城、淮安等多個城市的中小企業(yè)。在對大量調查數(shù)據(jù)進行分析處理的基礎上,運用數(shù)據(jù)挖掘中的Apriori算法,找出不同融資途徑間的關聯(lián)規(guī)則,從而為政府部門以及中小企業(yè)的相關決策提供支持。
關鍵詞:企業(yè)融資 關聯(lián)分析 Apriori算法
1 背景介紹
在我國,中小企業(yè)是國民經(jīng)濟最活躍的主體,被稱為中國經(jīng)濟的生力軍。在江蘇省,中小企業(yè)的重要性則更為突出。江蘇省中小企業(yè)在拉動GDP,推動社會經(jīng)濟發(fā)展,促進就業(yè)等繁忙都作出了巨大的貢獻。然而,中小企業(yè)在發(fā)展過程中卻面臨著各種困難,在面臨人民幣升值,金融危機等一系列問題下的中小企業(yè)生存更是艱辛。其中首要的瓶頸便是融資問題。在我國,按照現(xiàn)有的有關貸款通則以及相關規(guī)定,對中小企業(yè)的貸款問題限制的比較嚴格。本文選取了37個成功融資的中小企業(yè),采用數(shù)據(jù)挖掘中的Apriori算法,對這些中小企業(yè)融資途徑進行關聯(lián)分析,找到合適的融資途徑組合。
2 關聯(lián)規(guī)則及Apriori算法
2.1 關聯(lián)規(guī)則
關聯(lián)規(guī)則挖掘用于尋找給定數(shù)據(jù)集中數(shù)據(jù)項之間的有趣的關聯(lián)或相關關系。關聯(lián)規(guī)則揭示了數(shù)據(jù)項間的未知的依賴關系,根據(jù)所挖掘的關聯(lián)關系,可以從一個數(shù)據(jù)對象的信息來推斷另一個數(shù)據(jù)對象的信息。關聯(lián)規(guī)則的挖掘通過規(guī)則的支持度和置信度進行度量,這兩種度量反映了所發(fā)現(xiàn)規(guī)則的有用性和確定性。
定義1:設D是事務集,A,B為項集,且有規(guī)則A=>B。如果D中,包含A·B事務所占比例為s%,稱A=>B有支持度s。
定義2:設D是事務集,A,B為項集,且有規(guī)則A=>B。如果D中,c%的事務包含A的同時也包含B,則稱A=>B有置信度c。
定義3:設D是事務集,A,B為項集,若A=>B滿足置信度c和支持度s,則稱A=>B為關聯(lián)規(guī)則。
定義4:對關聯(lián)規(guī)則A=>B,若同時滿足最小支持度閥值和最小置信度閥值,則稱其為強規(guī)則。
關聯(lián)規(guī)則挖掘的過程分為兩個步驟。第一步,發(fā)現(xiàn)所有的大項目集,即支持度大于給定最小支持度閥值的項集;第二步,從大的項集中產(chǎn)生關聯(lián)規(guī)則。
2.2 Apriori算法
對于Ck中的任一項集c,若c得任一k-1子集在Lk-1中不存在,則將c從Ck中刪除。算法的下一步是對數(shù)據(jù)庫進行檢索,得到Ck中的項集的支持度,與最小支持度進行比較,從而得到Lk。它由Ck中的一部分項集組成,條件是它們的支持度不小于最小支持度。
3 Apriori算法在中小企業(yè)融資途徑選擇中的應用
由于證券市場門檻高,創(chuàng)業(yè)投資體制不健全,公司債發(fā)行的準入障礙,中小企業(yè)難以通過資本市場公開籌集資金,因此造成了中小企業(yè)融資渠道過于狹窄的現(xiàn)狀。一般說來,中小企業(yè)融資有以下幾種方式:①銀行貸款;②信用社貸款;③擔保機構貸款:④內部職工集資;⑤民間借款;⑥拖欠貸款;⑦親朋借款;⑧租賃
本文以江蘇省中小企業(yè)為研究對象開展調查,樣本涉及江蘇省的南京、常州、南通、連云港、鹽城、淮安等多個城市的中小企業(yè)。在對大量調查數(shù)據(jù)進行分析處理后,選擇37個成功融資的中小企業(yè)作為原始事務集,并將融資渠道分為8種,作為8種項集
首先掃描數(shù)據(jù)庫,識別所有單個項(1-項集)和它們的支持度,建立候選1-項集C1
假定最小支持度(min_sup)s=10%(至少在3個事務中),選擇1-項集的支持度大于或等于(min_sup)s的項,建立頻繁1-項集,并記作L1
假定最小支持度為至少在2個事務中,選擇2-項集的支持度大于或等于(min_sup)s的項,建立頻繁2-項集,并記作L2
重復以上過程,建立候選3-項集C3和頻繁3-項集L3
這時,由于C4為空集,停止Apriori算法。頻繁項集為L=L1∪L2∪L3。
若企業(yè)融資的途徑多于一種,則通過以上頻繁項集可以推導出強規(guī)則,即最佳融資途徑組合。
考慮頻繁3-項集{1,2,3},由于這三種途徑頻繁地一起使用,我們可以從這個3-項集推導出一些規(guī)則。
首先,得到非空真子集:{1},{2},{3},{1,2},{1,3},{2,3}。
然后,對于每個子集,形成如下規(guī)則,并計算置信度:
R1∶{1}→{2,3}, 2/26=1/13
R2∶{2}→{1,3}, 2/11
R3∶{3}→{1,2}, 2/4=1/2
R4∶{1,2}→{3}, 2/7
R5∶{1,3}→{2}, 2/3
R6∶{2,3}→{1}, 2/3
令min_conf為50%,選取R3、R5、R6為強規(guī)則。
用相同的方法計算頻繁2-項集,還可以得到以下四個強規(guī)則:
4 挖掘結果分析
從Apriori算法計算后得到的挖掘結果顯示以下規(guī)則:
規(guī)則一:江蘇省中小企業(yè)在融資時若只選擇一種融資方式,則向銀行貸款或者向信用社貸款是最有可能成功的融資途徑。
規(guī)則二:如果中小企業(yè)選擇兩種融資途徑,則有七種融資組合具有較高的成功率,即{銀行貸款,信用社貸款},{銀行貸款,擔保機構貸款},{銀行貸款,內部職工集資},{銀行貸款,拖欠貸款},{銀行貸款,親朋借款},{信用社貸款,擔保機構貸款},{民間借款,親朋借款}。
規(guī)則三:如果中小企業(yè)選擇兩種以上的融資途徑來保證借貸的成功率,則只有一種融資組合具有較高的成功率,即{銀行貸款,信用社貸款,擔保機構貸款}。
規(guī)則四:如果中小企業(yè)希望通過信用社貸款,則同時再向銀行借款,成功的可能性比僅僅選擇信用社貸款更大。如果希望通過擔保機構借到資金,則同時再向銀行或信用社進行借貸,這樣的成功幾率更高。
規(guī)則五:對于成功借貸的中小企業(yè)來說,民間借款和向親朋借款通常是同時進行的。即如果企業(yè)已經(jīng)選擇了民間借款這種途徑,則再向親朋借款的可能性非常大。同樣的,如果企業(yè)選擇了向親朋借款,則很有可能會尋找其他的民間借款途徑。
規(guī)則六:企業(yè)如果希望僅僅通過擔保機構貸款,而不選擇其他的途徑,這樣的風險是相當大的。如果同時再向銀行以及信用社進行借款,將會大大降低風險,提高借貸的成功率。
通過對關聯(lián)規(guī)則的分析,可以清楚地看到,如果中小企業(yè)希望成功地從社會融資,融資途徑的選擇非常重要。通過對八種不同的融資途徑的分析,發(fā)現(xiàn)像銀行貸款成功的可能性最高。但是,由于貸款交易和監(jiān)控成本高等原因,銀行不愿對中小企業(yè)放貸。同時,中小企業(yè)因資信等級低,缺乏抵押資產(chǎn),融資成本高等原因,難以得到銀行資金支持。因此,中小企業(yè)必須考慮兩種及兩種以上的融資途徑。從Apriori算法計算后得到的挖掘結果顯示,{銀行貸款,信用社貸款},{銀行貸款,擔保機構貸款},{銀行貸款,內部職工集資},{銀行貸款,拖欠貸款},{銀行貸款,親朋借款},{信用社貸款,擔保機構貸款},{民間借款,親朋借款}以及{銀行貸款,信用社貸款,擔保機構貸款}是常見的融資途徑組合。其中,{信用社貸款,擔保機構貸款},{銀行貸款,信用社貸款}成功的可能性最高。并且,僅僅通過擔保機構貸款得成功率很低,但如果與向銀行和信用社貸款相結合,將會大大提高成功率。
由于中小企業(yè)的融資渠道過于集中于商業(yè)銀行,獲得資金來源的渠道過于單一,所以通過本文數(shù)據(jù)挖掘的結論,一些中小企業(yè)可以改變原有的融資方式,尋找其他的途徑。
在中小企業(yè)融資途徑中應用數(shù)據(jù)挖掘具有決策指導意義,它可以分析企業(yè)的融資趨勢,挖掘潛在途徑,提高企業(yè)融資的成功率。
參考文獻:
[1]焦李成,劉芳等.智能數(shù)據(jù)挖掘與知識發(fā)現(xiàn).西安電子科技大學出版社,2006:431~433.
[2]K.P.Soman Diwakar V.Ajay. 數(shù)據(jù)挖掘基礎教程.北京:機械工業(yè)出版社,2009:120~127.
[3]朱德利1SQL Server 2005 數(shù)據(jù)挖掘與商業(yè)智能完全解決方案[M].北京:電子工業(yè)出版社,2007:367~3681.
關鍵字:財務,江蘇,連云港,連云區(qū)