摘要: 數據挖掘是從大量數據中提取或“挖掘”知識。在大量的數據中發現有趣的模式,其中數據是可以存放在數據庫、數據倉庫或其他信息庫中。數據挖掘是一個年輕的跨學科領域,源於諸如數據庫系統、數據倉庫、統計學、機器學...

金融風險預警是金融數據挖掘中的一個重要研究方向,由於金融數據具有類型多樣、關係複雜、 數據動態性、數據量大等一般特徵,此外還有高噪音、非正態等特徵。因此,金融風險預警更有挑戰性。運用數據挖掘技術能夠從海量的金融數據中發現隱藏在其背後的規律,有效地降低金融機構的運營風險。因此數據挖掘在金融風險預警有著廣闊的應用價值和市場前景。

金融風險管理
金融風險指任何可能導致企業或機構財物損失的風險,是企業未來收益的不確定性與波動性。按照金融風險產生根源可將金融風險分為靜態與動態兩類;按風險涉及範圍可分為微觀金融風險與宏觀金融風險;按照金融機構類別可分為銀行風險、證券風險、保險風險與信託風險等。通過對風險的衡量與認識,採取相應措施與處置方案使得風險最低和利潤最大化。可見,金融風險管理是調節金融投資安全性與收益性均衡的一種金融管理方法。

認識數據挖掘

1. 數據挖掘概念
數據挖掘是從大量數據中提取或“挖掘”知識。在大量的數據中發現有趣的模式,其中數據是可以存放在數據庫、數據倉庫或其他信息庫中。數據挖掘是一個年輕的跨學科領域,源於諸如數據庫系統、數據倉庫、統計學、機器學習、數據可視化、信息檢索和高性能計算。其他的貢獻領域包括神經網絡、模式識別、空間數據分析、圖像數據庫、信號處理和許多應用領域,如商務、經濟學和生物信息學。

2. 數據挖掘流程
(1)信息收集:根據確定的數據分析對象,抽像出在數據分析中所需要的特徵信息,然後選擇合適的信息收集方法,將收集到的信息存入數據庫。對於海量數據,選擇一個合適的數據存儲和管理的數據倉庫是至關重要的。

(2)數據集成:把不同來源、格式、特點性質的數據在邏輯上或物理上有機地集中,從而為企業提供全面的數據共享。

(3) 數據規約:如果執行多數的數據挖掘算法,即使是在少量數據上也需要很長的時間,而做商業運營數據挖掘時數據量往往非常大。數據規約技術可以用來得到數據集的規約表示,它小得多,但仍然接近於保持原數據的完整性,並且規約後執行數據挖掘結果與規約前執行結果相同或幾乎相同。

(4)數據清理:在數據庫中的數據有一些是不完整的(有些感興趣的屬性缺少屬性值)、含噪聲的(包含錯誤的屬性值),並且是不一致的(同樣的信息不同的表示方式),因此需要進行數據清理,將完整、正確、一致的數據信息存入數據倉庫中。不然,挖掘的結果會差強人意。

(5)數據變換:通過平滑聚集、數據概化、規範化等方式將數據轉換成適用於數據挖掘的形式。對於有些實數型數據,通過概念分層和數據的離散化來轉換數據也是重要的一步。

(6)數據挖掘過程:根據數據倉庫中的數據信息,選擇合適的分析工具,應用統計方法、事例推理、決策樹、規則推理、模糊集,甚至神經網絡、遺傳算法的方法處理信息,得出有用的分析信息。

(7)模式評估:從商業角度,由行業專家來驗證數據挖掘結果的正確性。

(8)知識表示:將數據挖掘所得到的分析信息以可視化的方式呈現給用戶,或作為新的知識存放在知識庫中,供其他應用程序使用。

數據挖掘分析方法

 

數據挖掘在金融風險預警中的應用
金融數據挖掘流程

數據挖掘在金融風險預警中典型應用


(1)信用風險評估
數據挖掘對信用風險的評估包括銀行信用卡風險評估和貸款信用評估等。信用風險是由於不可抗拒因素和惡性欺詐等使得債務人無法或不願意履行已籤的合約而給銀行造成的損失。銀行對個人和企業的財務狀況發生變化的過程往往不能及時了解或者說被循環信用掩蓋。而通過數據挖掘技術對客戶信用的影響因素進行挖掘,如地區差異、個人知識層次、收入高低、經濟環境狀況、社會職務等,可以快速建立起用戶信用等級,進而給予不同的信用額度;也可以透徹地揭示信用風險的蘊含關係和特徵,增強對信用違約預測的準確性。

(2)公司財務危機預警分析
財務危機的實質是財務風險規模化、高強度化的集中爆發,主要表現為財務狀況極度惡化,發生支付危機甚至破產倒閉。這些公司都不同程度出現以下狀況: 無力償還到期債務、巨額投資無收益、現金流量入不敷出、產品銷路不暢、存貨大量積壓,主營業務發生嚴重萎縮等。

財務危機預警模型的建立能夠對企業經營失敗和財務管理失誤現象進行預警和早期控制,為決策者、投資者和債權人提供重要信息。數據挖掘中的主成分分析、 Logistic回歸、線性回歸和神經網絡等方法被國內外學者用來建立財務危機預警模型。首先根據主成分分析的特徵向量與主成分貢獻率計算出對於財務狀況影響最大的財務指標,接著根據該分析的結果,把預測期公司的財務狀況分為兩類作為預測的目標變量,然後運用Logistic回歸方法和決策樹方法等進行公司財務狀況進行預測。最後把每家公司綜合評分作為目標變量,運用線性回歸方法和神經網絡方法進行公司財務危機預警分析。

(3)供應鏈風險評估
良好的供應鏈管理可通過資金流、物流和信息流的優化為企業帶來巨大效益,可以使企業有效節約運營成本和縮短反應時間,進而使其服務水平和競爭能力得到提高。供應鏈中任何一個環節的“斷裂”都可能引起鏈上企業的連鎖反應,給企業帶來巨大損失。根據行為主體的不同,供應鏈風險可劃分為供應商風險、生產商風險、物流服務商風險、批發商風險、零售商風險等。

供應商風險作為供應鏈風險的最大起因,常被選為供應鏈風險評估的切入點。通常做法有利用數據挖掘算法確定有效的指標評價體系,建立模糊矩陣,進行聚類分析或BP神經網絡等方法建立供應鏈金融風險評估模型,為供應鏈合作夥伴的選擇提供依據,降低供應鏈風險。

結語
數據挖掘作為深層次的數據信息分析方法,具有傳統評價方法無法具備的對於各種因素之間隱藏的內在聯繫的全面分析。此技術應用於金融風險管理無疑非常有益,可提供風險預警,讓管理者提前做好準備,為決策提供參考信息,因而使企業極大地降低風險和提高競爭力,為企業的長足發展作出貢獻。

 
資料來源:煉數成金

留下你的回應

以訪客張貼回應

0

在此對話中的人們

Popular Tags

每月文章