01 youtube官網 中文新聞數據集使用聚類(大數據在金融行業的應用與挑戰)

时间:2024-05-19 15:53:23 编辑: 来源:

大數據在金融行業的應用與挑戰

大數據在金融行業的應用與挑戰

A 具有四大基本特征

金融業基本是全世界各個行業中最依賴于數據的,而且最容易實現數據的變現。全球最大的金融數據公司Bloomberg在1981年成立時“大數據”概念還沒有出現。Bloomberg的最初產品是投資市場系統(IMS),主要向各類投資者提供實時數據、財務分析等。

隨著信息時代降臨,1983年估值僅1億美元的Bloomberg以30%股份的代價換取美林3000萬美元投資,先后推出Bloomberg Terminal、News、Radio、TV等各類產品。1996年Bloomberg身價已達20億美元,并以2億美元從美林回購了10%的股份。2004年Bloomberg在紐約曼哈頓中心建成246米摩天高樓。到2008年次貸危機,美林面臨崩盤,其剩余20%的Bloomberg股份成為救命稻草。Bloomberg趁美林之危贖回所有股份,估值躍升至225億美元。2016年Bloomberg全球布局192個辦公室,擁有1.5萬名員工,年收入約100億美元,估值約1000億美元,超過同年市值為650億美元的華爾街標桿高盛。

大數據概念形成于2000年前后,最初被定義為海量數據的集合。2011年,美國麥肯錫公司在《大數據的下一個前沿:創新、競爭和生產力》報告中最早提出:大數據指大小超出典型數據庫軟件工具收集、存儲、管理和分析能力的數據集。

具體來說,大數據具有四大基本特征:

一是數據體量大,指代大型數據集,一般在10TB規模左右,但在實際應用中,很多企業用戶把多個數據集放在一起,已經形成了PB級的數據量。

三是處理速度快,在數據量非常龐大的情況下,也能夠做到數據的實時處理。數據處理遵循“1秒定律”,可從各種類型的數據中快速獲得高價值的信息。

四是數據的真實性高,隨著社交數據、企業內容、交易與應用數據等新數據源的興起,傳統數據源的局限被打破,信息的真實性和安全性顯得極其重要。

而相比其他行業,金融數據邏輯關系緊密,安全性、穩定性和實時性要求更高,通常包含以下關鍵技術:數據分析,包括數據挖掘、機器學習、人工智能等,主要用于客戶信用、聚類、特征、營銷、產品關聯分析等;數據管理,包括關系型和非關系型數據、融合集成、數據抽取、數據清洗和轉換等;數據使用,包括分布式計算、內存計算、云計算、流處理、任務配置等;數據展示,包括可視化、歷史流及空間信息流展示等,主要應用于對金融產品健康度、產品發展趨勢、客戶價值變化、反洗錢反欺詐等監控和預警。

B 重塑金融行業競爭新格局

“互聯網+”之后,隨著世界正快速興起“大數據+”,金融行業悄然出現以下變化:

大數據特征從傳統數據的“3個V”增加到“5個V”。在數量(Volume)、速度(Velocity)、種類(Variety)基礎上,進一步完善了價值(Value)和真實性(Veracity),真實性包括數據的可信性、來源和信譽、有效性和可審計性等。

金融業按經營產品分類變為按運營模式分類。傳統金融業按經營產品劃分為銀行、證券、期貨、保險、基金五類,隨著大數據產業興起和混業經營的發展,現代金融業按運營模式劃分為存貸款類、投資類、保險類三大類別。

大數據市場從壟斷演變為充分市場競爭。全球大數據市場企業數量迅速增多,產品和服務的差異增大,技術門檻逐步降低,市場競爭日益激烈。行業解決方案、計算分析服務、存儲服務、數據庫服務和大數據應用成為市場份額排名最靠前的五大細分市場。

大數據形成新的經濟增長點。Wikibon數據顯示,2016年,全球大數據硬件、軟件和服務整體市場增長22%達到281億美元,預計到2027年,全球在大數據硬件、軟件和服務上的整體開支的復合年增長率為12%,將達到大約970億美元。

數據和IT技術替代“重復性”業務崗位。數據服務公司Eurekahedge通過追蹤23家對沖基金,發現5位對沖基金經理薪金總額為10億美元甚至更高。過去10年,靠數學模型分析金融市場的物理學家和數學家“寬客”一直是對沖基金的寵兒,其實大數據+人工智能更精于此道。高盛的紐約股票現金交易部門2000年有600名交易員而如今只剩兩人,其任務全由機器包辦,專家稱10年后高盛員工肯定比今天還要少。

美國大數據發展走在全球前列。美國政府宣稱:“數據是一項有價值的國家資本,應對公眾開放,而不是將其禁錮在政府體制內。”作為大數據的策源地和創新引領者,美國大數據發展一直走在全球最前列。自20世紀以來,美國先后出臺系列法規,對數據的收集、發布、使用和管理等做出具體的規定。2009年,美國政府推出Data.買粉絲政府數據開放平臺,方便應用領域的開發者利用平臺開發應用程序,滿足公共需求或創新創業。2010年,美國國會通過更新法案,進一步提高了數據采集精度和上報頻度。2012年3月,奧巴馬政府推出《大數據研究與開發計劃》,大數據迎來新一輪高速發展。

英國是歐洲金融中心,大數據成為其領先科技之一。2013年,英國投資1.89億英鎊發展大數據。2015年,新增7300萬英鎊,創建了“英國數據銀行”data.買粉絲.uk網站。2016年,倫敦舉辦了超過22000場科技活動,同年,英國數字科技投資逾68億英鎊,而收入則超過1700億英鎊。另外,英國統計局利用政府資源開展“虛擬人口普查”,僅此一項每年節省5億英鎊經費。

C 打造高效金融監管體系

大數據用已發生的總體行為模式和關聯邏輯預測未來,決策未來,作為現代數字科技的核心,其靈魂就是——預測。

偵測、打擊逃稅、洗錢與金融詐騙

全球每年因欺詐造成的經濟損失約3.7萬億美元,企業因欺詐受損通常為年營收額的5%。全球最大軟件公司之一美國SAS公司與稅務、海關等政府部門和全球各國銀行、保險、醫療保健等機構合作,有效應對日益復雜化的金融犯罪行為。如在發放許可之前,通過預先的數據分析檢測客戶是否有過行受賄、欺詐等前科,再確定是否發放借貸或海關通關。SAS開發的系統已被國際公認為統計分析的標準軟件,在各領域廣泛應用。英國政府利用大數據檢測行為模式檢索出200億英鎊的逃稅與詐騙,追回了數十億美元損失。被福布斯評為美國最佳銀行的德克薩斯資本銀行(TCBank),不斷投資大數據技術,反金融犯罪系統與銀行發展同步,近3年資產從90億美元增至210億美元。荷蘭第三大人壽保險公司CZ依靠大數據對騙保和虛假索賠行為進行偵測,在支付賠償金之前先期阻斷,有效減少了欺詐發生后的司法補救。

大數據風控建立客戶信用評分、監測對照體系

美國注冊舞弊審核師協會(ACFE)統計發現,缺乏反欺詐控制的企業會遭受高額損失。美國主流個人信用評分工具FICO能自動將借款人的歷史資料與數據庫中全體借款人總體信用習慣相比較,預測借款人行為趨勢,評估其與各類不良借款人之間的相似度。美國SAS公司則通過集中瀏覽和分析評估客戶銀行賬戶的基本信息、歷史行為模式、正在發生行為模式(如轉賬)等,結合智能規則引擎(如搜索到該客戶從新出現的國家為特有用戶轉賬,或在新位置在線交易等),進行實時反欺詐分析。

美國一家互聯網信用評估機構通過分析客戶在Facebook、Twitter等社交平臺留下的信息,對銀行的信貸和投保申請客戶進行風險評估,并將結果出售給銀行、保險公司等,成為多家金融機構的合作伙伴。

D 數據整合困難

應用經濟指標預測系統分析市場走勢

IBM使用大數據信息技術成功開發了“經濟指標預測系統”,該系統基于單體數據進行提煉整合,通過搜索、統計、分析新聞中出現的“新訂單”等與股價指標有關的單詞來預測走勢,然后結合其他相關經濟數據、歷史數據分析其與股價的關系,從而得出行情預測結果。

追蹤社交媒體上的海量信息評估行情變化

當今搜索引擎、社交網絡和智能手機上的微博、買粉絲、論壇、新聞評論、電商平臺等每天生成幾百億甚至千億條文本、音像、視頻、數據等,涵蓋廠商動態、個人情緒、行業資訊、產品體驗、商品瀏覽和成交記錄、價格走勢等,蘊含巨大財富價值。

2011年5月,規模為4000萬美元的英國對沖基金DC Markets,通過大數據分析Twitter的信息內容來感知市場情緒指導投資,首月盈利并以1.85%的收益率一舉戰勝其他對沖基金僅0.76%的平均收益率。

美國佩斯大學一位博士則利用大數據追蹤星巴克、可口可樂和耐克公司在社交媒體的圍觀程度對比其股價,證明Facebook、Twitter和 Youtube上的粉絲數與股價密切相關。

提供廣泛的投資選擇和交易切換

利用云端數據庫為客戶提供記賬服務

日本財富管理工具商Money Forward提供云基礎記賬服務,可管理工資、收付款、寄送發票賬單、針對性推送理財新項目等,其軟件系統連接并整合了2580家各類金融機構的各類型帳戶,運用大數據分析的智能儀表盤顯示用戶當前財富狀況,還能分析用戶以往的數據以預測未來的金融軌跡。目前其已擁有50萬商家和350萬個體用戶,并與市值2.5萬億美元的山口金融集團聯合開發新一款APP。

為客戶定制差異化產品和營銷方案

一些海外銀行圍繞客戶“人生大事”,分析推算出大致生活節點,有效激發其對高價值金融產品的購買意愿。如一家澳大利亞銀行通過大數據分析發現,家中即將誕生嬰兒的客戶對壽險產品的潛在需求最大,于是通過銀行卡數據監控準媽媽開始購買保胎藥品和嬰兒相關產品等現象,識別出即將添丁的家庭,精準推出定制化金融產品套餐,受到了客戶的積極響應,相比傳統的短信群發模式大幅提高了成功率。

催生并支撐人工智能交易

“量化投資之王”西蒙斯被公認為是最能賺錢的基金經理人,自1988年創立文藝復興科技公司的旗艦產品——大獎章基金以來,其憑借不斷更新完善的大數據分析系統,20年中創造出35%的年均凈回報率,比索羅斯同期高10%,比股神巴菲特同期高18%,成為有史以來最成功的對沖基金,并于1993年基金規模達2.7億美元時停止接受新投資。在美國《Alpha》雜志每年公布的對沖基金經理排行榜上,西蒙斯2005年、2006年分別以15億美元、17億美元凈收入穩居全球之冠,2007年以13億美元位列第五,2008年再以25億美元重返榜首。

推動金融產品和服務創新

E 面臨三大挑戰

據統計,2015年中國的數據總量達到1700EB以上,同比增長90%,預計到2020年這一數值將超過8000EB。以銀行業為例,每創收100萬元,銀行業平均產生130GB的數據,數據強度高踞各行業之首。但在金融企業內部數據處于割裂狀態,業務條線、職能部門、渠道部門、風險部門等各個分支機構往往是數據的真正擁有者,缺乏順暢的共享機制,導致海量數據往往處于分散和“睡眠”狀態,雖然金融行業擁有的數據量“富可敵國”,但真正利用時卻“捉襟見肘”。

數據安全暗藏隱患

大數據本質是開放與共享,但如何界定、保護個人隱私權卻成為法律難題。大數據存儲、處理、傳輸、共享過程中也存在多種風險,不僅需要技術手段保護,還需相關法律法規規范和金融機構自律。多項實際案例表明,即使無害的數據大量囤積也會滋生各種隱患。安全保護對象不僅包括大數據自身,也包含通過大數據分析得出的知識和結論。在線市場平臺英國Handshake.uk.買粉絲就嘗試允許用戶協商個人數據被品牌分享

搜索关键词: