[轉(zhuǎn)] 劉鐵斌:行業(yè)數(shù)據(jù)治理對市場發(fā)展的意義
和訊期貨消息 由中國期貨業(yè)協(xié)會與深圳市人民政府共同舉辦的“第11屆中國(深圳)國際期貨大會”于12月3日―12月5日在深圳召開。
本屆中國(深圳)國際期貨大會與往屆相比形式更加豐富多元,以“跨界、跨境、跨越”為主題,邀請了梅拉梅德等全球頂尖的金融衍生品專家、學(xué)者及深圳市政府及證監(jiān)會領(lǐng)導(dǎo)、國內(nèi)外主要交易所、金融企業(yè)、上市公司等領(lǐng)袖精英參會。大會將圍繞“如何更好地服務(wù)實體經(jīng)濟風險管理,促進期貨與現(xiàn)貨、境內(nèi)與境外、場內(nèi)與場外、線上與線下的互聯(lián)互通以及金融混業(yè)、跨界融合的發(fā)展”等業(yè)界關(guān)心的重大課題深入研討。和訊期貨參與現(xiàn)場直播。
中國證監(jiān)會信息中心副主任劉鐵斌先生進行發(fā)言,他的演講題目是“行業(yè)數(shù)據(jù)治理對市場發(fā)展的意義”。劉主任對行業(yè)信息技術(shù)十分熟悉,對行業(yè)數(shù)據(jù)治理分析也非常透徹、全面,做好期貨行業(yè)數(shù)據(jù)治理對于市場發(fā)展具有非常重要的意義。
以下為文字實錄:
劉鐵斌:尊敬的各位領(lǐng)導(dǎo)、各位嘉賓,大家上午好!這次應(yīng)小國會長的邀請讓我講行業(yè)數(shù)據(jù)治理對市場發(fā)展的意義,這項工作對我們行業(yè)是非常重要的,而且這項工作是由很多專家來完成的,我在這里是對這項工作進行總結(jié)和匯報。這是今天要講的三個方面內(nèi)容,一個是行業(yè)數(shù)據(jù)治理的概述,第二是專業(yè)領(lǐng)域的介紹,第三方面是展望。
首先跟大家匯報一下行業(yè)信息化現(xiàn)階段重點工作,主要是分成四個方面:首先是行業(yè)開源聯(lián)盟,今年以來我們成立了行業(yè)的開源聯(lián)盟,成立了相應(yīng)的開源開放的小組。主要的目的是為了將來在信息技術(shù)方面能夠做到完全自主可控。開源聯(lián)盟對我們行業(yè)未來發(fā)展的意義非常重大,這是我們未來開展工作的一個重點。第二方面是行業(yè)網(wǎng)絡(luò)治理,這是以證聯(lián)網(wǎng)為基礎(chǔ),去年上半年我們已經(jīng)建立了行業(yè)的證聯(lián)網(wǎng),行業(yè)所有的機構(gòu),包括證監(jiān)會及其派出機構(gòu),所有的市場核心機構(gòu)、證券期貨基金公司都接入了證聯(lián)網(wǎng)。現(xiàn)在已經(jīng)有十幾家存款銀行剛剛接入證聯(lián)網(wǎng)進行系統(tǒng)測試,很快就能夠?qū)崿F(xiàn)在證聯(lián)網(wǎng)內(nèi)的轉(zhuǎn)賬業(yè)務(wù)。證聯(lián)網(wǎng)將來是除了交易以外行業(yè)的一個通信專網(wǎng),以后所有的數(shù)據(jù)存儲,數(shù)據(jù)中心也是通過證聯(lián)網(wǎng)來存儲數(shù)據(jù),包括行業(yè)的實驗室、測試中心,以及將來在證聯(lián)網(wǎng)當中還要建立一個測試網(wǎng)。這塊未來的發(fā)展會給大家提供更多更好的服務(wù)。第三方面是行業(yè)數(shù)據(jù)治理。第四方面是行業(yè)云服務(wù),大家知道這些年云計算、大數(shù)據(jù)這些新技術(shù)為我們行業(yè)的發(fā)展也帶來很多推動作用。尤其是在云服務(wù)方面,實際上行業(yè)外的機構(gòu)在這方面做得非常好,包括恒生的金融云,包括京東等等,他們做的云服務(wù)也非常好。我想更家重要的是我們行業(yè)內(nèi)的云服務(wù),這牽扯到行業(yè)的數(shù)據(jù)安全問題。所以我們非常鼓勵行業(yè)內(nèi)核心機構(gòu)積極承擔起行業(yè)內(nèi)私有云的建設(shè),能夠為行業(yè)所有的機構(gòu)提供更好的服務(wù)。
數(shù)據(jù)治理是對數(shù)據(jù)資產(chǎn)管理行使權(quán)力和控制的活動集合,包括規(guī)劃、監(jiān)控和執(zhí)行。它包括很多,數(shù)據(jù)質(zhì)量管理、數(shù)據(jù)架構(gòu)管理、數(shù)據(jù)開發(fā)等八個方面。另外可以從戰(zhàn)略、組織與角色、政策和標準、項目和服務(wù)、問題、估值等方面進行數(shù)據(jù)治理的活動??梢哉f數(shù)據(jù)是最核心的資產(chǎn)。尤其在當前來講,數(shù)據(jù)安全是最重要的組成部分。所以我們也要求行業(yè)內(nèi)所有的機構(gòu)一定要做到數(shù)據(jù)的三點存放,本地、同城和異地存放。我們現(xiàn)在也對數(shù)據(jù)進行分級分類管理。
數(shù)據(jù)治理的意義有四個方面:首先是有利于行業(yè)數(shù)據(jù)統(tǒng)一,這對行業(yè)來講是非常重要的。后面所進行的一系列工作都是為了行業(yè)的數(shù)據(jù)統(tǒng)一。第二是促進行業(yè)標準化發(fā)展,降低數(shù)據(jù)交換成本。第三是便于通過數(shù)據(jù)特征發(fā)現(xiàn)市場異動,有效助力監(jiān)管的決策。第四是推動資本市場業(yè)務(wù)功能發(fā)揮。
數(shù)據(jù)治理的戰(zhàn)略目標是全面建成具有國際先進水平的資本市場數(shù)據(jù)治理體系,支持多層次資本市場建設(shè),為推進跨市場互聯(lián)互通,促進市場集約高效運行,降低市場成本,提升監(jiān)管效能,保障市場信息系統(tǒng)安全穩(wěn)定運行奠定基礎(chǔ)。這是數(shù)據(jù)治理的戰(zhàn)略目標。我們主要是從五個方面進行數(shù)據(jù)治理的工作。
我先給大家介紹一下標準化的工作,這是跟數(shù)據(jù)治理息息相關(guān)的。證標委是國標委領(lǐng)導(dǎo)下的金標委下面的期貨分委會,證標委的工作是非常出色和優(yōu)秀的,尤其是這兩年來我們通過劃分11個專業(yè)領(lǐng)域,我們成立了11個標準化工作組,每一個工作組有一位首席專家來引領(lǐng)這個領(lǐng)域的標準化工作。包括數(shù)據(jù)治理的五個方面,數(shù)據(jù)模型、基礎(chǔ)編碼、信息披露、機構(gòu)間接口和機構(gòu)內(nèi)接口。還有三個業(yè)務(wù)標準化工作組。還有系統(tǒng)安全和數(shù)據(jù)安全。這11個工作組最近是制定未來3-5年的標準化工作,我們要制定多少標準,未來標準化工作怎么發(fā)展,這是我們證標委所做的重要工作。從專業(yè)領(lǐng)域分類是五個方面,基礎(chǔ)編碼類,接口標準類包括數(shù)據(jù)模型、機構(gòu)間接口、機構(gòu)內(nèi)接口和信息披露。
行業(yè)數(shù)據(jù)的特點有八個方面,一個是標準化程度高,對整體性要求要求高,對業(yè)務(wù)持續(xù)性要求高,對外部環(huán)境依賴度高,變動頻繁,主體分散。我們有17家市場分析機構(gòu),有370多家市場經(jīng)營機構(gòu),同時還和行業(yè)外有很多數(shù)據(jù)交換。發(fā)展時間短,期貨交易市場發(fā)展了20多年,是一個新興產(chǎn)業(yè),但是數(shù)據(jù)的量是相當大的,每天產(chǎn)生的數(shù)據(jù)以T來計算。影響面也很大,尤其是證券行業(yè)交易行情的波動對整個社會的影響也相當大。今年就出現(xiàn)很多問題,行情波動的時候監(jiān)管部門要數(shù)據(jù),各個交易所報上來的數(shù)據(jù)都不一樣,在同一個項目上報的數(shù)據(jù)不一致,理解不一樣,導(dǎo)致監(jiān)管部門收集數(shù)據(jù)相當困難,很難得到真實準確的數(shù)據(jù),所以很難得出供決策參考的依據(jù)。
這是我們編制的行業(yè)頂層數(shù)據(jù)流圖和主要中介機構(gòu)的機構(gòu)內(nèi)數(shù)據(jù)流圖。大家可以看到所有的這些線都是機構(gòu)之間數(shù)據(jù)交換的數(shù)據(jù)流圖,非常復(fù)雜。這個工作主要是監(jiān)管中心的謝部長帶領(lǐng)大家完成,工作也相當有效。行業(yè)數(shù)據(jù)治理包括這五個方面,首先給大家介紹一下行業(yè)編碼。這5個專業(yè)工作組18項具體的工作任務(wù)?;A(chǔ)編碼類工作是相當重要的,它主要的內(nèi)容是研究規(guī)劃行業(yè)的基礎(chǔ)編碼體系,組織制定行業(yè)編碼體系制定工作指南和一系列基礎(chǔ)編碼標準。現(xiàn)在已經(jīng)在做的,包括證券期貨市場的金融產(chǎn)品、金融衍生品、參與機構(gòu)、投資者、賬戶、相關(guān)金融工具等分類及編碼標準、規(guī)范以及相關(guān)的規(guī)范和工作指引。
這幾個工作組都在做一個事情,要規(guī)劃出來這個領(lǐng)域到底需要做多少標準。各個專業(yè)工作組首先按照幾個維度對整個領(lǐng)域的工作進行策劃,所以在這里面就是按照三個維度,按照參與人、產(chǎn)品和場所做出一個相當于三維的模型,把所有需要制定的標準點都找出來,找出來以后再來確定哪些節(jié)點需要做標準。然后從這個過程當中再提煉出來我們認為必須要制定的標準關(guān)鍵節(jié)點。按照這三個維度理出了大體的,后面還有很多表,今天只是簡要地介紹一下。
行業(yè)數(shù)據(jù)模型,這個工作是具有開創(chuàng)意義的一項工作,在國際上還沒有對證券期貨行業(yè)的數(shù)據(jù)進行完整的梳理。這里我會稍微多一點介紹這個工作。它是以證券期貨行業(yè)相關(guān)的法律法規(guī)、業(yè)務(wù)規(guī)則、制度及流程為依據(jù),以交易、監(jiān)管、披露三大業(yè)務(wù)線條為切入點,完成對行業(yè)中各種業(yè)務(wù)的全面遍歷。根據(jù)行業(yè)頂層數(shù)據(jù)流圖及機構(gòu)內(nèi)數(shù)據(jù)流圖來提取市場全業(yè)務(wù)流程與數(shù)據(jù)共性,形成真正意義上統(tǒng)一、完備的具有通用性、穩(wěn)定性和拓展性的資本市場多層次數(shù)據(jù)模型。這里分成三部分,抽象模型、邏輯模型到物理模型。抽象模型是規(guī)范和指導(dǎo)數(shù)據(jù)治理,統(tǒng)一各種協(xié)議、接口、編碼、報文格式等技術(shù)標準,建立基于數(shù)據(jù)模型的行業(yè)技術(shù)標準體系。邏輯模型是形成可以直接物理化的表,便于各單位應(yīng)用系統(tǒng)物理化建設(shè)。我們現(xiàn)在做的工作邏輯模型這塊已經(jīng)基本上完成,下一步就是從邏輯模型再到物理模型,會制定很多表格供大家使用。
這個是行業(yè)數(shù)據(jù)模型總體的方法論,是通過行業(yè)的頂層數(shù)據(jù)流圖來識別業(yè)務(wù)點,梳理數(shù)據(jù)模型。通過主體行為關(guān)系這個表,通過交易、監(jiān)管和信息披露這三個方面,最后分類、分層描繪產(chǎn)出物。下面這個就是數(shù)據(jù)模型的公式,P1就是所有的交易、監(jiān)管、信息披露,所有共性的數(shù)據(jù)組成P1這個集合。P2是說這三個部分各自的數(shù)據(jù)。P3就是每一個部分自有的數(shù)據(jù),沒有重復(fù)使用過的數(shù)據(jù)。交易模型是從品種出發(fā),以CFI為依據(jù),結(jié)合國內(nèi)資本市場現(xiàn)狀梳理出能覆蓋國內(nèi)現(xiàn)有證券品種的品種樹,并從品種樹入手,對各品種分別按照行為、過程、進行遍歷,提取數(shù)據(jù)模型的方法。監(jiān)管模型不一樣,它是以相關(guān)的法律法規(guī)為依據(jù),對監(jiān)管對象、監(jiān)管主題、監(jiān)管方式進行三維分析,并在此基礎(chǔ)上梳理出數(shù)據(jù)模型的方法。披露模型是基于信息披露模板,通過映射模板制定出語義獨立的數(shù)據(jù)表,提煉數(shù)據(jù)項和數(shù)據(jù)表,充足后進行邏輯推演和測試驗證,回歸迭代后形成數(shù)據(jù)模型的方法。
數(shù)據(jù)模型分成四類數(shù)據(jù),一個是原子數(shù)據(jù),業(yè)務(wù)上獨立的,能夠從行業(yè)模型構(gòu)建的角度不需要再分的最小數(shù)據(jù)單元。復(fù)合數(shù)據(jù)是原子數(shù)據(jù)通過某種關(guān)系組合或加工而成,依照復(fù)合方式可分為結(jié)構(gòu)性復(fù)合數(shù)據(jù)、計算類復(fù)合數(shù)據(jù)。可復(fù)用數(shù)據(jù)表由原子數(shù)據(jù)或復(fù)合數(shù)據(jù)組合的集合,并可在多個業(yè)務(wù)場景中被重復(fù)使用。語義上獨立的數(shù)據(jù)表是由以上三者組合而成的集合。
這個是數(shù)據(jù)模型成果之一,模型產(chǎn)出物,包括公共類、有品種屬性、主體分類和財務(wù)主表,還有包括交易、監(jiān)管和披露。從邏輯模型看,行業(yè)屬性代碼,然后是六類機構(gòu)。數(shù)據(jù)模型的成果之二就是模型管理平臺,我們現(xiàn)在做了一個自動化的模型管理平臺,這個平臺具有很強大的功能,可以采集數(shù)據(jù),這個數(shù)據(jù)是通過文件形式,包括Excel表以及特定的文件形式錄到數(shù)據(jù)庫,在入庫當中也有檢查的?,F(xiàn)在做標準化工作,以前標準化工作是這么做的,哪個機構(gòu)想做標準了提出申請給證標委,證標委覺得可以,然后請證標委所有委員審議,委員沒有意見就做標準。標準不會做任何參考,我自己有哪些數(shù)據(jù)項列完以后就去做。另外的標準流程也是這么做?,F(xiàn)在進行對比會發(fā)現(xiàn),這兩個標準之間,同樣的數(shù)據(jù)項定義不一樣,英文標識不一樣,很難進行借鑒。這是我們證標委中重大的問題。為什么要搞數(shù)據(jù)模型,就是要把數(shù)據(jù)統(tǒng)一,原子數(shù)據(jù)統(tǒng)一。以后制定標準,標準化工作組先到數(shù)據(jù)庫當中,到模型管理平臺中看,我所要定義的數(shù)據(jù)項在數(shù)據(jù)庫里有沒有,有的話就直接接入,沒有的話就自己新定義,定義完了以后新的數(shù)據(jù)項入庫。這樣就能夠使行業(yè)的數(shù)據(jù)做到同一個數(shù)據(jù)項是唯一的,描述完整的。這個引擎還可以進行全文檢索,里面有相關(guān)的系統(tǒng)參數(shù)配置、日志審計和數(shù)據(jù)到處等等。這個過程包括采集過程、評審管理、模型展示,里面包括頂層流圖還有文件方式,因為將來還會有一些表格在里面。這個版本也經(jīng)常在更新,現(xiàn)在模型管理平臺是1.0版本,后面馬上要搞2.0版本。尤其是以后通過網(wǎng)站,現(xiàn)在有中國證券期貨信息網(wǎng),大家以后在制定標準過程中,或者在其他的工作中都可以上這個平臺進行查詢。
為進一步劃分多視角邏輯模型,這個是“1+6”的方式。這個是數(shù)據(jù)模型服務(wù)行業(yè)標準化,前期的編制,中期的評審和后期的發(fā)布,通過這三個步驟。模型現(xiàn)在在進行第二期的工作,第一期大部分的數(shù)據(jù)都已經(jīng)理出來了,下面第二期的工作結(jié)合新的信息披露,現(xiàn)在很多新的業(yè)務(wù)推出,所以新的模型也要加入進來,新的數(shù)據(jù)要進行收集。同時第二期工作主要是把邏輯模型向物理模型轉(zhuǎn)換,同時還要寫一本書,在國內(nèi)要組織行業(yè)內(nèi)的宣傳,和一些廠家進行溝通和交流,最后來進行推廣。
機構(gòu)間接口標準是以行業(yè)內(nèi)的數(shù)據(jù)通信協(xié)議應(yīng)用指南為依據(jù),從業(yè)務(wù)類別、報文類別、數(shù)據(jù)類別、傳輸類別四個切入點進行分析歸納。在這里有一個分類,從交易、結(jié)算、信息披露、監(jiān)管報送、行業(yè)間以及其他,我們用了比較多的FIX、FTD,結(jié)算是ISO20022,信息披露是XBRL?,F(xiàn)在行業(yè)內(nèi)主要的國標是XBRL系列,現(xiàn)在有5個國標。現(xiàn)在這一塊還在做通用數(shù)據(jù)交換標準,現(xiàn)在是剛剛立項。機構(gòu)內(nèi)的數(shù)據(jù)交換,對機構(gòu)來講意義是非常重大的,現(xiàn)在每個機構(gòu)可能有幾十套系統(tǒng),少的十幾套,多的幾十套系統(tǒng)。機構(gòu)內(nèi)部的系統(tǒng)如何進行數(shù)據(jù)交換也非常重要。很多機構(gòu)是自己開發(fā)、自己做的話確實力不從心。所以在這一塊證標委也做了大量的工作,我們也搞了相應(yīng)的交換機構(gòu)。這是企業(yè)內(nèi)部的信息交換總線,通過建立機構(gòu)內(nèi)部數(shù)據(jù)交換平臺達到數(shù)據(jù)統(tǒng)一交換標準。
信息披露在現(xiàn)在資本市場中是相當重要的,將來注冊制主要是以信息披露為主,今后對上市公司,對經(jīng)營機構(gòu)的監(jiān)管事中事后監(jiān)管也是以信息披露為抓手。所以我們行業(yè)的信息披露,現(xiàn)在的數(shù)據(jù)量大,種類繁多,包括數(shù)據(jù)模型制定也花了大量的精力和做了大量的工作。信息披露的業(yè)務(wù)范圍也有分級,有向公眾披露的信息,有向監(jiān)管機構(gòu)、自律組織披露的信息,也有向特定對象披露的信息。我們現(xiàn)在這個階段做的是物、分類等公共部分,基金信息披露,上市公司和非上市公司信息披露和股票發(fā)行注冊的信息披露。股票發(fā)行注冊這塊滬深交易所在做,所以這塊的信息披露工作正在收集,到底要披露哪些內(nèi)容,兩個交易所也制定了很多指引,在信息披露上兩個交易所都制定了十多個指引。信息披露的方法論,通過映射、提煉、重組和回歸,經(jīng)過多次迭代以后形成最終的信息披露數(shù)據(jù)模型。
未來工作展望,行業(yè)基礎(chǔ)編碼類要跟蹤行業(yè)基礎(chǔ)編碼方面的最新發(fā)展態(tài)勢,按需修正基礎(chǔ)編碼體系規(guī)劃,規(guī)范相關(guān)標準的制定工作。行業(yè)數(shù)據(jù)模型還是要進一步梳理形成業(yè)務(wù)全覆蓋的抽象模型,針對六大用戶視角梳理邏輯模型,繼續(xù)建設(shè)行業(yè)數(shù)據(jù)治理平臺,推進模型應(yīng)用,支持中央監(jiān)管信息平臺建設(shè),中央監(jiān)管信息平臺我多介紹一下,這個監(jiān)管信息平臺歷時三年左右的時間把行業(yè)內(nèi)所有的數(shù)據(jù)報送,所有的監(jiān)管工作都放在這么一個監(jiān)管信息平臺上。所以數(shù)據(jù)治理最開始要做的想法就是要支持中央監(jiān)管信息平臺,這么大一個平臺,包括證監(jiān)會幾十個部門,包括十幾家核心機構(gòu),包括幾百家經(jīng)營機構(gòu)的數(shù)據(jù)都要匯總到這個信息平臺里面,而且這個信息平臺有很多監(jiān)管職能,所以一定要做到數(shù)據(jù)統(tǒng)一。另外是為行業(yè)標準提供素材和審核,數(shù)據(jù)模型推廣和國際化。機構(gòu)間接口標準未來有這么多的任務(wù),我就不一一贅述了。機構(gòu)內(nèi)接口標準從五個域來進行標準的制定工作。行業(yè)信息披露主要做的包括新會計準則的對接,股票公開發(fā)行注冊制信息披露模型,??產(chǎn)品信息披露模型,還有一些其他的。
總體來講行業(yè)數(shù)據(jù)治理工作對我們行業(yè)來說意義非常重大,它首先把數(shù)據(jù)進行收集,然后歸類,然后模型化。其實對我們行業(yè)來講,大數(shù)據(jù)的應(yīng)用現(xiàn)在還為時過早,因為我們行業(yè)的數(shù)據(jù)主要是結(jié)構(gòu)化數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù)不是很多。但是行業(yè)數(shù)據(jù)的收集、治理工作也非常重要,數(shù)據(jù)不斷地收集,達到一定的量,通過幾十年的數(shù)據(jù)收集,我們能從中得出很多有價值的,可以利于我們未來發(fā)展的很重要的信息。所以這個工作是一個持久的工作,對每個機構(gòu)也相當重要,機構(gòu)自己的客戶數(shù)據(jù)、經(jīng)營數(shù)據(jù)如何更好地保存和應(yīng)用,都是未來發(fā)展技術(shù)支持業(yè)務(wù)發(fā)展一個非常重要的抓手。我們在這方面工作,整個行業(yè)來講工作做得還是不夠的。這一兩年證標委首先先帶動整個行業(yè)的數(shù)據(jù)治理工作,也希望大家能夠積極參與到這個工作中來,尤其對自己機構(gòu)內(nèi)部的數(shù)據(jù)如何妥善地保存和利用,可以借鑒上述這些方法。這些方法也不一定是完全準確和正確的,我們在不斷地編制模型過程當中,把模型應(yīng)用到實際工作中也會糾正之前的一些偏差,不一定是完全正確的。但是在目前現(xiàn)階段來講可能還是比較有效的。所以今后也希望大家對我們這個工作多提寶貴意見,多多參與。我今天就介紹到里,謝謝大家!
本文僅代表作者本人觀點,與本網(wǎng)站無關(guān)。本網(wǎng)站對文中陳述、觀點判斷保持中立,不對所包含內(nèi)容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。
您需要 [注冊] 或 [登陸] 后才能發(fā)表點評