農林漁牧網

您現在的位置是:首頁 > 農業

高書生:主權鏈呼之欲出

2023-01-12由 人民資訊 發表于 農業

資料庫兩個表如何關聯

本文轉自:文化產業評論微信公眾號

誕生於2008年的區塊鏈,文化領域應用較早的,應該是版權保護。當數字藏品風靡市場,專門為數字藏品量身定做的聯盟鏈,相繼登場亮相。當區塊鏈融入標識解析體系,作為文化數字化“底座”的ISLI,就被賦予新的使命與功能——主權鏈,對接各種聯盟鏈,支援同構和異構區塊連結入,將區塊資訊相關資料嵌入標識編碼,匯入ISLI註冊系統,由國家文化大資料標識註冊中心永久儲存。

作者 | 高書生(中宣部文改辦原副主任、一級巡視員,中國公共關係協會文化大資料產業委員會副主任委員)

編審 | 時光

編輯 | 半島

根據中辦國辦《關於推進實施國家文化數字化戰略的意見》“加強標識解析體系建設,推廣資訊與文獻相關國際標準”工作要求,近日,中國公共關係協會文化大資料產業委員會印發《國家文化大資料標識註冊管理辦法(試行)》,目的是規範國家文化大資料標識解析服務,保護使用者合法權益,保障國家意識形態安全和文化安全,推動國家文化大資料體系建設。

高書生:主權鏈呼之欲出

打牢文化數字化“底座”

提起標識解析,估計很多人會感到陌生,但對網際網路域名解析應該很熟悉。當用戶訪問一個網站,需要輸入域名,比如伏羲雲,伺服器會把域名解析到一個IP地址。通俗地說,將便於記憶的域名轉換為機器可以識別的IP地址,這個過程就叫域名解析。域名的解析是由DNS伺服器完成的。

不同於網際網路域名解析,文化數字化採用標識解析。

標識編碼是標識解析的基礎。所謂標識編碼,就是給每一個數據分配唯一可讀的識別符號,這個識別符號類似於“身份證”。迄今為止,國際標準化組織(ISO)在資訊與文獻領域釋出了12項識別符號國際標準,比如每本書的書號,採用的是ISBN,每種雜誌的刊號,採用的是ISSN。ISBN和ISSN都是國際標準化組織釋出的識別符號國際標準。2015年,國際標準化組織釋出ISO 17316:2015 Information and documentation-International Standard Link Identifier(簡稱ISLI,ISO為國際標準化組織,17316為標準代號,2015 是標準的版本/年號),這是由我國提案建立的資訊與文獻國際標準,也是資訊與文獻領域唯一標識實體之間關聯關係的全球通用識別符號。

在標準領域,特別是技術標準領域,隨著技術迭代更新,很多標準也會被淘汰。資訊與文獻領域的識別符號一經被廣泛應用,便成為“唯一+穩定”的標準,它自身可以升級,但不可以被替代。標準建立者的地位也是穩定的。在資訊與文獻識別符號領域,凡對標準的唯一性、使用的規範性特別需要維護的識別符號,國際標準化組織便會為其設立一個“國際註冊權利機構”(Registration Authority,簡稱RA),比如ISBN RA,ISSN RA。RA是標準應用規則的制定者、標準應用的認定者和標準應用資料的匯聚者。凡是使用識別符號國際標準,必須按RA制定的規則,向RA提供相關元資料資訊。國際標準化組織為ISLI設立了RA,ISLI RA設在我國的香港地區,底層技術系統提供商(TP)為設在我國境內的公司。

中辦國辦《關於推進實施國家文化數字化戰略的意見》提出的全面梳理中華文化資源,推動文化資源科學分類和規範標識,按照統一標準關聯形成中華文化資料庫,這裡所說的“統一標準”,就是依託我國提案建立的ISLI國際標準,但不替代各個行業正在執行的識別符號標準。兩辦檔案提到的“依託資訊與文獻相關國際標準,在文化機構資料中心部署底層關聯服務引擎和應用軟體”,“相關國際標準”也是指ISLI;“依託現有有線電視網路設施、廣電5G網路和互聯互通平臺,部署提供標識編碼註冊登記和解析服務的技術系統”,所指的技術系統即是ISLI底層技術系統。

一旦有線電視網路設施部署了這套技術系統,有線電視網路就改造成為國家文化專網;部署了底層關聯服務引擎和應用軟體的各類文化機構,接入國家文化專網,就可以在閉環系統從事資料的採集、解構、關聯、重構、呈現、交易。

高書生:主權鏈呼之欲出

部署統一的ISLI註冊系統

2022年8月,ISLI RA授權中國公共關係協會文化大資料產業委員會,設立ISLI區域/行業註冊機構,即ISO 17316-ISLI-DRA,在ISLI RA業務框架和規定的範圍內,承擔中國國家文化大資料體系領域的ISLI註冊管理業務。

中國公共關係協會是中宣部主管的全國性、行業性、非營利性社會組織,下設10個專委會,文化大資料產業委員會是其中之一,具體負責為成員單位提供聯絡、溝通、協調、服務,協同推進國家文化大資料體系建設;組織成員單位推廣資訊與文獻關聯識別符號國際標準,加強標識解析體系建設;組織成員單位在資料採集加工、資料交易分發、資料傳輸儲存、資料治理等環節,研究制訂併發布國家文化大資料團體標準,透過宣傳、培訓、示範等方式推廣應用;為實施國家文化數字化戰略、建設國家文化大資料體系建設提供專業性諮詢服務。

為組織成員單位推廣我國提案建立的ISLI,加強標識解析體系建設,承接ISLI RA授權的ISLI註冊管理業務,中國公共關係協會文化大資料產業委員會設立國家文化大資料標識註冊中心,依據《ISO 17316(ISLI)DRA協議》部署統一的ISLI註冊系統,同部署在有線電視網路設施的提供標識編碼註冊登記和解析服務的技術系統,以及部署在文化機構資料中心的底層關聯服務引擎和應用軟體實現無縫銜接,對國家文化大資料體系中的文化資料、參與者、載體、時間、事件和位置等實體進行標識,對國家文化大資料體系中文化大資料實體關聯關係進行標識。

國家文化大資料標識註冊中心始終把社會效益放在首位,遵循社會公共利益優先原則,促進公共文化資源資料依法依規向公眾開放,保障公共文化資源資料安全,維護國家文化大資料體系運轉的公開、公正、公平、有序、透明。國家文化大資料標識註冊中心建設以ISLI註冊服務為基本業務的入口網站——伏羲雲(www。fuxiyun。com),向ISLI使用者提供身份註冊和ISLI關聯編碼登記服務,向用戶提供ISLI關聯編碼元資料檢索和查詢服務,使用者輸入ISLI編碼標識物件名稱,頁面顯示該標識物件在ISLI註冊系統登記的公開元資料內容,能讓使用者查詢與某個元資料相關的ISLI編碼。

為提高標識解析服務的效率,國家文化大資料標識註冊中心在已部署提供標識編碼註冊登記和解析服務技術系統的省域中心以及行業中心、專業中心和關聯平臺設立派出機構,接受國家文化大資料標識註冊中心管理和監督,協同開展文化大資料標識解析服務。派出機構應根據業務需要,配備工作專班和專人,工作人員在業務上接受國家文化大資料標識註冊中心的培訓和指導,持證上崗,確保ISLI註冊系統執行順暢。

高書生:主權鏈呼之欲出

標識編碼有規矩

中辦國辦《關於推進實施國家文化數字化戰略的意見》明確的首要任務,就是關聯形成中華文化資料庫,包括關聯零散的文化資源資料,關聯思想理論、文化旅遊、文物、新聞出版、電影、廣播電視、網路文化文藝等不同領域的文化資源資料,關聯文字、音訊、影片等不同形態的文化資源資料,關聯文化資料來源和文化實體。具體路徑是,按照物理分佈、邏輯關聯原則,彙集文物、古籍、美術、地方戲曲劇種、民族民間文藝、農耕文明遺址等資料資源,貫通已建或在建文化專題資料庫。

怎麼關聯?如何貫通?這就要依靠標識解析體系發揮作用,關聯需要部署底層關聯服務引擎和應用軟體,貫通需要部署提供標識編碼註冊登記和解析服務的技術系統。

國家文化大資料體系建設是大兵團作戰,涉及宣傳、網信、文旅、新聞出版、電影、廣播電視、文物等部門,涵蓋思想理論、文化旅遊、文物、新聞出版、電影、廣播電視、網路文化文藝等不同領域,文化機構眾多且行業差異較大,部署底層關聯服務引擎和應用軟體需要區別對待,因地制宜。

·對於文化資源資料量較大、具有資料中心的文化機構,可進行本地化部署;

·對於文化資源資料量巨大、居行業領軍地位且擁有獨立的資料中心的文化機構,可由國家文化大資料標識註冊中心授權作為其派出機構,並在其資料中心部署底層關聯服務引擎和應用軟體,內建整合,透過應用程式程式設計介面(API),委託釋出一個數據即賦予一個ISLI碼,將授權清晰的資料匯入國家文化專網;

·對於不具備設立資料中心條件的文化機構和公民個人,可採取雲服務模式,登入國家文化大資料標識註冊中心服務入口網站,註冊即可使用,在一定使用量範圍內免費,超過部分按照梯次收費。

至此,文化數字化“底座”就完成了技術架構,文化機構及公民個人即可將其文化資源資料進行標識,透過對實體進行標識,從語義關聯空間維度包括文化資料、參與者、載體、時間、事件和位置六類,繼而完成關聯標識,關聯按照不同維度的方向性包括文化資料與參與者、參與者與文化資料、文化資料與時間、時間與文化資料等。如果文化資料實體已使用其他標準識別符號,應繼續使用既有識別符號,相應識別符號納入文化大資料標識編碼的元資料列表項。

文化大資料標識編碼由文化機構及公民個人申請、國家文化大資料標識註冊中心統一分配。分配標識編碼時,應登記相應標識型別規定的元資料。標識編碼申領者必須擁有被標識實體的所有權或使用權,一個標識編碼只能分配給一個實體,一個實體在不同的應用中可以有多個種類的標識編碼,但在同一個名稱空間內只能有一個標識編碼。標識編碼分配與使用具有永久性,不受時間限制。

文化大資料標識編碼由十進位制數字構成,分為三個欄位,即:6位數字的服務欄位、長度可定的關聯欄位和1位數字的校驗欄位。關聯欄位用於構建並標識文化資料實體之間定向關係的關聯編碼,由國家文化大資料標識註冊中心依分類規則和需求組織編制,經ISLI RA核准釋出後,統一分配。標識編碼申領者將使用編碼的基礎元資料回傳國家文化大資料標識註冊中心登記生效。

國家文化大資料標識註冊中心負責對文化大資料標識編碼申領進行合規性稽核,申領者應登記文化大資料標識元資料,嚴格執行權屬人的授權使用許可權設定,並符合國家政策。

高書生:主權鏈呼之欲出

資料因關聯而增殖

我國是文明古國,文化資源大國。將中華民族積澱了五千多年的文化資源轉化為資料,成為文化生產要素、文化創新創造的素材和源泉,從中提取具有歷史傳承價值的中華文化元素、符號和標識,就可以豐富中華民族文化基因的當代表達,全景式呈現中華文化。

世界因互聯而多彩,資料因關聯而增殖。資料的價值,就在於其描述或表達的文化內涵。

資料關聯,首先要找準資料所在的座標系,即對資料進行科學分類。目前對文化類別講得最清楚的,非聯合國教科文組織莫屬。1986年,聯合國教科文組織曾釋出一版《文化統計框架》(Framework for CulturalStatistics,簡稱 FCS)。2009年,聯合國教科文組織根據全球文化發展狀況,特別是全球文化領域出現的新動向和新概念,包括與新技術(如數字和網路技術)、非物質文化遺產以及演進中的文化實踐和政策相關的概念,釋出了新版《文化統計框架》,對文化類別進行了較為全面的提煉與概括,為全面考察和描述文化活動提供了標準化版本。聯合國教科文組織2009年版《文化統計框架》把文化領域劃分為六大類別,即文化和自然遺產、表演和節慶活動、視覺藝術和手工藝、書籍和報刊、視聽(音像)和互動媒體、設計和創意服務。聯合國教科文組織對文化活動的描述呈現立體化、網路狀,同時超越了簡單的分門別類,更加強調在同一類別中文化活動的迴圈,弄清楚文化從創作、生產到傳播、消費等各個階段是如何展開的。比如,把博物館歸入文化和自然遺產類別、把圖書館歸入書籍和報刊類別等,對文化活動的描述更加完整。

資料關聯具有很強的專業性,同時也是規模巨大的新興產業。2018年,百度入駐山西綜改示範區,打造資料標註產業基地。截至2022年5月,百度山西資料標註基地辦公面積超19000平方米,已有5000名資料標註師,已入駐53家代理商,基地累計產值超5億元。百度已在山西太原、山東濟南、山西臨汾、重慶奉節、四川達州、甘肅酒泉、江西新餘7個地域,建設百度智慧雲資料標註基地。基地依託百度人工智慧技術的發展,為供應商提供標註資源、標註工具,供應商能夠自由訪問百度現有的AI標註平臺。透過標註工具和預標註演算法,藉助機器決策,標註過程實現了人員和資料自動流轉,擺脫了人工干預。

百度資料標註基地的做法和經驗,對做好文化大資料關聯具有很強的示範作用和借鑑意義。不同於其他行業的大資料,文化大資料是供給側的,更具有生產要素的特徵,經過挖掘資料的文化內涵,文化大資料可以直接轉化為二次創作的素材。資料為文化賦能,文化為資料增殖。

如果說資料關聯是生產過程,那麼,關聯資料就是生產成果。中辦國辦《關於推進實施國家文化數字化戰略的意見》指出:“推動文化機構將文化資源資料採集、加工、挖掘與資料服務納入經常性工作,將凝結文化工作者智慧和知識的關聯資料轉化為可溯源、可量化、可交易的資產。”資料關聯可以調動成千上萬的專業人員加入,隨著資料關聯隊伍的不斷壯大,關聯資料像滾雪球一樣越積越多,形成不計其數的關聯鏈,同知識圖譜一起,對中華文化進行全景式呈現。文化機構及公民個人既可以為自己的資料加以標識和標註,形成關聯鏈,這是內關聯,也可以透過國家文化專網對已形成的其它關聯鏈再標識和標註,形成了更大範圍的關聯鏈,這是外關聯。未來的文化資料或許以關聯鏈面目出現,關聯鏈將成為文化新業態,使用者購買關聯鏈就可以訪問不同文化機構的資料庫,無論建設資料庫還是生產關聯鏈,都能夠獲得豐厚收入。

高書生:主權鏈呼之欲出

當區塊鏈融入標識解析體系

推動標識解析與區塊鏈、大資料等技術融合創新,這是中辦國辦《關於推進實施國家文化數字化戰略的意見》提出的另一項重要任務。

誕生於2008年的區塊鏈,因為資本追逐數字貨幣而被關注。文化領域應用較早的,應該是版權保護,即應用區塊鏈技術對作品進行鑑權,證明文字、影片、音訊等作品的存在,保證權屬的真實、唯一性。作品在區塊鏈上被確權後,後續交易都會進行實時記錄,實現數字版權全生命週期管理,也可作為司法取證中的技術性保障。

當數字藏品風靡市場,數字藏品平臺如雨後春筍激增,隨之暴露的是對市場交易合規性的質疑、數字藏品版權糾紛等問題。數字藏品可否上鍊,成為業界謀劃的一條出路。專門為數字藏品量身定做的聯盟鏈,相繼登場亮相。中國數字文化集團有限公司攜手中國聯通、聯合中國文物交流中心、大有國聯控股有限公司、北京文投集團等推出“中國數字文化鏈”。

區塊鏈與關聯鏈具有很多共同點,比較顯著的有三個方面:

一是分散式結構。區塊鏈資料的儲存、傳輸、驗證等過程均基於分散式的系統結構,國家文化大資料體系建立在物理分佈、邏輯關聯的基礎上,各文化機構的資料採取分散式儲存。

二是資料永久性。區塊鏈資料一旦上鍊儲存,就無法撤回和刪除。標識編碼的分配與使用也具有永久性,除特定情況標識編碼允許被登出,一般情況下標識編碼將被永久分配給一個特定的關聯,永遠不得改變、更換或重複使用。

三是透明性。區塊鏈具有人人都可查閱的特性,每個人都可以在任何一個有網路的地方,查詢區塊資訊。國家文化大資料標識註冊中心入口網站也提供ISLI關聯編碼元資料檢索和查詢服務,使用者輸入標識編碼可以查詢公開元資料內容,查詢與某個元資料相關的標識編碼。

文化科技創新服務聯盟基於長安鏈技術體系以及國家文化大資料相關標準建設“文化聯盟鏈”,面向數字化文化消費新場景提供區塊鏈服務,為國家文化大資料應用提供文化數字內容的版權保護、確權、交易、消費等全鏈條開放服務,促進網路消費、定製消費等新型文化消費發展。同時與全國文化大資料交易中心共同牽頭制定國家文化大資料體系團體標準——《基於區塊鏈的文化數字內容跨域共享技術要求》。

當區塊鏈融入標識解析體系,作為文化數字化“底座”的ISLI,就被賦予新的使命與功能——主權鏈,對接各種聯盟鏈,支援同構和異構區塊連結入,將區塊資訊相關資料嵌入標識編碼,匯入ISLI註冊系統,由國家文化大資料標識註冊中心永久儲存。

高書生:主權鏈呼之欲出