比特幣交易所 比特幣交易所
Ctrl+D 比特幣交易所
ads

Dawn Song:建立有責數據經濟,實現隱私數據保護 | 世界區塊鏈大會·武漢_DAWN

Author:

Time:1900/1/1 0:00:00

2020年12月5日上午9點,2020世界區塊鏈大會·武漢正式在武漢國際會展中心開幕。大會由巴比特主辦,并得到了武漢市政府、江漢區政府、武漢市經信局、中國信通院等部門單位的大力支持。

在視頻演講《隱私數據保護與有責數據經濟》中,加州大學伯克利分校教授、美國計算機協會(ACM)FellowDawnSong指出,數據對現代經濟的發展至關重要。然而,當前的數據存在被濫用的情況,一方面用戶無法控制自己的數據,不能從中受益;另一方面,企業也在數據處理方面困難重重。

因此,建立有責數據經濟是唯一的解決方案。DawnSong教授給出了由三個方面構成的解決方案:分別是技術支持、法律框架和激勵模型。

以下為巴比特整理的演講全文:

讓我們先來看一些具體的例子,了解一下隱私數據領域為什么非常重要。

隱私數據為什么這么重要?

眾所周知,機器學習能夠主動學習,它能夠接觸到的所有數據,并跟著數據庫的變化而發生改變。這些數據中有很多是非常隱私而且非常敏感的數據,因此當我們訓練和部署自主學習的機器或系統時,個人的隱私數據能夠被安全保護真的很重要。

日本虛擬IP公司Brave group Inc.完成1000萬美元融資,Dawn Capital等參投:6月23日消息,日本虛擬 IP 公司 Brave group Inc. 宣布完成 1000 萬美元融資,Dawn Capital 和 OSAKA GAS 等參投,截止目前該公司融資總額已達 1800 萬美元。Brave 將利用這筆融資擴大元宇宙營銷解決方案服務,強化運營和全球擴張,開發更多的Brave Engine產品和其他新業務,并加強其管理結構。(美通社)[2022/6/23 1:26:40]

這是一個具體的例子,向我們展示了為什么我們在開發產品時保護用戶隱私的重要性,這也是我們近期與谷歌研究人員一起合作解決的工作重心。

今天,我們要一起探討的核心問題是,自主學習網絡會記住訓練數據嗎?黑客能否通過攻擊系統的自主學習訓練數據庫提取到用戶的個人隱私數據?

基于這種情況,我們來看語言自主學習模型的任務。文本語言學習模型是通過文本話術庫,例如電子郵件數據庫實現自主學習的,然后模型將嘗試學習預測,它會嘗試通過給定的單詞序列,預測下一個字符。

特別是在這種情況下,我們開始了基于Enron電子郵件數據庫的語言模型訓練任務。每個人的電子郵件數據都包含每個真實用戶的信用卡號和社會身份ID信息。攻擊者即使不知道語言模型的細節,甚至不了解該語言模型的體系結構參數,就能通過簡單地調用語言模型,獲取用戶的信息數據,這完全可以實現。僅僅通過原始數據和訓練數據庫獲取用戶的信用卡號和社會保險號。

動態 | 在線游戲平臺FirstBlood將推出區塊鏈網絡Dawn:在線游戲平臺FirstBlood計劃基于Cosmos推出名為Dawn的區塊鏈網絡。FirstBlood 旨在打造讓業余 PC 游戲玩家可以參加競爭性比賽并獲得游戲獎勵的在線游戲平臺 ,而其將推出的Dawn區塊鏈將建立在Cosmos SDK和Tendermint共識協議上,并與以太坊主網連接。[2019/12/14]

這些例子說明了為什么在訓練機器自我學習時隱私數據的安全處理方式非常重要。幸運的是,我們有一個解決方案。這個解決辦法不僅讓機器在模型中自我學習,取而代之的是一種“差異隱私”的數據訓練模型,我們仍然可以保證很高的學習效率。與此同時,我們還可以顯著增強隱私性,保護用戶狀態和隱私數據。

“差異隱私”是隱私保護更優解。尤其是,我們在其中看見了靈活操作的空間。如果滿足以下特性,隱私信息差異化算法是完全可以實現的。

我們考慮相鄰的數據庫,一個數據庫還有與其關聯的其他信息,然后是其他數據庫,例如Joe的數據。當我們在這兩個相鄰數據意義上計算隨機算法函數時,讓我們看一下數據計算結果。計算數據輸出的結果非常相似。從本質上來說,這兩個數據分布非常接近。

EOS IO Dawn 4.0 預計于5月11日發布:EOS創始人BM在Medium發布長文介紹EOSIO Dawn 4.0。據了解該版本的主要變化是已經將當前時間的定義從“head block”改為“當前塊時間”,這一變化解決了大量的基于時間的操作,在出現缺失的塊的情況下,能夠更準確地測量智能合約中的運行時間。此外介紹的內容還包括RAM分配模型、對智能合約開發者的影響、對投機行為的最小化、區塊鏈交互等等。EOS的 Dawn 4.0預計于5月11日發布,EOSIO 軟件預計6月份發布。[2018/5/6]

但如果只看數據輸出的話,攻擊者將無法區分Joe的數據是否已包含在原始數據中。任憑怎么努力,在個人隱私數據策略中,數據都是被保護的。

我們最近的工作還開發了新型、美觀且實用的自動化的方法,并能夠驗證這種機器算法。目前這項工作已經完成,而且得到了政策的支持與保證。該作品還贏得了頂級編程語言盛會的杰出人物獎項。

我們保護用戶隱私,尤其是你向別人提到過的數據隱私,這只是一個例子。但同樣的,也是隱私問題解決方案的冰山一角。

BM發布EOSIO Dawn 4.0的詳細介紹:據IMEOS最新報道,BM在Medium發布長文介紹EOSIO Dawn 4.0。介紹內容包括:修改對當前時間的定義;RAM分配模型;對智能合約開發者的影響;對投機行為的最小化:區塊鏈交互;并行線路圖;升級DPOS的不可逆塊算法;用戶名字符限制;僅對標頭驗證;架構的重建和應用;輕量化區塊生產者變更證明;新區塊生產者的薪酬范例;關于投票影響力衰減;交易所集成;EOSIO Dawn 4.0的可用性。[2018/5/5]

當前數據領域的痛點

眾所周知,數據對現代經濟至關重要。有很多數據,例如敏感的隱私數據被濫用或者被處理。個人用戶和企業都面臨前所未有的挑戰。個人正在失去其如何使用自己隱私數據的控制。同樣的是,許多隱私信息在用戶不知情的情況下被賣了出去,數據信息的保護傘也已經匿名化。在某些個人身份可識別的地方,身份標識已被刪除。

我認為很多工作經驗表明,組織/企業在保護用戶隱私方面的表現通常不太好。就像最近《紐約時報》的文章寫的那樣,他們可以通過匿名數據庫中總統特朗普的手機位置數據,追蹤特勤局特工的位置信息。

EOSeoul發布測試報告,性能遠低于EOSdawn3.0的最糟糕情況:據金色財經合作媒體IMEOS報道:EOSeoul發布測試報告,多節點多機運行下,穩定的最高TPS仍然在500以下,這遠低于EOS dawn3.0所說的即使單節點也能達到1000-3000;在這份測試報告上,也出現其他性能瓶頸,CPU達到100%利用率時會分叉;單節點單機情況下,磁盤性能對TPS的影響并不顯著。該測試腳本以及機器配置均已開源。[2018/4/25]

另一方面,用戶也無法通過隱私數據獲取收益,企業也繼續遭受苦難。舉個例子,他們繼續遭受大規模數據泄露的困擾。同樣的,對于企業而言,遵守諸如CCPA和GDPR之類的隱私法規變得越來越繁瑣和昂貴。出于對隱私數據的擔憂和其他一些因素,企業依舊很難真正利用好數據。

隨著行業技術的發展,很多新技術雖然可以解鎖實用程序,但通常會以犧牲隱私為代價。因此,我們不能繼續目前的現狀。當前狀態會破壞人類價值和基本權利,阻礙社會前進的腳步。

建立有責數據經濟需要基于三個框架

因此,我們迫切需要一個解決辦法,建立有責數據經濟。然而建立有責數據框架是非常復雜的,其原因有很多,比如程序便捷性與隱私保護之間不可調和的矛盾,再比如數據是非競爭性的,不能簡單地復制物理世界中的概念和方法。

讓我們以物理世界舉例。如果A持有1個蘋果,B就沒有辦法在同一時間持有同一個蘋果。但是對于數據而言,同一份數據可以被復制成多份,公司和個體可以同時保存同樣的數據,因為我們不能簡單地復制模擬世界中的概念和方法來幫助解決數字世界中的問題。因此建立一個有責數據經濟的框架就尤其需要技術和非技術解決方案的組合。

我們的框架至少需要以下三個組成部分:技術支持、法律框架和激勵模型。

技術解決方案方面,我們需要開發新技術去解決傳統方案效率低下的問題。尤其是開發新技術的方式。新技術不僅像現有的數據加密一樣保護數據,還能夠保護使用中和計算機中的數據。甚至可以控制數據的使用方式,而無需復制原始數據,讓解決方案能夠更好的控制數據。此外,我們還要保護計算機輸出不會泄露已輸入的已輸入的。

正如我們看到的那樣,舉個例子,分析數據通常不能為隱私提供足夠的保護。幸運的是,在以不同的組件技術實現有責數據經濟方面,我們已經看到了令人興奮和迅速的進步,這包括安全計算,試圖利用安全硬件等技術和解決方案以及基于加密的方法,如安全多方計算和同態加密等,來幫助保護計算過程不受信息一致性的影響。

還有不同的隱私,以保護計算輸出不產生有關個人的敏感信息。

聯邦學習幫助數據所有者在其本地設備和機器上保存數據,并使不同的實體能夠以分布式的方式一起訓練機器模型,這還有助于進一步保護用戶的數據隱私。

分布式賬本可以提供一個不可篡改的日志來確保用戶對數據的權利,確保用戶策略如何使用這些數據以及提供數據使用的不可篡改的日志。

OasisLabs在努力推進這些不同的組件技術,并將這些不同的組件技術編織在一起,以實現一個安全的分布式計算結構。它可以作為一個可靠的數據經濟的平臺,幫助解決我前面提到的許多挑戰。

為了說明這些計算機技術以及可靠的數據經濟平臺的能力,這里我舉一個例子,是我們一直在研究的基因學用例。

在直接面向消費者的基因學研究中,相關企業會收集用戶的基因數據,為用戶提供基因分析結果。然而,近段時間我們看到了一些面向消費者的基因企業出現了裁員的現象,并且特別指出對消費者隱私的擔憂,這是延緩消費者普及的主要原因。

通過和基因公司在獲取隱私服務的流程中合作,一旦投入使用,這將是用戶首次成為自己基因數據的主人。也就是說,他們可以控制自己的基因數據以及數據的使用方式。他們的基因數據將以加密的形式存儲。用戶可以指定自己基因數據的使用方式。

舉個例子,他們可以允許基因公司提供自己數據的基因分析。通過這次合作,基因公司可以使用安全計算的方法,但不會得到用戶數據的原始副本。在同樣的案例中,如果用戶允許基因公司進行數據分析,基因公司可以在安全執行環境中運行數據,從而為用戶提供計算結果,但基因公司將無法獲得用戶數據的原始副本。因此用戶可以自主控制數據的同時,以隱私和可控的方式使用他們的數據。

除了改進技術之外,可靠的數據應用還需要更有效的監管,在這個領域存在很多挑戰。例如,什么是數據權利?誰可以選擇數據權利?

個人產權是現代經濟的基石,幫助建立了現代經濟學,推動了幾個世紀的經濟重大增長。然而,今天我們缺乏數據權利的充分框架。

構建數據權利可以幫助個人從他們的數據中獲取價值,并且為經濟增長做準備,解鎖新的價值。我們需要探索一系列不同的概念和框架。

再次強調,我堅信安全和隱私將是AI應用的重大挑戰之一。建立一個可靠的數據經濟非常重要,這需要社區的努力,讓我們一起解決這個重大挑戰吧!

Tags:DAWNEOS區塊鏈RAVEdawn幣前景EOSPack區塊鏈存證怎么弄TiraVerse

幣贏交易所
加密交易所Bitso獲得6200萬美元B輪融資資金,總融資已達8100萬美元_BITS

加密貨幣交易所Bitso旨在提供對加密貨幣的通用入口,剛剛完成的6200萬美元B輪融資將推動其下一階段的增長.

1900/1/1 0:00:00
a16z、Alameda、Vitalik等巨鯨都買了哪些幣?_WEB3

撰文:0x26 國內的股票市場有「龍虎榜」揭示熱門股票的營業部成交量排名,三大商品期貨交易所會于收盤后公布基于期貨公司的各個品種的累計持倉量和當日成交量信息.

1900/1/1 0:00:00
美國著名計算機科學家:比特幣可能會終結信用卡的使用_EFI

在DeFi之后,“機構投資者”可能一直是加密貨幣市場的流行詞,尤其是在MicroStrategy和Square等公司加入這個新興市場之后,在機構進行比特幣購買熱潮的過程中.

1900/1/1 0:00:00
ETH 2.0新紀元開啟,究竟能帶來什么?_以太坊

繼比特幣減半之后,ETH2.0當屬今年加密市場最為期待的事件。盡管其0階段信標鏈的發布經過幾番推遲,但12月1日的成功啟動標志著以太坊已正式邁入2.0新的紀元.

1900/1/1 0:00:00
剛增持2574個比特幣,MicroStrategy又宣布了一個4億美元計劃_TRA

繼12月3日宣布增持2574個比特幣之后,商業情報公司微觀策略周一表示,它計劃通過優先可轉換票據籌集4億美元,并使用該計劃的凈收益購買比特幣.

1900/1/1 0:00:00
政府發幣、軍隊挖礦,委內瑞拉能否靠加密貨幣自救?_石油幣

作者|深鏈六六 編輯?|門人??運營|小石頭風清揚比特幣用自己的方式給11月畫上了一個句號。11月30日晚,比特幣價格突然飆漲,從此前的18000美元左右,一路上揚至最高19863美元,再創今年.

1900/1/1 0:00:00
ads