幾個月前,東北經歷了限電,一夜醒來發(fā)現沒電,突然生活被搞到一團糟。一聽到通知維修電路,哪個片區(qū)會在哪個時段停電,大家就驚慌失措,這時候大家有個疑問,為什么電不夠用?比起其他國家,我國水力發(fā)電、煤炭發(fā)電、風力發(fā)電、核電、太陽能發(fā)電等各種發(fā)電方式多樣,怎么電量就不夠了?究其原因之一還是用電分配比較難做。
對電量使用電網主要是預估值,預估高峰期用電量多少。電力缺口過大確實可以開啟核電站發(fā)電,但是核電發(fā)出的電很難大量儲存,而且核電每次發(fā)電成本都很大。所以,保證發(fā)電分配恰到好處、物盡其用就能很大程度減輕電荒。相同的困境美國早在2009年就已經遇到。當時美國怎樣解決這個問題呢?2009年政府宣布已推行智能電網,在各家各戶安裝了智能電表,每隔15分鐘電表向電廠發(fā)送一次用電數據,電廠根據數據判斷送電量,用多少就送多少,絕不浪費。過了一段時間,突然有人發(fā)出質疑,電廠憑什么有權力知道我什么時候用電,哪些電器用電,憑什么可以偷窺我的私人生活活動。一石激起千層浪,這件事引起很多人的不滿。當時的計算機專家發(fā)現,可以這樣解決:電廠只是需要一個區(qū)域內某個時間段的用電量,平均用電量,高峰用電量,并不需要每個個體的用電量,只需要統(tǒng)計這部分數據就可以。這次電力分配的解決就是隱私計算的雛形。
如同當時大家不希望個人電表數被電廠記錄一樣,如今依然沒有人希望自己大量真實個人數據暴露給一切路人。大數據暴露個人信息的例子不勝枚舉。怎樣盡可能保護信息安全?最初有人建議盡量不提交數據。但是AI模型需要大量數據訓練才能保證有效精準運行,數據專家想到了“不給出原始數據,但是又讓AI模型能用到有價值的數據”這一解決思路。隱私保護下的分布式機器學習方案就這樣產生了。在這個方案下相應產生了多種途徑進行隱私計算:將個體數據處理以后再使用就能讓原始數據在不出域的情況下仍能發(fā)揮數據的使用價值;多方安全計算,即保證多方之間可以共同計算一個函數,最后任何一方只能知道最終的計算結果,除此之外不會泄露任何更多的信息, 尤其是不能泄露任何一方各自的輸入。