大數(shù)據(jù)(bigdata),指無法在一定時間范圍內用常規(guī)軟件工具進行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產。作為時下最火熱的IT行業(yè)的詞匯,大數(shù)據(jù)應用隨之而來的數(shù)據(jù)倉庫、數(shù)據(jù)安全、數(shù)據(jù)分析、數(shù)據(jù)挖掘等圍繞大數(shù)據(jù)的商業(yè)價值的利用逐漸成為行業(yè)人士爭相追捧的利潤焦點。但不管如何,未來的創(chuàng)新發(fā)展離不開“大數(shù)據(jù)”應用。
出門乘網約車、跑步計量身體健康信息、坐飛機時了解航班是否準點。在大數(shù)據(jù)時代,每個人的生活都和數(shù)據(jù)息息相關,對核心數(shù)據(jù)的“爭奪戰(zhàn)”,也正在引領新一輪的科技創(chuàng)新。
大數(shù)據(jù)產業(yè)頻迎政策紅包
十三五大數(shù)據(jù)產業(yè)規(guī)劃步入政策落地期。工部副部長陳肇雄近日在“2017大數(shù)據(jù)產業(yè)峰會”上表示,工信部將從加強網絡設施建設、推進兩化融合等四個方面全面推進我國大數(shù)據(jù)發(fā)展和應用。地方層面,截至目前,已有北京、上海、重慶、廣東、山西、湖北等20多個省區(qū)市明確出臺了大數(shù)據(jù)產業(yè)發(fā)展規(guī)劃,搶占經濟發(fā)展制高點。隨著利好政策不斷釋放以及政府數(shù)據(jù)的逐步開放,政務、醫(yī)療、交通等領域的大數(shù)據(jù)應用創(chuàng)新活躍,大數(shù)據(jù)產業(yè)的春天到來。
“十三五”時期是大數(shù)據(jù)產業(yè)加快發(fā)展的重要窗口期。今年1月,工信部正式印發(fā)了《大數(shù)據(jù)產業(yè)發(fā)展規(guī)劃(2016-2020年)》(以下簡稱《規(guī)劃》)?!兑?guī)劃》提出到2020年,技術先進、應用繁榮、保障有力的大數(shù)據(jù)產業(yè)體系基本形成。大數(shù)據(jù)相關產品和服務業(yè)務收入突破1萬億元,年均復合增長率保持在30%左右。這是大數(shù)據(jù)作為信息產業(yè)的細分行業(yè)之一,首次出現(xiàn)在五年規(guī)劃體系中。
大數(shù)據(jù)應用創(chuàng)新活躍
阿里巴巴集團董事局主席馬云表示,人類在正從IT時代走向DT時代。隨著互聯(lián)網+的深入發(fā)展,豐富的數(shù)據(jù)資源為大數(shù)據(jù)產業(yè)發(fā)展奠定了基礎。以大數(shù)據(jù)為基礎的數(shù)字經濟正成為經濟新動能,應用創(chuàng)新步伐不斷加快。
一方面,這與我國大部分企業(yè)的數(shù)據(jù)分析應用意識的提高有關。中國信息通信研究院發(fā)布的《中國大數(shù)據(jù)發(fā)展調查報告》數(shù)據(jù)顯示,59.2%的受訪企業(yè)已成立了數(shù)據(jù)分析相關部門,同時,27.3%的企業(yè)正計劃成立數(shù)據(jù)部門。企業(yè)應用大數(shù)據(jù)所帶來的主要效果包括實現(xiàn)智能決策、提升運營效率和改善風險管理。
另一方面,我國加快推動政府數(shù)據(jù)共享,進一步打通了政企、政府之間的數(shù)據(jù)壁壘。2015年我國正式發(fā)布《促進大數(shù)據(jù)發(fā)展行動綱要》。根據(jù)國家部署,2018年底前將建成國家政府數(shù)據(jù)統(tǒng)一開放平臺;2020年底前,逐步實現(xiàn)信用、交通、醫(yī)療、衛(wèi)生、就業(yè)、社保、地理、文化、教育、科技、資源、金融等民生保障服務相關領域的政府數(shù)據(jù)集向社會開放。
目前,在社交、電商、搜索等互聯(lián)網領域,大數(shù)據(jù)應用快速普及,精準營銷、智能推薦、金融征信等新業(yè)態(tài)新模式蓬勃發(fā)展。而在工業(yè)、醫(yī)療、交通等傳統(tǒng)領域,大數(shù)據(jù)應用創(chuàng)新活躍,涌現(xiàn)出了個性化定制、智慧醫(yī)療、智能交通等大數(shù)據(jù)應用示范。3月29日,交通部發(fā)文稱,綜合交通大數(shù)據(jù)國家實驗室日前組建成立,未來將圍繞大數(shù)據(jù),提高多交通方式協(xié)同能力,促進多種交通方式無縫銜接,提升綜合交通整體效能。
隨著大數(shù)據(jù)產業(yè)發(fā)展越來越正規(guī)化,大數(shù)據(jù)應用肯定會細分、細切到行業(yè)、專業(yè)、產業(yè),應用會精細化到點。而每個精細化的應用都將產生比較大的商業(yè)價值。如今興起的大數(shù)據(jù)就像當年的“互聯(lián)網”、“移動互聯(lián)網”,發(fā)展到一定階段,勢必從通用平臺過渡到“行業(yè)”垂直平臺。中科點擊作為分行業(yè)大數(shù)據(jù)領域的先驅者,在大數(shù)據(jù)應用領域精耕細作多年,服務了超過2000+政府和企業(yè)客戶,其中有國安、網信、公安、宣傳、質監(jiān)等重要政府單位,涵蓋汽車、金融、保險、地產等眾多行業(yè)支柱產業(yè)的龍頭企業(yè),通過產品與服務,實現(xiàn)工作效能提升與商業(yè)增值。
大數(shù)據(jù)有風險
大數(shù)據(jù)挖掘,從正面來說,是創(chuàng)造價值;從負面來說,就是泄露隱私了!大數(shù)據(jù)隱私是如何被泄露的呢?請先跟我來分解一下經典的“人肉搜索”吧!
一大群網友,出于某種約定的目的,比如,搞臭某人或美化某人,充分利用自己的一切資源渠道,盡可能多地收集當事人或物的所有信息,包括但不限于網絡搜索得到的信息(這是主流)、道聽途說的信息、線下知道的信息、各種猜測的信息,等等;然后,將這些信息按照自己的目的精煉成新信息,反饋到網上與其同志們分享。這就完成了第一次“人肉迭代”。接著,大家又在第一次“人肉迭代”的基礎上,互相取經,再接再厲,交叉重復進行信息的收集、加工、整理等工作,于是,便誕生了第二批“人肉迭代”。如此循環(huán)往復,經過N次不懈迭代后(新聞名詞叫“發(fā)酵”),當事人或物的丑惡(或善良)畫像就躍然紙上了。如果構成“滿意畫像”的素材確實已經“坐實”,至少主體是事實,那么,“人肉搜索”就成功了。
其實,所謂的大數(shù)據(jù)挖掘,在某種意義上說,就是由機器自動完成的特殊“人肉搜索”而已。只不過,現(xiàn)在“人肉”的目的,不再限于抹黑或頌揚某人,而是有更加廣泛的目的,比如,為商品銷售者尋找最佳買家、為某類數(shù)據(jù)尋找規(guī)律、為某些事物之間尋找關聯(lián),等等,總之,只要目的明確,那么,大數(shù)據(jù)挖掘就會有用武之地。
如果將“人肉”與大數(shù)據(jù)挖掘相比,那么,此時網友被電腦所替代;網友們收集的信息,被數(shù)據(jù)庫中的海量異構數(shù)據(jù)所替代;網友尋找各種人物關聯(lián)的技巧,被相應的智能算法替代;網友們相互借鑒、彼此啟發(fā)的做法,被各種同步運算所替代;各次迭代過程仍然照例進行,只不過機器的迭代次數(shù)更多、速度更快而已,每次迭代其實就是機器的一次“學習”過程;網友們的最終“滿意畫像”,被暫時的挖掘結果所替代,因為,對大數(shù)據(jù)挖掘來說,永遠沒有盡頭,結果會越來越精準,智慧程度會越來越高,用戶只需根據(jù)自己的標準,隨時選擇滿意的結果就行了。當然,除了相似性外,“人肉”與“大數(shù)據(jù)挖掘”肯定也有許多重大的區(qū)別,比如,機器不會累,它們收集的數(shù)據(jù)會更多、更快,數(shù)據(jù)的渠道來源會更廣泛,總之,網友的“人肉”,最終將輸給機器的“大數(shù)據(jù)挖掘”。
人們開發(fā)軟件、研制信息產品、建設網絡系統(tǒng)時,肯定都希望安全第一。但是,“理想很豐滿,現(xiàn)實很骨感”,任何系統(tǒng)都不可能絕對安全,其安全性也無法事先嚴格證明,只能由實踐來檢驗。無論多么認真,無論花費多少時間和精力,只要是人造的東西,就一定會有安全缺陷;而且,這些缺陷有時還很難被發(fā)現(xiàn)。怎么辦呢?當然只好由專門檢測人員,利用特制工具,來挖掘、修補和處理這些潛在的缺陷。
除了帶工資外,從純技術角度看,這些檢測人員與黑客其實沒啥區(qū)別;而且,他們顯然都是絕不可少的,因為,“帶著缺陷運行的系統(tǒng)”更危險、更可怕。從這個角度看,黑客的產生也是不可避免的。因為,即使是經過高級專門人員檢測后,也還會遺留一些未被發(fā)現(xiàn)的缺陷,于是,社會上便出現(xiàn)了一批“志愿者”,他們不分晝夜,不辭辛勞,對這些系統(tǒng)反復進行地毯式搜索,希望找到更多的漏洞去換錢,或以此證明自己的能力。這批“志愿者”就俗稱黑客。
如何進行風險防御
大數(shù)據(jù)時代背景下,針對過去已經遺留在網上的海量碎片信息,如何進行隱私保護呢?如果單靠技術,顯然無能為力,甚至會越“保護”就越“泄露隱私”,因此,必須多管齊下。比如,從法律上,禁止以“人肉搜索”為目的的大數(shù)據(jù)挖掘行為;增加“網民的被遺忘權”等法律條款,即,網民有權要求相關網絡刪除“與自己直接相關的信息碎片”。從管理角度,也可以采取措施,對一些惡意的大數(shù)據(jù)行為進行發(fā)現(xiàn)、監(jiān)督和管控。另外,在必要的時候,還需要重塑“隱私”概念,因為,畢竟“隱私”本身就是一個與時間、地點、民族、宗教、文化等有關的東西,在某種意義上也是一種約定俗成的東西。
針對今后的網絡行為,應該如何來保護自己的隱私,至少不要把過多的沒必要的碎片信息遺留在網上呢?在這里,我想提供一個很實用的策略,那就是:匿名!只要做好匿名工作,那么,談論什么“隱私泄露”,就是無本之木、無源之水了。匿名的重點包括:
身份匿名。任何緋聞或丑事兒,當大家并不知道你就是當事人時,請問你的隱私被泄露了嗎?當然沒有!沒準你還踮著腳、伸著長脖子往前擠,還想多看幾眼熱鬧呢!
屬性匿名。如果你覺得自己的某些屬性(比如,在哪里工作、有啥愛好、病史記錄等)需要保密,那么,請記?。捍蛩酪膊灰诰W上發(fā)布自己的這些消息,甚至要有意避開與這些屬性相關的東西。這樣別人就很難對你順藤摸瓜了。關系匿名。如果你不想讓別人知道你與張三是朋友,那么,最好在網上離張三遠一點兒,不要去關注與他相關的任何事情,更別與他搭訕。
位置匿名。這一點用不著我來教你了吧。至少別主動在社交媒體上隨時暴露自己的行蹤,好像生怕別人不知道“你現(xiàn)在正在某飯店吃飯”一樣。
概括一下,在大數(shù)據(jù)之前,隱私保護的哲學是:把“私”藏起來,而我的身份可公開。今后,大數(shù)據(jù)隱私保護的哲學將變成:把“私”公開(實際上是沒法不公開),而我的身份卻被藏起來,即匿名。
更多資訊請關注工業(yè)以太網頻道