區塊鏈+大數據:區塊鏈應用大數據趨勢

電腦通訊 9547 34 2018-10-06

在過去幾年中,區塊鏈可能是 IT 領域最重要的發展,它有可能改變世界接近大數據的方式,增強安全性和數據質量。

“可以說是過去幾年信息技術最重要的發展,區塊鏈有可能改變世界接近大數據的方式,增強的安全性和數據質量只是使用Satoshi Nakamoto 標志性技術為企業帶來的兩個好處。 ”

什么是區塊鏈?

Blockchain 是一個分布式數據庫系統,充當存儲和管理事務的“開放式分類帳”。數據庫中的每個記錄稱為塊,并包含諸如事務時間戳之類的詳細信息以及指向前一個塊的鏈接。這使得任何人都無法回溯地更改有關記錄的信息。此外,由于在多個分布式數據庫系統上記錄相同的事務,該技術在設計上是安全的。

考慮到上述情況, 區塊鏈是不可變的:只要網絡存在,信息就會保持相同的狀態。

區塊鏈和大數據

當你在比特幣的背景下談論區塊鏈時,與大數據的聯系似乎有點脆弱。如果區塊鏈不是比特幣,而是其他金融交易的分類賬,該怎么辦?還是商業合同?還是股票交易?

金融服務業開始認真研究區塊鏈技術。瑞銀集團首席信息官奧利弗·巴斯曼(Oliver Bussmann)表示,區塊鏈技術可以“將交易處理時間從幾天縮短到幾分鐘”。

區塊鏈金融服務的業務需求是強大的。想象一下這種規模的區塊鏈。包含每個金融交易完整歷史的巨大數據塊,均可用于分析。區塊鏈提供分類帳的完整性,但不用于分析。這就是大數據和相關分析工具將發揮作用的地方。

大數據

大數據分析——區塊鏈應用

一家由 47 家日本銀行組成的財團與一家名為 Ripple 的區塊鏈創業公司簽約,以利用區塊鏈促進銀行賬戶之間的資金轉賬。此舉背后的主要原因是以極低的成本執行實時轉賬。傳統實時轉賬昂貴的原因之一是潛在的風險因素。雙重支出(這是一種交易失敗的形式,其中相同的安全令牌被使用兩次)是實時轉移的真正問題。使用區塊鏈,可以在很大程度上避免這種風險。 大數據分析使得識別消費者支出模式和識別風險交易的速度比目前更快。這降低了實時交易的成本。

在銀行業以外的行業中,采用區塊鏈技術的主要動力是安全性。在醫療保健,零售和公共管理部門,企業已開始嘗試使用區塊鏈來處理數據,以防止黑客攻擊和數據泄露。在醫療保健領域,區塊鏈等技術可以確保在每個級別的數據訪問中都尋求多個“簽名”。這可以幫助防止諸如2015年襲擊事件的重復,這些事件導致超過1億的 患者記錄被盜 。

區塊鏈應用大數據的優勢

1. 實時分析的可能性

到目前為止,實時欺詐檢測只是一個白日夢,銀行機構一直依賴于使用技術來回顧性地識別欺詐性交易。由于區塊鏈每個交易都有一個數據庫記錄,因此它為機構提供了一種實時挖掘模式的方法,如果需要的話。

但所有這些可能性也引發了對隱私的質疑,這與區塊鏈和比特幣首先變得流行的原因直接矛盾。一些行業專家表示擔心,能夠提供每筆交易記錄的技術可用于“從客戶分析到其他不太良性的原因”的所有事情。

然而,從另一個角度來看,區塊鏈極大地提高了數據分析的透明度。與以前的算法不同,區塊鏈設計拒絕任何無法驗證且被認為可疑的輸入。因此,零售等行業的分析師只處理完全透明的數據。換句話說,區塊鏈系統識別的客戶行為模式可能比現在更加準確。

2.發現交易數據

區塊鏈中的數據預計價值數萬億美元,因為它繼續進入銀行,小額支付,匯款和其他金融服務。事實上,到 2030 年,區塊鏈分類賬的價值可能高達整個大數據市場的 20%,年收入高達 1000 億美元。從這個角度來看,這種潛在的收入超過了Visa,Mastercard 和 PayPal 目前產生的收入。大數據分析對于跟蹤這些活動以及幫助使用區塊鏈的組織做出更明智的決策至關重要。

數據情報服務正在興起,以幫助金融機構,政府和各種組織深入研究他們可能在區塊鏈上與誰進行互動并發現“隱藏”模式。

3.揭開社交數據

隨著比特幣在 2014 年和 2015 年的普及,由于現實世界事件和公眾對該技術的看法,虛擬貨幣開始大幅波動。這些波動證明虛擬貨幣具有幾個特征,使其成為社交數據預測的理想選擇。

根據 Freshminds 的 Rick Burgess 的說法:“使用社交數據預測消費者行為并不是什么新鮮事,許多交易者一直在尋求將社交指標納入其交易算法。但是,由于大多數金融工具的定價涉及很多因素,因此預測市場將如何變化可能非常困難。“

幸運的是,比特幣用戶和社交媒體用戶傾向于很好地協調,并且將它們用于數據分析可能是有益的, 因為他進一步解釋說:

比特幣用戶往往與社交媒體用戶處于相同的人群中,因此他們對比特幣的態度,意見和情緒都有很好的記錄。

比特幣和其他加密貨幣的價值幾乎完全由市場需求決定,因為市場上的硬幣數量是可預測的,并且與任何實物商品無關。

比特幣主要由個人而非大型機構進行交易。

影響比特幣價值的事件首先在社交媒體上傳播。

數據分析師現在正在挖掘社交數據,以深入了解關鍵的加密貨幣趨勢。反過來,這可以幫助組織發現強大的人口統計信息,并將比特幣的表現與世界事件聯系起來。

4.新形式的數據貨幣化

根據戴爾 EMC 服務公司首席技術官 Bill Schmarzo 的說法,區塊鏈技術“還有可能通過消除中間人促進交易來實現數據和分析的共享和貨幣化的民主化。”在商業領域,這為消費者提供了更強大的公司談判權力。它允許消費者通過區塊鏈控制誰有權訪問他們的數據。然后,他們可以要求定價折扣,以換取他們個人消費公司產品或服務的數據。

Schmarzo 還解釋了區塊鏈如何導致新形式的數據貨幣化,因為它具有以下大數據分支:

參與交易的所有各方都可以訪問相同的數據。這加速了數據采集,共享,數據質量和數據分析。

所有交易的詳細記錄保存在單個“文件”或區塊鏈中。這提供了從頭到尾的完整事務概述,消除了對多個系統的需求。

個人可以管理和控制他們的個人數據,而無需第三方中介或集中存儲庫。

最終,區塊鏈可以成為數據貨幣化的關鍵推動因素,通過創建新的市場,公司和個人可以直接相互分享,銷售和提供他們的數據和分析見解。

在大規模采用比特幣的帶頭下,區塊鏈技術在整個商業和金融領域都在不斷發展。它促成的快速安全交易可能會徹底改變傳統數據系統。根據畢馬威和 Forrester Consulting 的調查, 三分之一的決策者信任他們公司的數據。但是使用區塊鏈技術,這種信任可以大大加強,真正的應用程序將變得更加普遍。

現在,每個公共區塊鏈上都存有數百萬比特的數據。它的潛在價值是巨大的。

然而,還沒有一種簡單的方法可以全面地查看它,這意味著我們無法研究,跟蹤或以其他方式充分利用它。

這是一個失去的機會,因為可以用這些數據做很多事情。例如,如果我們將這些數據植入機器學習模型,我們就可以跟蹤有助于我們防止惡意用戶行為的趨勢,例如盜版或販毒。

區塊鏈與大數據總結

目前,我們僅將區塊鏈用于交易目的。

我們使用比特幣區塊鏈將錢從一個地址匯到另一個地址。通過以太坊的智能合約,區塊鏈上的各個地址可以在另一個地址上調用一個函數。

但是,數據僅用于事務或狀態機目的。

我們需要考慮的是:這筆錢是如何被轉移的?它在哪里?誰在做什么?我們可以將哪些地址識別為騙子或恐怖分子地址——黑暗網絡的中心?

想象一下,如果我們可以標記這些地址。然后,我們可以生成一個模型,以防止資金進入我們知道是恐怖分子,毒販或其他不良行為者的財產的交易所或地址。這對個人,公司和情報機構都很有用。但是這樣的功能還可以讓我們獲得某些經濟洞察力,例如能夠隨時間預測代幣的價格,我們可以通過跟蹤投機和移動的趨勢來做到這一點。

問題是,我們還沒有可用的機制來幫助我們進行跟蹤。

用戶可以查看區塊鏈并訪問與他們及其周圍人員進行的交易有關的信息,但他們無法在更廣泛的范圍內或以有意義的可視化方式執行此操作。在以太坊中,很容易通過 etherscan 跟蹤一個用戶,但不能同時跟蹤一大堆用戶。當然,這禁止我們利用這些數據進行潛在的有價值的事情,例如跟蹤資金流動的位置。

其中一個原因是區塊鏈本身仍處于概念驗證階段。它的數據結構已被證明是合理的,但它還沒有發展到它提供明顯效用的程度。它仍然只是一種存儲數據的機制。但現在有大量的數據,它相當于未開發的金礦。但那很快就會改變。數據就在那里 – 它就在那里使用,它就在那里進行實驗。現在是時候開始使用區塊鏈上的數據來創建實用程序了。

在許多方面,區塊鏈的出現與早期的互聯網類似。當互聯網首次啟動時,它實際上只是一個相互連接的計算機社區。那個社區確實產生了數據,但沒有多少。

但隨后,當越來越多的人開始使用它時,數據量呈指數級增長。人們意識到,如果他們能夠使用這些數據從中學習,訪問,閱讀,以允許其他人找到它的方式創建更多數據 – 他們需要某種增強的搜索能力。這就是為什么搜索引擎以及后來的社交媒體平臺誕生的一個重要原因。區塊鏈應該進行類似的計算。

僅在以太坊和比特幣上,已經有數百萬筆交易。ICO 已經創建。我們進入了一個新時代,這種技術在 90 年代早期就采用了與互聯網類似的規模。我們需要的是專門為利用這些數據而設計的應用程序。這種技術已經在其他領域廣泛使用。

有些公司(如 Palantir )收集和分析與電話,銀行賬戶和消息相關的數據,并將這些信息提供給 FBI 以協助搜索嫌疑人。可以輕松構建類似的東西來跟蹤,分析和利用跨各種區塊鏈收集的數據。建立機制以幫助我們跟蹤和使用區塊鏈上的數據不僅僅是一個機會。這是保證我們的資金和數據安全的一種手段。