摘要:人工智能利用大數據是值得付出努力的,沒有采用和接受這些新技術的企業在生產力方面將會落后,并在市場競爭中面臨失敗。 |
人工智能利用大數據是值得付出努力的,沒有采用和接受這些新技術的企業在生產力方面將會落后,并在市場競爭中面臨失敗。
為什么采用大數據?
現在最流行的是人工智能技術,盡管人工智能已經存在了幾十年,但直到最近它才進入主流的消費環境。由于采用的成本高,人工智能行業一直被財力雄厚、能夠獲得大量數據的企業所主導;這是因為,如果沒有當今的大數據技術,人工智能就難有作為。
數據有限的人工智能通常不過是一組規則,只會返回基本答案。數據在幫助人工智能設備了解人類的思考和感受方面發揮著重要作用,還可以實現數據分析的自動化。如果沒有足夠的數據(人工智能分析的原材料),人們就會看到類似于“人工智能驅動”提供幫助的糟糕例子,即微軟的Clippy。
然而,隨著數據量的爆炸式增長,現在可以訓練算法來提供更好的結果,幫助人們更有效地完成工作。
大數據的應用,什么是大數據?
谷歌公司不斷發展的翻譯服務就是人工智能在大數據支持下的一個例子。十多年前,谷歌公司從一個基于規則的系統轉變為一個基于統計學習的人工智能系統,使用來自真實對話和文本的數十億個單詞來構建一個更精確的翻譯模型。然而,這僅僅是一個開始。
現在各行各業的企業都加入了谷歌公司進入的市場。如今,許多時尚零售商(例如ASOS公司)都在提供人工智能服務,以預測顧客的需求,并提供更好的服務。
為了幫助顧客表達自己的時尚感,他們正在使用像WideEyes這樣的人工智能圖像識別軟件來分析顧客的商品照片(例如定位帽子、裙子和手袋等商品),并在現有目錄中推薦相關系列。這種近乎即時的分析是通過使用數千張圖像訓練軟件而實現的。
如上所述,使用大數據幫助客戶描述他們想要的東西所帶來的用戶體驗好處是不言而喻的,但這只是開始。大數據在許多不同行業的多樣化應用是無窮無盡的。許多企業現在甚至利用大數據來幫助他們做出更好的營銷決策,比如創建“客戶終身價值”模型。
利用人工智能和大數據算法(例如隨機森林、余弦相似度和深度循環神經網絡),分析所有可能的影響因素和將產生最大影響的返回因素,告訴人們是否應該提供營銷資金來鼓勵特定客戶群的重復購買。
每一個人工智能應用都需要大量數據才能成功。而谷歌、蘋果、Facebook、亞馬遜和微軟五大行業巨頭不僅擁有大數據,還擁有Pb規模的數據記錄人們的每一個數字動作。
話雖如此,大數據和人工智能并非遙不可及。重要的不僅僅是數量,還有“大數據”的質量。以倫敦交通局提供的數據集為例,這是一個偉大的倡議,可以公開他們的歷史旅行數據,制作地鐵可視化動態圖。
然而,僅憑這一點并不能讓深入了解客戶正在經歷什么,他們要去哪里,延遲和失敗的原因等等。為了得出有趣的結論,需要把數據和環境結合起來,例如如天氣、事件和其他可能影響交通的因素。
對于五大行業巨頭之外的企業來說是不是太晚了?他們把所有的大數據都搞定了嗎?不,有們已經看到許多大企業(上面列出的一些)加入了大數據游戲。
然而,數據應該被保留和保護,它是一項資產,應該在企業的資產負債表上確認。如果使用得當,將會給企業帶來競爭優勢。
如何處理大數據?
早期的大數據處理使用MapReduce等技術,但數據科學家需要更高級的工具,需要更少的編程來繪制不同數據集之間的相關性,解決科學、社會或工業問題。
ApacheSpark是這一領域的領導者,它提供了優雅而簡單的方法來表示復雜的分析,企業可以通過輕松地將任務分配到許多機器,在大數據集上運行分析之前,快速地在小樣本數據集上運行這些方法。
大數據面臨的問題和挑戰
《通用數據保護條例》(GDPR)將于2018年5月在歐洲全面生效,并將取代現有的數據保護指南。該立法旨在保護個人的個人身份信息(PII),明確說明客戶在提供他們的數據時注冊了什么。此外,個人對自己的數據有更嚴格的控制,包括:刪除、訪問“他們的”數據記錄和更改他們的同意的具體權利。
例如,如果一家超市要求顧客提供個人數據以完成他們所要求的一項特定服務,這是一回事,但在服務提供很久之后,保留這些數據并將其用于針對該顧客的營銷目的,則需要獲得具體的可操作的同意。
一些專家預測,現在儲存的消費者數據有一半可能會變成冗余的數據或者需要刪除,以符合這個新規定。那么,應該放棄大數據嗎?不能,盡管人們不再能夠像以前那樣通過含糊的聲明來獲取那么多的數據,但GDPR為優化客戶價值交換、獲得客戶的信任和忠誠、讓每一條數據都變得重要帶來了機會。從實際層面來看,這可能意味著必須重新獲得同意,并重申處理的意圖。
盡管這在短期內似乎有很多麻煩,但利用人工智能駕馭大數據是值得付出努力的:不接受這些技術的公司在生產力方面已經落后,并可能在市場競爭中失敗。
編輯:Harris