淺析大數據與人工智能
時間:2018-08-22 16:43:00 閱讀:3948 整理:廣州市場調查公司
01、大數據產生的背景與概念
今天分享的主題是大數據和人工智能方面的知識。技術層面的知識不詳細講解,我們主要講解什么大數據的相關基本概念和基本應用,簡單講解一下涉及到的核心技術,最后總體概述一下人工智能領域的一些發展戰略和國際和國家的整體形勢。
首先分享大數據相關內容:大數據和人工智能是近期國際上最火的兩個詞,涉及各行各業。從大數據出現的背景來看,每隔十五年左右都會有一次比較大的變革,表現在:
第一次浪潮在80年左右,PC機盛行時期。PC機階段每個人都用計算機來信息處理,蘋果、微軟、聯想、戴爾、惠普、IBM都是典型的代表;
第二次浪潮是在互聯網出現以后,在95年前后的時期。每個計算機即可以處理個人的信息,而且把計算機鏈接起來進行相互溝通和交流形成互聯網,使得計算機不僅能夠處理信息,而且還能通過互聯網進行信息的共享。代表性的企業如雅虎、谷歌、百度、騰訊等;
第三次浪潮是在互聯網出現后到現在,這個階段的典型特征是數據量急劇增加,對計算能力以及數據的深度挖掘分析需求日益迫切,代表性的企業有谷歌、百度、騰訊、阿里等,他們都從傳統的互聯網企業轉型成大數據和人工智能企業。
02、大數據管理與分析主要技術
那么數據的產生和管理經歷什么樣的發展呢?可分為如下三個階段:
第一階段是企業數據產生之后,數據通過人工輸入的方式輸入到數據庫里面,進行統計查詢分析;
第二階段是web 2.0階段,亦稱之為自媒體階段,以微信、微博等社交媒體為代表。用戶自身即是信息的生產者,也是信息的分享者,信息量非常大;
第三個階段屬于物聯網階段。這個階段中會有大量的傳感器自動采集數據,把這些數據通過設備與設備、設備與人相連,形成一個互聯網系統。例如城市監控系統自動產生的數據等。這個階段機器自動采集和分享數據,數據量會進一步劇增。
其實,不管是web 2.0階段,還是馬上來到物聯網階段,我們已經進入了一個數據的爆發期。這么多海量的數據如何存儲呢?
從存儲的角度來說,雖然數據的變化兩年翻一倍,但從硬件發展的角度來說也遵循這樣的規律。隨著存儲技術的發展存儲介質也越來越便宜,存儲的容量越來越大,雖然數據的暴增,但存儲的容量和價格也降低的非常快,能夠適應當前數據海量增長的需求。
03、大數據技術在各領域的應用
大數據已經在各個領域發揮了顯著的作用。比如互聯網領域的推薦系統,城市管理方面的智能交通系統、環保監測系統等。另外,金融、電信、餐飲、政府、安全等領域都積累了非常大的數據,這些數據已經為企業的日常管理和決策發揮了非常大的作用。
國際上對大數據也非常重視,美國奧巴馬時期把大數據認為是一個國家未來發展的石油,把它當做一個國家的核心資產來看待,國家投入了很大的經費來支持大數據的研究;我們國家也把大數據作為我們重要的國家資產來盤活、應用,并且作為國民經濟的一個重要產業來發揮它的作用。近年來,國家對大數據項目的支持力度非常大,已經把人工智能上升為國家的一個戰略。
什么是大數據?大數據的定義很多,但有一個基本、大家還相對來說比較公認的一個說法,指無法在一定時間內用傳統數據庫軟件工具對其內容進行抓取、管理和處理的數據集合。這種說法還比較籠統,還有大家公認的4V的說法,它滿足四個特征:
第一個特征是量大,數據量要足夠大;
第二個特征是形式很多,不單單是我們傳統關系數據庫里面的數據;
第三個特征是實時性,就是要求數據到來之后,能夠實時在線進行分析處理;
最后一個特征是價值,并不能簡單地理解為它是有價值的,因為現在的數據量非常的大,但在數據中蘊藏有價值的東西,相對來說比較少,需要細加甄別。
從大數據的價值來說,它能發揮怎樣的作用?
第一,最重要的作用是引起了整個社會對數據的重視。近年來,企業里從領導到員工,對數據在企業的發展中作用都提上了一個很高的高度,這就是思維模式的一個變革。
第二,以前由于信息系統不發達,存儲的數據是對歷史比較片面的記錄和展現。現在在大數據時代,信息采集的手段越來越多,能夠把日常的行為信息都保存下來,相當于記錄了一個人、一個組織、一個社會的歷史行為。我們說要學習歷史,學習歷史的目的是為對將來社會、組織和個人的發展提供指導。如果說數據已經把社會、企業和個人的行為數據客觀、全面的記錄了下來,我們就可以做通過大數據建模的方式把它給抽象出來,可以為企業、個人、乃至社會的運轉提供支撐。大數據最重要的功能就是做預測,它憑什么能夠預測?就是因為他能夠從大數據中把蘊含的模式以模型的方式抽象出來,為將來的社會、企業、個人或者是各種需求來提供預測,提供幫助,這就是大數據最本質的東西。
說到大數據,我們再探討一下云計算。
云計算的核心技術包括:
第一是虛擬化;
第二是分布式計算;
第三是分布式存儲;
第四是多租戶。
云計算包含公有云、混合云、私有云,公有云是每個用戶都可以來申請,比如說谷歌、百度、騰訊等企業的云系統;
混合云就是說既有私有云,也有對公服務的;
私有云就是指我們的數據只有自己的企業用戶進行分享,外部用戶限制使用。
總的來說,云計算的主要目的是通過對硬件系統復用或者虛擬化的方式來提高數據的處理能力,這是云計算的一個基本得出發點。
最后一個概念是物聯網。企業里面有很多物聯網的形態存在,比如ID、二維碼、攝像頭、音頻終端等,主要這些具有感知能力的智能終端,能夠自動的采集數據,并把采集到的數據進行傳輸,進行分享,進而進行上層的處理。物聯網在現實生活中的應用還是非常多的, 比如智能交通的感知器、城市里的攝像頭、微博、雷達等。
云計算、大數據和物聯網代表了IT領域最新的技術發展趨勢,三者既有區別又有聯系,可以概括為:
(1)從大數據與云計算的關系來說,云計算為大數據提供了技術基礎,大數據為云計算提供了用武之地;
(2)從云計算與物聯網的角度來說,云計算為物聯網提供了海量的數據存儲能力,而物聯網為云計算技術提供了廣闊的應用空間;
(3)從大數據與物聯網的角度來看,物聯網是大數據的重要來源,而大數據技術為物聯網數據分析提供了支撐。
作為企業來說,應該有兩點認識:
第一,企業數據就是企業的資產:企業有很多現有的信息化系統,每天在產生很多數據。這些數據要想辦法合理的把它組織和管理起來,要挖掘這些數據當中蘊含的價值,要發揮這些數據的價值;
第二,開辟新的數據源:在一些業務領域建造一些新的數據源,這些采集的數據一方面支撐日常業務運營,同時也積累更多的企業運營數據。這些企業數據涵蓋各個方面和流程,數據越豐富,越能反映企業運轉的軌跡,記錄企業運營發展的規律。可以通過大數據分析的手段,探查企業運轉的流程,看是不是最優的運行方式;也可以挖掘企業運轉的模式,為將來企業的進一步發展和有效的運轉提供決策支持。
所以,第一個點告訴我們要樹立數據即資產的認識,想辦法盤活現有數據;第二點強調開辟更多的數據采集渠道和來源,盡可能的挖掘、發揮大數據蘊含的商業價值,為企業發展所用。
04、新一代國家人工智能發展規劃
新一代人工智能,是國家剛剛發布的《新一代人工智能白皮書(2017)》。對物流企業來說,掌握國家的人工智能發展趨勢,也是非常必要的。
人工智能的發展,經歷了三次浪潮:
第一次浪潮最早在50年代到60年代中間,人工智能剛剛興起,但由于當時的技術不足以支持人工智能的發展與實際應用,后來停滯不前進入了低谷;
80年代以后,人工智能又熱起來,這一次熱的原因是技術得到了解決,在這個階段大家耳熟能詳的一些技術,如BP神經網絡等;
第三次浪潮出現很多新的技術,如深度學習等。在這一時期,技術得到了一個很大的發展,很多企業把這種技術投入應用,解決一些社會的實際問題,產生了顯著的經濟價值。
總的來說,這次浪潮要比前兩次的生命周期要長一些。為什么人工智能的第三次浪潮不像前兩次很快就過去了?主要得益于三方面的驅動因素:
第一方面的驅動因素是大數據,現在數據采集的手段積累了大量的數據,這種數據為人工智能的發展提供了一個很好的基礎;
第二個方面的驅動因素是計算平臺運算能力的不斷提升,促進了人工智能的落地;
第三個方面的驅動因素是應用場景的不斷擴充。總的來說,國際人工智能產業預計仍然保持一個爆發式的增長,我國人工智能對全球人工智能產業發展起到一個重要的推動作用。我們的企業要抓住大數據與人工智能的機遇。
關注公眾號:
華夏經緯數據科技
更多調研資訊>>
本站文章內容以及所涉數據、圖片等資料來源于網絡,轉載目的在于傳遞更多信息。版權歸作者所有,文章僅代表作者觀點,不代表華夏經緯立場。 如涉及侵權,請聯系管理員刪除。在法律許可的范圍內,華夏經緯(廣州)數據科技股份有限公司享有最終解釋權。