02 大數據在社交媒體中的應用ppt(網絡輿情大數據要怎么進行分析?)

时间:2024-05-14 23:15:52 编辑: 来源:

不需要決策部門每天坐在一起拍腦袋決定是誰,不是誰。剛才說到數據安全問題,我認為數據安全和技術是矛和盾的問題。現在接受就可以了,當我們現在收到騷擾短信垃圾短信,為什么會收到,是因為他們掌握了我們手機信息。當企業掌握了很多的信息以后,這時候就造成可以滿意度的問題,讓數據決定數據安全,讓市場決定技術到什么程度,自然會有優勝劣汰,服務好的企業就會持續發展,服務部好的企業就會死掉。

    葛涵濤:我們對用戶數據掌握的越來越多,我們對數據精準分析越來越多,我們傳遞出來的消息就是精準營銷,傳遞的信息就是有用的信息,而不是垃圾信息。這實際上對我們大數據企業,對技術和算法提出了更高的要求。如何通過大數據分析方法尋找數據中隱藏的,還沒有被發現的價值和知識。

    楊明剛:其實所謂大數據,大價值,大數據應該不是大忽悠,我為什么這么說?因為我在過去一段時間,有一個地方政府,某一個行業部門在使用大數據,但是建完的大數據系統無法滿足他們的業務需求。我們傳統的大數據,一部分是對現有數據的發現,這就是數據檢索,傳統的數據方法就可以做到,對已知的東西,已知的問題,每個數據單元都是了解的,這時候無論是結構化數據,還是非結構化數據,我們可以帶著問題找到蛛絲馬跡,問題存在什么地方。另外一部分應該是預測的部分,就像海爾孫總談到的問題,其實可以預測。業務管理專家和業務模型建構專家需要有一個緊密結合。大數據其實是一件奢侈品,對華為這樣的產品,對我們海爾這樣的企業,對殼牌這樣的企業是可以投得起資金的,大數據是奢侈品,但是絕大部分的中小企業也需要科學決策,也需要了解市場需求,這時候面臨很重要的選擇,要面臨高昂的成本建立系統,這是不可能的。但是絕大多數的大數據企業都需要高投資,中小企業怎么通過在數據時代不被淘汰,需要大數據解決方案提供商,或者需要大數據研究者提供一種更典范的,或者更普世的大數據解決方案,不是依托與傳統的數據檢索,或者傳統的數據包裝實現大數據的方案,而是需要跳出傳統的大數據分析方法之外,能不能有另外一種更科學,更普世的方法,讓我們很多中小企業都能享受到當今的大數據服務,需要我們在座的一起探討。實際上個人也需要大數據服務。

    葛涵濤:跟簡單,更方便使用的大數據產品,方便企業減少這方面的預算,讓更多的人使用大數據帶來的便利。

    楊明剛:中國的天氣預報部門利用大數據是最好的,把過去一百多年的歷史數據拿過來進行預報。真正的大數據是對未來可能的知識的發現,通過大數據發現潛在的數據之間的關聯。

    葛涵濤:實際上我們剛才提到了各個不同的行業和企業對大數據的應用,因為你在北大做了十年CIO方面的培養,你們對CDO這方面的人才培養有什么樣的動作和支持。

    魯四海:我們也在探討,剛才我們在PPT里面分享,首先為什么會有這樣的角色存在,驅動力是什么?然后再說需要什么楊得技能?我覺得CDO有一部分的東西需要從課堂學習的,偏技術這塊的,能涵蓋技術和基礎管理這塊。CDO需要有一些經濟學的基礎在里面。大數據更大的是告訴我們未來是什么樣,告訴我們一些未知的東西。不是提一個假設,拿數據進行分析證明這個假設是對的或者是錯的,這個意義不大。真正的意義能夠告訴你未來是這樣的。我覺得CDO在培養過程當中,除了課堂學習以外,還要跟內部的業務部門進行內部的學習和交流。因為我們面臨著未知的世界,更多的需要廣闊的舞臺,像CDO聯盟一樣,未來我們做一些交流性的東西,各個行業,不同行業的方式方法進行跨界整合,因為數據在這個時代就是跨界。

    葛涵濤:下面我們請我們在座的各位嘉賓,用簡單的一兩句話展望一下大數據時代下,我們這些數據管理人才,CDO們如何在整個大數據背景下做好我們的工作,能在工作上出新出彩,在我們業務設計上有相應的業務創新。

    魯四海:應該說任何一個行業任何一個企業的數據都是資產,每個企業都將擁有將數據變成核心競爭力的能力,這個能力可能是自建也可以購買服務獲得。

    楊明剛:大數據應用成為未來決策的核心推動力,今天的大數據不能成為大忽悠。

    董昕:我們談了很多技術方面的話題,我覺得一個CDO第一應該有大數據的理念,未來主要的價值都是數據。另外一點,我們認為作為一個CDO,一定要跟我們業務相聯系,懂我們的業務,知道我們的收入從哪里來,成本在哪里,效率從哪里提升,這樣CDO才能落地。

    徐斌:數據本身有沒有價值,我個人認為數據是沒有價值的,雖然我今天講了很多大數據。只有當數據能幫助企業產生價值的時候才能成為有價值的資產。我經常說數據資產,每個公司都有大量的數據,他們不是資產,因為它沒有用。數據只有成為有用的信息,成為知識,變成智慧,它才是真正的數據資產。不要神話大數據,大數據產生業務的價值,產生商業的價值才叫大。第二我們企業有CDO,或者有虛擬CDO職位,通過其他的CIO、CMO承擔。最主要的是腳踏實地,循序漸進,如果你不把企業的數據用好,談何大數據。如果企業沒有從數據支持決策的文化,大家做任何事情不用客觀數據幫我們做分析,給你再多的數據也沒用。首先是企業文化。第二把現有的數據用好,然后循序漸進引用更多的數據做分析。通過數據發現未知東西,這是偽命題。因為你發現未知東西,因為你不知道,原因是什么。當形成智慧知道為什么會發生,這是我們追求的目的,只不過我們現在不知道,所以通過相關的分析找到了相關性,但是不知道原因。未來當我們有足夠多的知識積累,我們就知道原因了。未知領域是大數據的使用階段。

    劉冬冬:大數據這塊沒有找到盈利模式,沒有找到市場,推不動。現在大家找到了盈利模式才推下去了,這才是有用的,大數據有用才是硬道理。對于CDO來說,我認為跨界才是最重要的。不光要有知道企業內部的小數據,同時也要知道外部的數據如何和企業內部的數據相結合。比如說做銷售的,系統能不能很快的告訴員工,這個公司銷售額有多大的產能,以及其他合作公司等等的情況,有價值才是最重要的。

社交媒體中大數據的缺點有哪些?

社交媒體中大數據的缺點有數據質量不高,保密性不強等缺點。

大數據(big data),或稱巨量資料,指的是所涉及的資料量規模巨大到無法透過目前主流軟件工具,在合理時間內達到擷取、管理、處理、并整理成為幫助企業經營決策更積極目的的資訊。

在維克托·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大數據時代》 中大數據指不用隨機分析法(抽樣調查)這樣捷徑,而采用所有數據進行分析處理,大數據歸納有五大特點:Volume(大量)、Velocity(高速)、Variety(多樣)、Value(低價值密度)、Veracity(真實性)。

定義詳解:

大數據(big data)是指無法在一定時間范圍內用常規軟件工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。

大數據分析一般用什么工具分析

在大數據處理分析過程中常用的六大工具:

Hadoop

Hadoop 是一個能夠對大量數據進行分布式處理的軟件框架。但是 Hadoop 是以一種可靠、高效、可伸縮的方式進行處理的。Hadoop 是可靠的,因為它假設計算元素和存儲會失敗,因此它維護多個工作數據副本,確保能夠針對失敗的節點重新分布處理。Hadoop 是高效的,因為它以并行的方式工作,通過并行處理加快處理速度。Hadoop 還是可伸縮的,能夠處理 PB 級數據。此外,Hadoop 依賴于社區服務器,因此它的成本比較低,任何人都可以使用。

HPCC

HPCC,High Performance Computing and Communications(高性能計算與通信)的縮寫。1993年,由美國科學、工程、技術聯邦協調理事會向國會提交了“重大挑戰項目:高性能計算與 通信”的報告,也就是被稱為HPCC計劃的報告,即美國總統科學戰略項目,其目的是通過加強研究與開發解決一批重要的科學與技術挑戰問題。HPCC是美國 實施信息高速公路而上實施的計劃,該計劃的實施將耗資百億美元,其主要目標要達到:開發可擴展的計算系統及相關軟件,以支持太位級網絡傳輸性能,開發千兆 比特網絡技術,擴展研究和教育機構及網絡連接能力。

Storm

Storm是自由的開源軟件,一個分布式的、容錯的實時計算系統。Storm可以非常可靠的處理龐大的數據流,用于處理Hadoop的批量數據。Storm很簡單,支持許多種編程語言,使用起來非常有趣。

Apache Drill

為了幫助企業用戶尋找更為有效、加快Hadoop數據查詢的方法,Apache軟件基金會近日發起了一項名為“Drill”的開源項目。Apache Drill 實現了 Google's Dremel.

據Hadoop廠商MapR Technologies公司產品經理Tomer Shiran介紹,“Drill”已經作為Apache孵化器項目來運作,將面向全球軟件工程師持續推廣。

RapidMiner

RapidMiner是世界領先的數據挖掘解決方案,在一個非常大的程度上有著先進技術。它數據挖掘任務涉及范圍廣泛,包括各種數據藝術,能簡化數據挖掘過程的設計和評價。

Pentaho BI

Pentaho BI 平臺不同于傳統的BI 產品,它是一個以流程為中心的,面向解決方案(Solution)的框架。其目的在于將一系列企業級BI產品、開源軟件、API等等組件集成起來,方便商務智能應用的開發。它的出現,使得一系列的面向商務智能的獨立產品如J買粉絲、Quartz等等,能夠集成在一起,構成一項項復雜的、完整的商務智能解決方案。

大數據營銷知識點總結

一、走進大數據世界

大數據的特征(4V):

1.  數據的規模性

2.   數據結構多樣性

3.   數據傳播高速性

4.   大數據的真實性、價值性、易變性;

結構化數據、半結構化數據、非結構化數據

大數據處理的基本流程圖

大數據關鍵技術:

1.  大數據采集

2.   大數據預處理

3.  大數據存儲及管理

4.   大數據安全技術

5.  大數據分析與挖掘

6.   大數據展現與應用

二、大數據營銷概論

搜索关键词: