04 分析一個有代表性的買粉絲買粉絲答案(基于買粉絲大數據的股票預測研究)

时间:2024-05-18 16:03:43 编辑: 来源:

問題,而沒用恰恰是這個問題的有用之處。

因人而異,存在即合理啊,我也做過一段時間的期貨外匯交易。技術分析是有用的,但也不是適合所有人,我見過大神不看任何指標的,也見過中規中矩的人,兩種人都可以在期貨交易盈利。

最后一句話送給你,期貨外匯的水太深,老鐵你把握不住!!!

沒有用。期貨波動太快,主要是消息面的影響5.1過后,鋼材價格暴漲,連續漲停。后面連續陰跌不止,你說技術指標有用么?

基于買粉絲大數據的股票預測研究

基于買粉絲大數據的股票預測研究

大數據是近些年來的熱門話題,無論國際上還是國內,影響很大。經濟學、政治學、社會學和許多科學門類都會發生巨大甚至是本質上的變化和發展,進而影響人類的價值體系、知識體系和生活方式。而全球經濟目前生成了史無前例的大量數據,如果把每天產生的大量數據比作神話時期的大洪水是完全正確的,這個數據洪流是我們前所未見的,他是全新的、強大的、當然,也是讓人恐慌但又極端刺激的。

而我所分享的話題,正是在互聯網環境下,如何利用大數據技術,進行股票預測的研究。–今天,我想分享我認為有意義的四點。

1.大數據下的商業預測

根據大數據,我們可以有效地進行故障、人流、流量、用電量、股票市場、疾病預防、交通、食物配送、產業供需等方面的預測。而本文我們所關心的內容是股票市場的預測。

大數據的核心是預測,預測依賴于對數據的分析。那么分析的方法是否是基于隨機采樣的結果而設計的,這樣的分析方法是否會有誤差?

從傳統認識上,由于資源和科技的局限,如人和計算資源受限、從計算機處理能力來講無法處理全部數據來獲取人們所關注的結果。因此隨機采樣應運而生,通過所選取的個體來代表全體,如使用隨機抽取的方式來使得推論結果更科學。但既然提到了大數據,它是資源發展到一定程度、以及技術發展到一定階段產生的一個新的認識。如同電力的出現,使人類進入了一個快速發展階段,大數據也一樣,它的含義是全體樣本,從整體樣本來做推論。在本文大數據的含義是所有股票在整個社交網絡上的流動信息,從數據源上講,本文沒有采用所有社交網絡上的數據,只分析了買粉絲這個最具代表性的社交媒體作為信息源。

互動數據能反映用戶情緒,搜索數據能反映用戶的關注點和意圖,在股市預測時這兩種數據哪種更具有參考價值?

我認為都有價值,互動數據反映了用戶對某一特定股票的喜好和厭惡,可以簡單描述為對該股票的操作是繼續持有還是賣出;而搜索數據則代表用戶在收集該股票信息的過程,它是關注度的概念,某只股票搜索度高則意味著消息的影響力大。互動代表著方向,搜索代表著振幅。

我們知道這兩種數據得出的結論會有差異,您是如何平衡這兩種數據反映的情況來進行預測的?

正如上一個問題里提到的,如果是股票推薦,買進賣出等原則問題,則應該考慮互動數據,但如果已經買到手了,搜索數據可以提供一個幅度的概念,類似債券評級A級、AA級、AAA級等,供投資者參考,因為不同投資者對風險的承受度是不同的。

將股票和市場的消息整理成140字的短消息發布,是否意味著主要發布渠道是微博?現在買粉絲買粉絲很火,有沒有考慮通過這個渠道也發布消息?

事實上,信息傳播的方式很多,買粉絲作為新媒體當然影響力不容小覷,但目前技術投入最小的還是郵件、短信等方式,未來會考慮使用買粉絲來推送股票和市場消息。

如果在未來通過買粉絲買粉絲推送消息,那么推送的消息會不會作為數據來源被再次采集?這會有多大的影響?

會被采集,但互聯網上的每日關于個股的信息數量會達到很大,該推送會增加推薦股票1點權重,每只股票的權重成百上千,因此影響極小。

數據來源是買粉絲買粉絲,除了準確性的考慮之外,是否還考慮過這樣收集數據會較少觸犯個人隱私?

從法律角度來看,搜索買粉絲或其他個人聊天記錄,是侵犯個人隱私權的,因此如果騰訊開放了這樣的接口,每個公民都可以對這樣的行為進行投訴、抗議、甚至進行法律起訴直至其改正過錯、賠償損失的。

這樣是否意味著即使存在違法的行為,其結果也是由騰訊來承擔,而我們作為數據的使用方不需要承擔任何法律責任?

在整個社會,我們作為系統技術提供方,應恪守大數據的倫理道德,遵守國家法律,如侵犯個人隱私,系統不會采集,谷歌有一句座右銘“谷歌不作惡”,本文提到的系統也一樣。

2.基于大數據進行股票推薦實驗

股票的及時度反應了買粉絲文章所發布的時效性,及時度越高,數據價值就越大。

股票的熱度反應了當前某只股票被關注的頻度,關注頻度越大,上漲的可能性越高。

數據的完整性:我們采用循環的方式對所有深滬兩地發行約2236只股票(創業版除外)在買粉絲搜索網站上的搜索結果進行保存。

數據的一致性:文件格式由負責保存數據文件的程序決定,單一的流程保障了文件的一致性。

數據的準確性:由于所分析的訂閱號文章的是由買粉絲公共平臺的買粉絲所提供,在一定程度上杜絕了虛假消息對于預測系統的破壞。

數據的及時性:考慮到磁盤讀寫以及采集程序所處的網絡帶寬,以及搜索引擎對于采集程序的屏蔽,程序中采集兩條信息之間間隔了5秒,因此理論上11180秒(3.1個小時)可收集完當日推薦所需要的數據。對于每個交易日,在9點-9點30分之間采集所有數據,需要7臺以上的設備可達到最佳效果。本次試驗受限于試驗設備,在一臺設備上,交易日每天早六時開始進行數據采集,也滿足及時性要求。

數據分析:查看三個高優先級的股票,該股票當日的開盤價與收盤價,再與當日(2015-4-8)上證綜指進行比較,可得在收益上該算法是優于上證綜指為樣本的整體股票的股價差收益的。

實驗結論:按照上述方式,系統每天推薦出當日股票,在開盤時進行買進,在第二個交易日進行賣出。經過一個月21個交易日(2015-3-1至2015-3-31),系統的收益為20%/月。通過買粉絲搜索買粉絲來預測市場走勢和投資情緒呈現出正相關性,因此可以作為股票甄選的因子。

3.股票預測的大數據發展趨勢

網絡數據分成三種:

一是瀏覽數據,主要用于電商領域的消費者行為分析,瀏覽數據反映了用戶每一步的訪問腳步,進一步刻畫出用戶的訪問路徑,分析不同頁面的跳轉概率等。

二是搜索數據,主要指搜索引擎記錄的關鍵詞被搜索頻次的時間序列數據,能反映數億用戶的興趣、關注點、意圖。

三是互動數據,主要是微博、買粉絲、社交網站的數據,反映用戶的傾向性和情緒因素。

2013年諾貝爾經濟學獎得主羅伯特?席勒的觀點被無數采訪對象引述。席勒于上世紀80年代設計的投資模型至今仍被業內稱道。在他的模型中,主要參考三個變量:投資項目計劃的現金流、公司資本的估算成本、股票市場對投資的反應(市場情緒)。他認為,市場本身帶有主觀判斷因素,投資者情緒會影響投資行為,而投資行為直接影響資產價格。

計算機通過分析新聞、研究報告、社交信息、搜索行為等,借助自然語言處理方法,提取有用的信息;而借助機器學習智能分析,過去量化投資只能覆蓋幾十個策略,大數據投資則可以覆蓋成千上萬個策略。

基于互聯網搜索數據和社交行為的經濟預測研究,已逐漸成為一個新的學術熱點,并在經濟、社會以及健康等領域的研究中取得了一定成果。在資本市場應用上,研究發現搜索數據可有效預測未來股市活躍度(以交易量指標衡量)及股價走勢的變化。

對于搜索數據:互聯網搜索行為與股票市場的關聯機理。這個研究屬于行為金融與互聯網的交叉領域,其原理是:股票量價調整是投資者行為在股票市場上的反應;與此同時,投資者行為在互聯網搜索市場也有相應地行為跡象,我們要做到是:找到互聯網搜索市場中領先于股票交易的行為指標,綜合眾多投資者的先行搜索指標,對未來的股票交易做出預判。

如同天氣預報那樣,不斷優化模型、灌入海量信息,然后給出結果。并且在處理的信息中,有80%是“非結構化”數據,例如政策文件、自然事件、地理環境、科技創新等,這類信息通常是電腦和模型難以消化的。采用了語義分析法,可以將互動數據里的金融對話量化為“-1(極度看空)”到“1(極度看多)”之間的投資建議,通過分析互動數據的數據文本,作為股市投資的信號。

4.正在發生的未來

大數據并不是一個充斥著算法和機器的冰冷世界,人類的作用依然無法被完全替代。大數據為我們提供的不是最終答案,只是參考答案,幫助是暫時的,而更好的方法和答案還在不久的將來。

大數據在實用層面的影響很廣泛,解決了大量的日常問題。大數據更是利害攸關的,它將重塑我們的生活、工作和思維方式。在某些方面,我們面臨著一個僵局,比其他劃時代創新引起的社會信息范圍和規模急劇擴大所帶來的影響更大。我們腳下的地面在移動。過去確定無疑的事情正在受到質疑。大數據需要人們重新討論決策、命運和正義的性質。擁有知識曾意味著掌握過去,現在則意味著能夠預測未來。

大數據并不是一個充斥著算法和機器的冰冷世界,其中仍需要人類扮演重要角色。人類獨有的弱點、錯覺、錯誤都是十分必要的,因為這些特性的另一頭牽著的是人類的創造力、直覺和天賦。這提示我們應該樂于接受類似的不準確,因為不準確正是我們之所以為人的特征之一。就好像我們學習處理混亂數據一樣,因為這些數據服務的是更加廣大的目標。必將混亂構成了世界的本質,也構成了人腦的本職,而無論是世界的混亂還是人腦的混亂,學會接受和應用他們才能得益。

我相信,利用基礎數據、搜索數據、互動數據再進行加權計算,可以對所有股票進行大數據遴選,從而給出投資建議。我認為,我們的肉身剛剛步入大數據時代,但我們的精神還滯留在小數據、采樣思維之中,率先用理性擊碎固有思維的人,也將率先獲得大數據帶來的益處。

在哪里能找到各行業的分析研究報告?

信息收集渠道:通常的渠道有公司官網、買粉絲公司官網、券商研究、數據庫、買粉絲、知乎、搜索引擎、網絡爬蟲等。那么究竟在什么情況下用什么渠道呢?下面逐一介紹。

公司官網:通常來說公司的官網包含信息很多,公司介紹、產品介紹、公司年報、招股說明書等,這些資料的可靠性通常比較好。上市公司的年報在經營分析內容里面會對該公司的業務銷售情況、利潤的推動因素等進行分析,因此當你想知道上市公司的業務發展情況,年報是不錯的選擇。上市公司的年報獲取途徑可從證券交易所,公司官網、巨潮、雪球等渠道去獲取。

買粉絲公司:買粉絲公司報告通常可以幫助我們知道非公開的信息,因為買粉絲公司通常會有自己的方法論對市場進行自己的定性分析,市場調研等,因此對于消費者的洞察、行業的趨勢研判通常找買粉絲公司的報告,但是它同時也存在數據往往口徑難以統一。市面上的買粉絲公司通常分為市場調查類買粉絲公司和管理買粉絲公司,前者一般為后者服務。市場調查類買粉絲公司例如艾瑞、尼爾森、益普索等公司通常在消費者調研、行業分析等方面提供自己的洞察,他們并不為企業的發展提供戰略決策。這類買粉絲公司的研究成果往往在他們的公司官網上都可以免費下載,可以作為我們行業研究數據的來源。管理買粉絲公司有必要則會聘請市場調查類買粉絲公司提供專門的調研分析,由管理買粉絲公司為企業給出具體的戰略建議。當然像麥肯錫、貝恩、BCG、羅蘭貝格等在自己的官網也會分享自己的行業洞見,這些信息都是幫助我們作出行業發展研判、商業模式分析的重要信息來源。

券商報告:券商的研究報告大多針對的是上市

搜索关键词: