2017年8月17日 星期四

Data Science UnHackathon - 加密貨幣,開放數據

這天去了一個以 Data Science 為題的團體所舉辦的 UnHackathon Meetup,https://datasciencehongkong.com/2017/08/22/unhackathon-at-the-hive/。半日時間加上Meetup/性質算比較小規模,不過都有幾組實際地寫出一些Code和有可以展示的結果,至於我在自由的環境下,就只做了花生組中的一員,哈哈~今日也留意到一個香港的hackathon現象,就是香港人還是花生友多,外國人和學生才比較認真。不過另外也聽聞今次的花生比例還己經算低了,今日的 5:1 可能出面己經是1:5。而相比之前的一些IT event,這種Data Science 的活動有個好處,就是R 和 Python 明顯是大家的共同語言,之前那些更著重實際去寫一個應用,就偏向JS, Java, Python,Data Science的角色很少,之前講起R,在開發的導向中真的找不到什麼存在價值。(其實,R就是統計起家的吧,而在這場數據科學熱之中的Machine Learning都去到很多人無需要留意前設或者原理,的純IT Coding知識......)

傾計之前都有留意一些有興趣的題目,首先是一個有關虛擬的加密貨幣Cryptocurrency投資策略,只是我未了解這些虛擬貨幣的交易,例如周初才知道比特幣升穿4000USD,而電視上一個市場解讀是連繫到特朗普作風下的地緣風險,我就未有理解過的,到本周中又繼續上到4400USD了。在策略方面的取向也不同,一向覺得 投資市場內小投資者做短期投機相對風險和心力之下,利潤空間不大;在單一貨幣的Time Series中研究也未必有多大策略的空間。不過這次才體會到,原來至今已發展到市場上幾百種的加密貨幣,從平日多見到 Bitcoin 比特幣 (佔市值50.7%)、 Ethereum 以太幣 (市值佔19.9%),到俗稱Alt-Coins的大量後起的仿效品;也有眾多的交易所同樣進行虛擬貨幣的交易。所以,一些考慮的方向就是這種多貨幣、多交易所的亂象中套利。不過這就是講求Product Knowledge 多於 Statistics 的時候。

至 2017-08-17,https://coinmarketcap.com/ 上超過800種加密貨幣的市值合共 USD$142,970,123,566。需要數據的話,也有一個以JSON格式提供資訊的API:https://coinmarketcap-nexuist.rhcloud.com/


交易所方面比較多見到提及的就有外國的Coinbase、Poloniex;中國的BTCC、OKCoin、CHBTC 等;香港在各處實體的比特幣ATM,到ANX、Gatecoin;台灣也有所涉獵:http://blockcast.it/2017/05/24/introduction-of-local-and-global-cryptocurrency-exchanges/


另一個有興趣的題目是有關Web Data Extraction,提出的人也是今次的主辦者。在開放數據中,香港在開放數據方面的落後已經是經常被咎病了吧,從資料類別、原始程度、開放程度、到檔案格式等問題,不過當日就只是一個網頁資訊擷取的主意,也未見其他人勾起興趣,所以未見有人發展下去。但現在事後想來,如果做到一個像 https://webb-site.com/ 那樣眾多資訊(期望是自動更新),而介面外貌比較好的網站,應該也會是很好的經驗。另外,或許除了不斷『說』開放數據的意義和重要性之外,如果有人專門以開放數據來做研究分析,或許可以透過實際應用的結果,去勾起香港人/政府部門 對這方面的注意。

最後,在聽了當日成果的發佈後,原來自己在這個Blog嘗試過的項目,也有其他人有興趣做類似的東西,也許這個門外漢的興趣都有點意思。這個Blog的紀錄也起碼讓自己儲起生活中嘗試過的結果和方法,有需要時也可以找回這些Source code來加快實作。最後,花生友閒聊之中見識到一間做 保險科技 平台的Startup人,問到一些從前台介面到後台運算的語言選擇,有點欣慰自己早前所嘗試學習的 JS 也許是正確選擇;與Java等相比,Python也許不應放下。

忙完上幾個月的家居事宜,是時候繼續記待記的:有機蔬果、 Tidyquant、ML4B #4、Gym、PMP, etc..... ^_^



沒有留言:

張貼留言