EN

ITC

4月26日晚,宇杉迎來了一場科技感十足的讀書會,由王奪為大家講解《數據挖掘導論》一書。

          

什么是數據挖掘?

在大數據時代,數據量呈幾何式增長,傳統的數據分析技術已經無法對數據深度價值挖掘。而近些年隨著存儲技術和計算機性能的增長,基于大數據的數據挖掘技術應運而生。數據挖掘是一門技術,從真實世界的數據中識別出有用的路徑,進而獲取新的知識,最終落實到決策制定。

          
數據挖掘最主要的技術為分類技術和關聯技術。

分類技術

這是一個普遍存在的問題,有許多不同的應用。例如:根據電子郵件的標題和內容檢查出垃圾郵件,根據核磁共振掃描的結果區分腫瘤是惡性的還是良性的,根據星系的形狀對它們進行分析。具體分類方法包括:1)決策樹:通過一些精心設計的問題,有層次的檢驗數據集屬性,從而解決分類問題。例如:一名24歲的單身女性就可以根據決策樹法來縮減自己未來配偶的篩選范圍
          

2)貝葉斯分類器:以貝葉斯定理為基礎,通過比較在已知屬性集的情況下,不同類標號出現的概率來進行分類?!叭T問題“即是非常知名的案例。

          

          

3)神經網絡,它可以看成是一種仿生的結構,通過模擬人腦神經元傳遞信息的方式來進行復雜模型的構建。

          

其關鍵就是模型的層數與激活函數的選擇。

          

關聯技術

即在大量集中的數據里,通過關聯分析,發現隱藏在數據中的有意義的聯系。比如:在購物習慣中是否買尿布的人會有更高概率買啤酒呢?

          

讀書會思考

設想未來某一天你吃什么做什么都有一份參考指南,這是根據你過去的人生軌跡進行分析得來的,順從你過去的心意,這是否會是一份完美的決策建議?

          
設想未來某一天你吃什么做什么都有一份參考指南,這是根據你過去的人生軌跡進行分析得來的,順從你過去的心意,這是否會是一份完美的決策建議?

阿法狗在戰勝柯潔之后,人工智能已經從歷史數據的監督學習上升到自我訓練的強化學習, 如果人工智能比你還了解自己,人類是否還存在自由意志?
美国三级片_色欲色香天天天综合网图片_国产免费不卡午夜福利在线_国产萌白酱福利喷水视频在线观看