提高工作效率分享–數據挖掘12-插播機器學習
大家好,新的一周開始了,周末我聽了一個線上的分享,關於機器學習方面的內容,講的很好所以我來做下筆記。
正式開始~~~
近期機器學習與以前相比有哪些變化?
數據的擁有:
採集數據、簡單處理數據的能力有所提高
對數據定性的能力:
例如對一張照片的標註,如一隻狗還是一隻貓
計算能力的飛躍:
不僅局限於在CPU上進行計算,而且可在GPU、GPU雲上進行計算
機器學習理論、演算法的提高:
有很多的開源軟體、自動化的方式可以剪短開發周期
綜上近5年的飛躍,開始看好機器學習。(機器學習早就存在,但是之前並沒有被看好)當我們擁有足夠數據量的時候,神經網路演算法的應用,如自動駕駛、自動識別路況、自然語言的智能(聊天記錄、音頻、視頻信息)就可以訓練一個機器來幫助人類的行為。
這個線上分享關注於智能醫療,但我覺得該原理在各個領域都相似,只是大數據存儲信息的區別。智能醫療的產生和發展來源於人類做決策的局限,人類個體所了解的信息是不完全的,人類處理信息的能力也是有限的,不是那麼快,導致判斷時會出現錯誤。機器學習可以為人類做決策做出輔助。
為什麼要相信機器?
比如對一件事情的判斷最高的準確率為100%,深度學習演算法是建立在普通機器學習之上,更加複雜和深入。當數據量增加到大數據量時,深度學習可以利用大數據的資源進行演算法的計算,並超過人類判斷能力準確率的極限。
為什麼機器的智能學習是可行的? 共有4點說明:
醫療數據是各個領域數據整合比較好的
醫學的影像系統都記錄了下來
醫療的數據量足夠
醫療數據需要清洗和處理進行標記,有生物指標、病理的推理、治療的方案、複查、治療的效果等。(數據的標記很重要,計算機可以通過學習已經標記的數據,產生一套智能演算法,得出推論和判斷)
關於機器學習演算法的原理的描述?
機器學習理論,神經網路的突破,由輸入層到輸出層。假如輸入層是一張圖片,輸出層就會告訴我們是一隻貓的概率是多少,是一隻大象的概率多少,或者是一個什麼風景等等,最後取最高概率結果。
輸入層到隱藏一層、到隱藏二層、到隱藏三層...直到輸出層。
卷積計算過程:小窗戶圖片與輸入層圖片的相似度有多少?
每進行一次覆蓋就會得出一個數據,這個數據放在矩陣中;如果計算得出的結論是對的,會保存小窗戶上的圖片,如果結論是錯的,就改變小窗戶上的圖片,這就是卷積神經網路工作過程的粗淺描述。目前為152層,超過人類判斷的準確率。
另外智能學習在有一定量數據之後可以將更微妙的聯繫洞察到,比如:該治療方法適合什麼性別的病人,適合什麼身高體重的病人等等。
以上就是我做的筆記,感謝大家的閱讀,886順祝大家新的一周一切順利。
※用Sklearn創建機器學習分類器模型,不用數學公式也好理解
※機器學習記錄舞步 保存民族舞蹈
※運維要失業了?機器學習可自動優化你的資料庫管理系統
※企業應該怎樣選擇數據科學和機器學習平台?
※28款GitHub最流行的開源機器學習項目
TAG:機器學習 |
※2018年一季度全國挖掘機產量數據分析:產量累計增長35.7%
※大國重器——徐工700噸液壓挖掘機下線
※9.8版本高勝率打野盤點 蠍子力壓挖掘機登頂
※7月挖掘機銷量創歷史新高 行業盈利逐步提升
※9.5版本英雄勝率一覽:挖掘機54%勝率傲視群雄!
※5iMX模友的1:50工程小隊 靜改動 之 CAT 330D 挖掘機【改裝鑒賞】
※巨型挖掘機,造價5.7億,27人操作
※限時免費 | 限時領取|10G+AI人工智慧/複雜系統/數據挖掘/深度學習/Python
※土豆挖掘機——柯爾特 M1895機槍
※KDD 2018 的首個「深度學習日」,要讓數據挖掘會議更「純粹」
※數據挖掘經典演算法之C4.5
※免費領取 | 10G+AI/Python/數據挖掘/複雜系統/深度學習資料大禮包
※2018年零基礎學習大數據挖掘知識點整理
※內存雙通道挖掘銳龍APU最大潛力!AMD銳龍3 2200G核顯主機配置推薦
※AMD 7代APU新品A6-9400悄然上架:28nm雙核挖掘機
※10G+AI人工智慧/複雜系統/數據挖掘/深度學習/Python資料
※徐工造700噸級液壓挖掘機,打破發達國家,對大型挖掘機的壟斷
※2018年上半年江蘇省挖掘機產量數據分析;產量突破60000台
※南京54平米的小墓為何耗費30年時間,還借調了抽水機和挖掘機
※分析挖掘平台助力數據價值利用