面向大數據的圖聚類方法
雷鋒網AI研習社訊:聚類是統計學、機器學習和數據挖掘領域的重要研究問題之一,其目的是將數據對象劃分為多個類或簇(cluster),使同一簇中的對象之間有較高的相似度,而不同簇中的對象有較大的差異。聚類是數據分析的重要手段,在客戶分群、基因識別、文本分析、空間數據處理、衛星照片分析、醫療影像自動檢測等領域有著廣泛的應用。基於圖的聚類方法通過將帶權無向圖劃分為兩個或兩個以上的最優子圖,使子圖內部盡量相似,而子圖間距離盡量距離較遠,以達到聚類的目的。與傳統的聚類演算法相比,它能工作在任意的空間、能對任意形狀的數據進行聚類。但是,由於這類演算法需要進行特徵向量分解,具有較高的複雜度,所以在大數據時代面臨巨大的挑戰。我們針對大數據的需求,提出了一系列新的圖聚類方法及優化方法。
分享主題
Graph-based Clustering of Large-scale Data(面向大數據的圖聚類方法)
分享嘉賓
陳小軍,深圳大學計算機與軟體學院講師,主要研究方向為無監督學習、特徵選擇、集成學習等。發表了40餘篇學術論文,包括十餘篇CCF A類文章,如SIGKDD、ICDE、ICCV、AAAI、IJCAI、TKDE、TNNLS等。
分享提綱
1、聚類
2、圖聚類及歸一化割
3、分享的工作:
ISR: Improved Spectral Rotation [IJCAI 2017]
DNC: Direct Normalized Cut [SIGKDD 2018]
BKM: Balanced k-means for anchor generation [SIGKDD 2018]
分享時間
(北京時間 ) 10 月 26 日(星期五)20:00
直播鏈接
想了解更多雷鋒網 AI 研習社直播?
歡迎移步雷鋒網 AI 研習社社區~
※驚魂 17 天!信心滿滿要搞私有化的 Elon Musk 為何打了退堂鼓?
※吳博:目標檢測集成框架在醫學圖像 AI 輔助分析中的應用|AI 研習社第 78 期大講堂
TAG:雷鋒網 |