閱讀架構師:來自矽谷/亞洲研究院的經驗與思考
談起矽谷,我們可能想到「The Future is Here"(未來在這裡)」的著名金句,一個位於美國加州的一片狹長地帶,蘊藏著這世界上最前沿的互聯網技術與創新想法,自然吸引了諸如阿里、騰訊、百度、小米、京東等中國企業前來朝聖。
而北京作為中國的矽谷,也吸引了不少跨國公司前來駐足,1995 年 IBM 中國研究院設立於北京,1998 年英特爾設立中國研究院,2001 年微軟將中國研究院更名為「微軟亞洲研究院」,國際知名科技巨頭紛紛前來貢獻並享受中國飛速發展的紅利。
那麼外企科技公司在國內創建研究中心,與中國企業在美國創立實驗室,身在其中的架構師會有怎樣的經驗與思考?
自動深度語法分析是自然語言應用的核武器
李維博士現任京東矽谷研究院主任研究員,領導 Y 事業部矽谷 NLP(文本自然語言處理)團隊,研發自然語言深度分析平台及其 NLP 應用,目前聚焦於大數據情報和輿情挖掘,以及智慧供應鏈應用。
NLP 是人工智慧的重要方向,是繼圖像和語音處理技術(感知技術)突破之後的一個令人期待的關涉認知技術的核心環節。
迄今為止的自然語言應用大多局限於淺層分析或者端對端的系統,並沒有做到語言的結構分析和語義理解,而後者才是自然語言表達信息的奧秘所在。自然語言深度分析的技術正在成熟,已經到了顯示威力的前夕。
在此次分享中,李維博士將結合知識圖譜和大數據輿情挖掘,來展示深度語法分析(deep parsing)的原理和威力。
負責互聯網媒體與計算組的 Kevin Zeng
首席研究經理 Kevin Zeng 在微軟亞洲研究院負責互聯網媒體與計算組,在此之前,他在密蘇里大學擔任了 14 年全職教授,2000 年到 2003 年 Kevin Zeng 在 PacketVideo 擔任 CTO Staff。
如果你對圖像/錄像等處理與計算的問題,歡迎前來此次大會上與 Kevin Zeng 有更多的交流。
Uber 如何使用深度學習優化司機和乘客的體驗
在 Uber 內部,個性化團隊的工程經理 Yefei Peng 所在的團隊被稱為 Personalization,使命是為合適的乘客在合適的時間提供最優的產品體驗。
目前基於 Uber 的大數據基礎設施,Uber 的深度學習解決方案 「learns」 和 「adapts」 可以清晰的知道乘客的個人偏好,並且隨時可以在後台工作,採用各種辦法讓乘客有更愉悅的體驗。
目前該深度學習的實踐方案仍在 Uber 內快速迭代中,一年已經提供了四代解決方案,在此之前 Uber 使用了基於規則的處理方法,之後採取了基於機器學習的排序,Yefei Peng 將分享這段經歷中的架構設計和迭代思路。
Twitter 實時流系統 Heron 的異常檢測和恢復
吳惠君博士,現任 Twitter 工程師,致力於實時流處理引擎 Heron 的研究和開發,是 Apache Heron 的 committer。
應近年來大規模實時分析的需求,很多流處理系統被開發出來。Twitter Heron 開源系統就是其中的代表項目之一。
這類系統要求在軟體或者硬體失敗的極端情況下能有較好的服務水平。為了達到這種要求,Twitter Heron 系統添加了 Dhalion 異常檢測和恢復框架來保障 Heron 系統的服務水平。
Dhalion 異常檢測和恢復框架使用 polocy(策略)來整合 detector(檢測器)和 resolver(執行器)模塊。整個系統非常靈活,通過替換 policy 或者 detector 或者 resolver 能進行各種檢測和恢復任務,包括檢測 back pressure(反壓)指標並進行擴容,和檢測負載指標並重新調度容器等等,Dhalion 框架的應用給 Heron 系統帶來了初步的自行規範調整機制。
百度 MPP 數據倉庫 Palo 開源架構解讀與應用
牟宇航在百度擔任大數據部工程架構團隊經理,先後領導過數據平台團隊,OLAP 團隊、在線數據團隊。
面對業務量增加,數據量翻番,並且需要處理數百 TB ~ PB 級別的數據量,且是結構化數據,並達到毫秒 / 秒級分析,在這種情況下應該尋求哪種解決方案選型,並且採取怎樣的工程來實現?
百度目前採取的技術選型在技術特性上可以支持 MySQL、高並發小查詢、大查詢高吞吐、高容錯、列式存儲、物化視圖、在線表結構修改等特徵需求,如果做到的?歡迎前來交流。
從零到千萬在線後台服務的演進之路與黑產對抗
黃斯亮在騰訊音樂擔任後台技術總監,目前在騰訊 9 年多互聯網產品研發經驗。
在這次分享中,黃斯亮計劃講述全民 K 歌從零到千萬在線的產品發展過程中,後台服務架構的演進。
通過對 UGC 系統、流媒體上傳下載體系、道具禮物體系、註冊登陸系統、排行系統等核心模塊的不斷優化與重構,已經適應了快速增長的用戶規模,從根本上保證了產品的高速增長。
同時在產品發展過程中面對層出不窮的黑色產業模式,業務應該如何與各式各樣的黑產做對抗,為用戶提供了一個相對安全,乾淨,公平的平台,保障用戶的利益,黃斯亮將解釋其中的對抗細節。
在中國享有互聯網聖地的北京屆時會迎來哪些重磅嘉賓和技術分享?ArchSummit 還會提供怎樣的精彩活動?敬請期待。
點擊展開全文
※如何開啟深度強化學習的大門?
※直播進行中!全球運維技術大會智能化運維專題免費觀看!
※程序員應該怎麼開啟器機學習之路呢?
※9月沙龍:探秘AWS物聯網平台及邊緣計算
TAG:InfoQ |