計算機輔助詞典編纂——以異體字詞典為例
知識
10-18
AI Challenger 2018 全球AI挑戰賽——300萬獎金、10餘個全新競賽及數據集重磅發布!
社長提醒
今晚 20:00
來自上海交通大學電子系的吳偉昌
將為我們分享「點過程模型在序列數據挖掘中的應用 」
千萬不要錯過~
戳鏈接直達:http://www.mooc.ai/open/course/572
分享主題
計算機輔助詞典編纂 ——以異體字詞典為例
分享背景
大數據開啟了詞典編纂的新模式,語義計算使得自動編輯成為可能。本次分享中,講者分享如何通過word2vec等工具來計算字義相似度從而識別異體字。
分享嘉賓
史曉東,廈門大學教授,中文信息學會理事,主要研究方向自然語言處理、機器翻譯。AI Challenger 2018 全球AI挑戰賽評委。
分享提綱
異體字定義
異體字自動識別
異體字過濾
異體字詞典的自動生成和輔助編纂平台
分享時間
北京時間10月19日(周五)20:00
直播鏈接
http://www.mooc.ai/open/course/573
想了解更多 AI 研習社直播?
※谷歌 AI 發布 BERT 模型,打破十一項 NLP 記錄,會開啟 NLP 新時代嗎?
※數據集如何確保開發集和測試集的數據分布一致?
TAG:AI研習社 |