課程介紹
人工智能、數(shù)據(jù)挖掘等技術(shù)用于數(shù)據(jù)分析和決策支持。機器學(xué)習(xí)是數(shù)據(jù)挖掘的主要方法之一,它是一種使獲取知識自動化的計算方法的學(xué)習(xí),通俗地說,機器學(xué)習(xí)領(lǐng)域感興趣的是怎樣編寫計算機程序能夠通過案例進行模仿學(xué)習(xí)。
培訓(xùn)對象
需要了解文本分析NLP技術(shù)的相關(guān)人員。
課程收益
通過文本分析核心原理精講和文本核心處理技術(shù)工具的實操練習(xí),可以掌握文本分析關(guān)鍵技術(shù)使用,便于把文本分析技術(shù)落地到自己的工作實踐中。
知識概要
-- 文本分析基礎(chǔ);
-- 文本分析詞法分析;
-- 文本分析語法理論;
-- 文本分析語義分析;
-- 文本分析篇章分析;
-- 文本分析實戰(zhàn)練習(xí)。
課程大綱
文本分析基礎(chǔ)
文本分析基本概念和應(yīng)用
數(shù)學(xué)基礎(chǔ)
概率論基本概念
概率
最大似然估計
條件概率
貝葉斯法則
隨機變量
二項式分布
聯(lián)合概率分布和條件概率分布
貝葉斯決策理論
期望和方差
圖靈機與文本分析
文本分析詞法分析
概率語法
詞法分析與詞性標(biāo)注
詞頻-逆向文件頻率(TF-IDF)
Word2Vec
計數(shù)向量器
分詞器(Tokenization)
移除停用詞(StopWordsRemover)
n-gram
二值化
主成分分析(PCA)
多項式展開(PolynomialExpansion)
離散余弦變換(DCT)
字符串-索引變換(StringIndexer)
索引-字符串變換(IndexToString)
獨熱編碼(OneHotEncoder)
向量-索引變換
交互式(Interaction)
正則化(Normalizer)
規(guī)范化(StandardScaler)
最大值-最小值縮放(MinMaxScaler)
最大值-絕對值縮放(MaxAbsScaler)
文本分析語法理論
語言模型
n元語法的基本概念
數(shù)據(jù)平滑方法
句法分析
句法結(jié)構(gòu)分析概述
基于PCFG的基本分析方法
句法規(guī)則提取方法
HP分析算法
淺層句法分析
文本分析語義分析
語義計算
詞義消歧概述
有監(jiān)督的詞義消歧方法
基于貝葉斯分類器的消歧方法
基于貝葉斯分類器的消歧方法
基于詞典的詞義消歧方法
無監(jiān)督的詞義消歧方法
詞義消歧系統(tǒng)評價
語義角色標(biāo)注基本方法
雙語聯(lián)合語義角色標(biāo)注方法
文本分析篇章分析
言語行為理論
中心理論
修辭結(jié)構(gòu)理論
脈絡(luò)理論
基于貝葉斯分類器的消歧方法
篇章表示理論
篇章銜接性,連續(xù)性
篇章標(biāo)注語料庫
文本分析實戰(zhàn)練習(xí)
Web文本分析
知識圖譜-基于知識庫的文本分析
文本分析python實踐
認(rèn)證過程
無認(rèn)證考試
開班信息
暫無開班信息