国内自拍在线,久久久夜色精品,欧美日韩一区三区,国产黄a三级三级三级看三级男男,aaa一级片,久久久久久久久一区二区三区,中文一区在线

    電話

    0411-39943997

仟億科技
客服中心
  • 電話
  • 電話咨詢:0411-39943997
  • 手機(jī)
  • 手機(jī)咨詢:15840979770
    手機(jī)咨詢:13889672791
網(wǎng)絡(luò)營(yíng)銷 >更多
您現(xiàn)在的位置:首頁 > 新聞中心 > 常見問題

百度中文分詞的三種技術(shù)

作者:billionnet 發(fā)布于:2013/3/27 11:04:38 點(diǎn)擊量:

1.字符串匹配的分詞方法

    2.詞義分詞法。

    3.統(tǒng)計(jì)分此法。

    字符串匹配的分詞方法

    也是常用的分詞法,百度就是用此種分詞。字符串匹配的分詞方法,他又分為3中分詞方法。

    1.正向最大匹配法

    什么意思呢?就是把一個(gè)詞從左至右來分詞。

    舉個(gè)例子。

    “不知道你在說什么”

    這句話采用正向最大匹配法是如何分的呢?“不知道,你,在,說什么”與正向最大匹配法相對(duì)應(yīng)的是反向最大匹配發(fā)。這是第二種分詞方法。

    2.反向最大匹配法

    來分上面我舉的例子是如何分的呢 ?"不知道你在說什么"。反向最大匹配法來分上面這段是如何分的。“不,知道,你在,說,什么”,這個(gè)就分的比較多了,反向最大匹配法就是從右至左。

    3.就是最短路徑分詞法。

    這個(gè)什么理解呢 ,就是說 我一段話里面要求切出的詞數(shù)是最少的。還是上面哪句話“不知道你在說什么”最短路徑分詞法就是指,我把上面哪句話分成的詞要是最少的。不知道,你在,說什么,這就是最短路徑分詞法,分出來就只有3個(gè)詞了。

    好了,當(dāng)然還有上面三種可以相互結(jié)合組成一些分詞方法。比如正向最大匹配法和反向最大匹配法組合起來就可以叫做雙向最大匹配法。

    詞義分詞法

    這種其實(shí)就是一種機(jī)器語音判斷的分詞方法。很簡(jiǎn)單,進(jìn)行句法、語義分析,利用句法信息和語義信息來處理歧義現(xiàn)象來分詞,這種分詞方法,現(xiàn)在還不成熟。處在測(cè)試階段。

    統(tǒng)計(jì)的分詞方法

    這個(gè)很簡(jiǎn)單,就是根據(jù)詞組的統(tǒng)計(jì),就會(huì)發(fā)現(xiàn)兩個(gè)相鄰的字出現(xiàn)的頻率最多,那么這個(gè)詞就很重要。就可以作為用戶提供字符串中的分隔符。這樣來分詞。比如,“我的,你的,許多的,這里,這一,那里”。等等,這些詞出現(xiàn)的比較多,就從這些詞里面分開來。



分享到:


Copyright@ 2011-2016 版權(quán)所有:大連千億科技有限公司 遼ICP備11013762-3號(hào)   google網(wǎng)站地圖   百度網(wǎng)站地圖   網(wǎng)站地圖

公司地址:大連市沙河口區(qū)中山路692號(hào)辰熙星海國(guó)際2317 客服電話:0411-39943997 QQ:2088827823 37482752

法律聲明:未經(jīng)許可,任何模仿本站模板、轉(zhuǎn)載本站內(nèi)容等行為者,本站保留追究其法律責(zé)任的權(quán)利! 隱私權(quán)政策聲明