亚洲熟女综合色一区二区三区,亚洲精品中文字幕无码蜜桃,亚洲va欧美va日韩va成人网,亚洲av无码国产一区二区三区,亚洲精品无码久久久久久久

Python中如何統(tǒng)計(jì)文本詞匯出現(xiàn)的次數(shù)?

Python開(kāi)發(fā) 2020年4月29日下午6:01 6442

問(wèn)題描述：

有時(shí)在遇到一個(gè)文本需要統(tǒng)計(jì)文本內(nèi)詞匯的次數(shù)的時(shí)候，可以用一個(gè)簡(jiǎn)單的python程序來(lái)實(shí)現(xiàn)。

解決方案：

首先需要的是一個(gè)文本文件(.txt)格式(文本內(nèi)詞匯以空格分隔)，因?yàn)樾枰氖且粋€(gè)程序，所以要考慮如何將文件打開(kāi)而不是采用復(fù)制粘貼的方式。這時(shí)就要用到open()的方式來(lái)打開(kāi)文檔，然后通過(guò)read()讀取其中內(nèi)容，再將詞匯作為key，出現(xiàn)次數(shù)作為values存入字典。

txt文件內(nèi)容

圖 1 txt文件內(nèi)容

再通過(guò)open和read函數(shù)來(lái)讀取文件：

open_file=open("text.txt")

file_txt=open_file.read()

然后再創(chuàng)建一個(gè)空字典，將所有出現(xiàn)的每個(gè)詞匯作為key保存到字典中，對(duì)文本從開(kāi)始到結(jié)束，循環(huán)處理每個(gè)詞匯，并將詞匯設(shè)置為一個(gè)字典的key，將其value設(shè)置為1，如果已經(jīng)存在該詞匯的key，說(shuō)明該詞匯已經(jīng)使用過(guò)，就將value累積加1。

代碼示例：

def wordcount(readtxt):

readlist = readtxt.split()

dict1={}

for every_world in readlist:

if every_world in dict1:

dict1[every_world] += 1

else:

dict1[every_world] = 1

return dict1

print(wordcount(file_txt))

這里加了def函數(shù)把該程序封裝成一個(gè)函數(shù)。

最后輸出得到詞匯出現(xiàn)的字典：

形成字典

圖 2 形成字典

版權(quán)聲明：轉(zhuǎn)載文章來(lái)自公開(kāi)網(wǎng)絡(luò)，版權(quán)歸作者本人所有，推送文章除非無(wú)法確認(rèn)，我們都會(huì)注明作者和來(lái)源。如果出處有誤或侵犯到原作者權(quán)益，請(qǐng)與我們聯(lián)系刪除或授權(quán)事宜。

Python學(xué)習(xí) Python教程

上一篇：Python|“雙指針?lè)ā苯鈩h除數(shù)組重復(fù)項(xiàng)問(wèn)題

下一篇：python培訓(xùn)教程坐標(biāo)最短路徑計(jì)算

歷經(jīng)多年發(fā)展,已成為國(guó)內(nèi)好評(píng)如潮的Linux云計(jì)算運(yùn)維、SRE、Devops、網(wǎng)絡(luò)安全、云原生、Go、Python開(kāi)發(fā)專業(yè)人才培訓(xùn)機(jī)構(gòu)!