亚洲熟女综合色一区二区三区,亚洲精品中文字幕无码蜜桃,亚洲va欧美va日韩va成人网,亚洲av无码国产一区二区三区,亚洲精品无码久久久久久久

Python中如何統(tǒng)計(jì)文本詞匯出現(xiàn)的次數(shù)?

問(wèn)題描述:

有時(shí)在遇到一個(gè)文本需要統(tǒng)計(jì)文本內(nèi)詞匯的次數(shù)的時(shí)候,可以用一個(gè)簡(jiǎn)單的python程序來(lái)實(shí)現(xiàn)。

解決方案:

首先需要的是一個(gè)文本文件(.txt)格式(文本內(nèi)詞匯以空格分隔),因?yàn)樾枰氖且粋€(gè)程序,所以要考慮如何將文件打開(kāi)而不是采用復(fù)制粘貼的方式。這時(shí)就要用到open()的方式來(lái)打開(kāi)文檔,然后通過(guò)read()讀取其中內(nèi)容,再將詞匯作為key,出現(xiàn)次數(shù)作為values存入字典。

txt文件內(nèi)容

圖 1 txt文件內(nèi)容

再通過(guò)open和read函數(shù)來(lái)讀取文件:

open_file=open("text.txt")

file_txt=open_file.read()

然后再創(chuàng)建一個(gè)空字典,將所有出現(xiàn)的每個(gè)詞匯作為key保存到字典中,對(duì)文本從開(kāi)始到結(jié)束,循環(huán)處理每個(gè)詞匯,并將詞匯設(shè)置為一個(gè)字典的key,將其value設(shè)置為1,如果已經(jīng)存在該詞匯的key,說(shuō)明該詞匯已經(jīng)使用過(guò),就將value累積加1。

代碼示例:

def wordcount(readtxt):

readlist = readtxt.split()

dict1={}

for every_world in readlist:

if every_world in dict1:

dict1[every_world] += 1

else:

dict1[every_world] = 1

return dict1

print(wordcount(file_txt))

這里加了def函數(shù)把該程序封裝成一個(gè)函數(shù)。

最后輸出得到詞匯出現(xiàn)的字典:

形成字典

圖 2 形成字典

版權(quán)聲明:轉(zhuǎn)載文章來(lái)自公開(kāi)網(wǎng)絡(luò),版權(quán)歸作者本人所有,推送文章除非無(wú)法確認(rèn),我們都會(huì)注明作者和來(lái)源。如果出處有誤或侵犯到原作者權(quán)益,請(qǐng)與我們聯(lián)系刪除或授權(quán)事宜。

相關(guān)新聞

歷經(jīng)多年發(fā)展,已成為國(guó)內(nèi)好評(píng)如潮的Linux云計(jì)算運(yùn)維、SRE、Devops、網(wǎng)絡(luò)安全、云原生、Go、Python開(kāi)發(fā)專業(yè)人才培訓(xùn)機(jī)構(gòu)!