婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 知識庫 > 利用Python3實現統計大量單詞中各字母出現的次數和頻率的方法

利用Python3實現統計大量單詞中各字母出現的次數和頻率的方法

熱門標簽:北京外呼電銷機器人招商 鄭州智能外呼系統中心 電銷機器人 金倫通信 賓館能在百度地圖標注嗎 crm電銷機器人 汕頭電商外呼系統供應商 南京crm外呼系統排名 400電話 申請 條件 云南地圖標注

首先以只讀方式打開單詞文件,利用列表推導式創建兩個列表
列表sta記錄各單詞出現的次數,列表freq記錄各單詞出現的頻率

f = open('5500詞.txt','r',encoding='utf-8')
sta = [0 for i in range(26)]
freq = [0 for i in range(26)]

單詞格式如下所示:
a [ei] art.一(個);每一(個);(同類事物中)任一個
abandon [ə'bændən] vt.離棄,丟棄;遺棄,拋棄;放棄
abdomen [æb'dəumen] n.腹,下腹(胸部到腿部的部分)
abatement [ə'beitmənt] n.減(免)稅,打折扣,沖銷
abide [ə'baid] vi.(abode,abided)(by)遵守;堅持;vt.忍受,容忍

每行一個單詞,所以我們選擇按行讀取文件

for i in range(5500):
  buf = f.readline()

然后依次統計每個字符串中的字母個數,注意大寫字母也要統計(后面的字母省略)

for j in buf:
    if j == 'a' or j == 'A':
      sta[0] = sta[0] + 1
    elif j == 'b' or j == 'B':
      sta[1] = sta[1] + 1

注意到每個單詞后都有音標,所以遇到 中括號" [ "時停止計數

if j == '[':
      break

然后每五個一行,依次輸出各個單詞出現的次數,將print函數中的end參數由默認換行改成幾個空格,使輸出更格式化。字母利用ASCII碼輸出

print('5498個詞匯中,各字母出現的次數分別為:\n')
asc = 97
for i in range(26):
  if i  25:
    print("%c" % asc,':',sta[i],end='  ')
    if (i + 1) % 5 == 0:
      print('\n')
  else:
    print("%c" % asc,':',sta[i])
  asc = asc + 1

利用一個for遍歷計算出所有字母數量的總和

sum = 0
for i in sta:
  sum = sum + i

利用一個for遍歷計算出各字母出現的頻率,注意到Python中計算出的頻率會自動保留17位小數,為了方便查看,使用round()函數保留四位小數,值得注意的是,使用round()函數會自動去掉數字末尾的0

for i in range(26):
  freq[i] = round(sta[i] / sum,4)

再以每五個一行,依次輸出各個單詞出現的頻率,將print函數中的end參數由默認換行改成幾個空格,使輸出更格式化。字母利用ASCII碼輸出。

print('各字母出現的頻率分別為:\n')
for i in range(26):
  if i  25:
    print("%c" % asc,':',freq[i],end='  ')
    if (i + 1) % 5 == 0:
      print('\n')
  else:
    print("%c" % asc,':',freq[i])
  asc = asc + 1

最后輸出的結果如下圖所示:


上概率論的課時,偶然看見居然有人拿著詞典去數字母的數量,就想能不能寫一個自動統計的程序,于是就隨便寫著玩。代碼功底很差,所以寫得很丑(居然有25個elif),所以看個樂呵就好了。

總的來說,我覺得有這些可以改進的地方:
①讀取單詞的方法可以改進,這種一行一行讀取的方式,對格式要求很高,很難找到
②用字典來存儲頻數和頻率是否會更好?后面輸出的時候可以避免使用ASCII碼,但是字典推導式我屬實記不清了
③判斷計數的這些if和elif能否抽象出一個方法?增加代碼復用
④round()函數會自動去掉小數后面的0,有沒有什么方法使0被保留下來?這樣輸出的格式會更好看

我的代碼的優點估計只有一點了:
①Python初學者就能看懂

到此這篇關于利用Python3實現統計大量單詞中各字母出現的次數和頻率的方法的文章就介紹到這了,更多相關Python3字母出現次數和頻率內容請搜索腳本之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • Python 統計數據集標簽的類別及數目操作
  • Python統計可散列的對象之容器Counter詳解
  • Python 統計列表中重復元素的個數并返回其索引值的實現方法
  • Python實戰之單詞打卡統計
  • python之cur.fetchall與cur.fetchone提取數據并統計處理操作
  • python自動統計zabbix系統監控覆蓋率的示例代碼
  • python 統計代碼耗時的幾種方法分享
  • Python統計列表元素出現次數的方法示例
  • python統計RGB圖片某像素的個數案例
  • Python jieba 中文分詞與詞頻統計的操作
  • 使用Python 統計文件夾內所有pdf頁數的小工具
  • python 統計list中各個元素出現的次數的幾種方法
  • python調用百度AI接口實現人流量統計
  • Python代碼覆蓋率統計工具coverage.py用法詳解
  • python 爬蟲基本使用——統計杭電oj題目正確率并排序
  • 利用python匯總統計多張Excel
  • python統計mysql數據量變化并調用接口告警的示例代碼
  • 用python實現監控視頻人數統計

標簽:石家莊 西寧 文山 錫林郭勒盟 昆明 梅州 浙江 懷化

巨人網絡通訊聲明:本文標題《利用Python3實現統計大量單詞中各字母出現的次數和頻率的方法》,本文關鍵詞  利用,Python3,實現,統計,大量,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《利用Python3實現統計大量單詞中各字母出現的次數和頻率的方法》相關的同類信息!
  • 本頁收集關于利用Python3實現統計大量單詞中各字母出現的次數和頻率的方法的相關信息資訊供網民參考!
  • 推薦文章
    主站蜘蛛池模板: 九寨沟县| 廊坊市| 通道| 左贡县| 赫章县| 赣榆县| 清流县| 阿城市| 南郑县| 大城县| 宾阳县| 丹寨县| 巴彦淖尔市| 恩施市| 汶川县| 十堰市| 南平市| 尼玛县| 柳林县| 民和| 平泉县| 平南县| 老河口市| 钟祥市| 延川县| 阿图什市| 米脂县| 耒阳市| 崇明县| 合山市| 科技| 小金县| 济宁市| 通辽市| 右玉县| 辉南县| 如东县| 章丘市| 六枝特区| 罗定市| 金湖县|