Python隱藏特性:字符串駐留、常量折疊
下面是Python字符串的一些微妙的特性,絕對會(huì)讓你大吃一驚。
案例一:
>>> a = "some_string"
>>> id(a)
140420665652016
>>> id("some" + "_" + "string") # 注意兩個(gè)的id值是相同的.
140420665652016
案例二:
>>> a = "wtf"
>>> b = "wtf"
>>> a is b
True
>>> a = "wtf!"
>>> b = "wtf!"
>>> a is b
False
>>> a, b = "wtf!", "wtf!"
>>> a is b
True # 3.7 版本返回結(jié)果為 False.
案例三:
>>> 'a' * 20 is 'aaaaaaaaaaaaaaaaaaaa'
True
>>> 'a' * 21 is 'aaaaaaaaaaaaaaaaaaaaa'
False # 3.7 版本返回結(jié)果為 True
很好理解, 對吧?
講解說明:
這些行為是由于 Cpython 在編譯優(yōu)化時(shí), 某些情況下會(huì)嘗試使用已經(jīng)存在的不可變對象而不是每次都創(chuàng)建一個(gè)新對象. (這種行為被稱作字符串的駐留[string interning])
發(fā)生駐留之后, 許多變量可能指向內(nèi)存中的相同字符串對象. (從而節(jié)省內(nèi)存)
在上面的代碼中, 字符串是隱式駐留的. 何時(shí)發(fā)生隱式駐留則取決于具體的實(shí)現(xiàn). 這里有一些方法可以用來猜測字符串是否會(huì)被駐留:所有長度為 0 和長度為 1 的字符串都被駐留.字符串在編譯時(shí)被實(shí)現(xiàn) ('wtf' 將被駐留, 但是 ''.join(['w', 't', 'f']) 將不會(huì)被駐留)
字符串中只包含字母,數(shù)字或下劃線時(shí)將會(huì)駐留. 所以 'wtf!' 由于包含 ! 而未被駐留. 可以在【地址1】找到 CPython 對此規(guī)則的實(shí)現(xiàn).
當(dāng)在同一行將 a 和 b 的值設(shè)置為 "wtf!" 的時(shí)候, Python 解釋器會(huì)創(chuàng)建一個(gè)新對象, 然后同時(shí)引用第二個(gè)變量(譯: 僅適用于3.7以下, 詳細(xì)情況請看【地址2】). 如果你在不同的行上進(jìn)行賦值操作, 它就不會(huì)“知道”已經(jīng)有一個(gè) wtf! 對象 (因?yàn)?"wtf!" 不是按照上面提到的方式被隱式駐留的). 它是一種編譯器優(yōu)化, 特別適用于交互式環(huán)境.
常量折疊(constant folding) 是 Python 中的一種 窺孔優(yōu)化(peephole optimization) 技術(shù). 這意味著在編譯時(shí)表達(dá)式 'a'*20會(huì)被替換為 'aaaaaaaaaaaaaaaaaaaa' 以減少運(yùn)行時(shí)的時(shí)鐘周期. 只有長度小于 20 的字符串才會(huì)發(fā)生常量折疊. (為啥? 想象一下由于表達(dá)式 'a'*10**10 而生成的 .pyc 文件的大小). 相關(guān)的源碼實(shí)現(xiàn)在【地址3】.
如果你是使用 3.7 版本中運(yùn)行上述示例代碼, 會(huì)發(fā)現(xiàn)部分代碼的運(yùn)行結(jié)果與注釋說明相同. 這是因?yàn)樵?3.7 版本中, 常量折疊已經(jīng)從窺孔優(yōu)化器遷移至新的 AST 優(yōu)化器, 后者可以以更高的一致性來執(zhí)行優(yōu)化. (由 Eugene Toder 和 INADA Naoki 在 bpo-29469 和 bpo-11549 中貢獻(xiàn).)
(譯: 但是在最新的 3.8 版本中, 結(jié)果又變回去了. 雖然 3.8 版本和 3.7 版本一樣, 都是使用 AST 優(yōu)化器. 目前不確定官方對 3.8 版本的 AST 做了什么調(diào)整.)
好啦!今天的分享到這里就結(jié)束了,希望大家持續(xù)關(guān)注馬哥教育官網(wǎng),每天都會(huì)有大量優(yōu)質(zhì)內(nèi)容與大家分享!版權(quán)聲明:轉(zhuǎn)載文章來自公開網(wǎng)絡(luò),版權(quán)歸作者本人所有,推送文章除非無法確認(rèn),我們都會(huì)注明作者和來源。如果出處有誤或侵犯到原作者權(quán)益,請與我們聯(lián)系刪除或授權(quán)事宜。