-
抓取速度提升 3 倍!Python 的這個(gè)內(nèi)置庫(kù)你用上了嗎?
從網(wǎng)站中抓取數(shù)據(jù)是開發(fā)者的一個(gè)典型“用例”。無(wú)論它是屬于副業(yè)項(xiàng)目,還是你正在成立一個(gè)初創(chuàng)公司,抓取數(shù)據(jù)似乎都很有必要。 舉個(gè)例子,倘若您想要?jiǎng)?chuàng)建一個(gè)比價(jià)網(wǎng)站,那么您會(huì)需要從各種電商網(wǎng)站上抓取價(jià)格信息;或者您想要構(gòu)建一個(gè)可以識(shí)別商品并在亞馬遜上自動(dòng)查找價(jià)格的“人工智能”。類似的場(chǎng)景還有很多。 但是您有沒有注意到,獲取所有頁(yè)面信息的速度有多慢呢?您會(huì)選擇一個(gè)接一個(gè)地去抓取商品嗎?應(yīng)該會(huì)有更好的解決方案吧?答案是肯定的。 抓取網(wǎng)頁(yè)可能非常耗時(shí),因?yàn)槟仨毣〞r(shí)間等待服務(wù)器響應(yīng),抑或是速率受限。這就是為什…