2022-08-15 11:39:09|已瀏覽:4502次
Python處理大數據的劣勢和優勢是什么?python能處理數以百萬行級的大數據,但是也有它的優勢與劣勢。而對于現在的大數據量,百萬行級并不算多,而其起點一般都是在10億以上。python的優勢不在于運行效率,而在于開發效率和高可維護性。針對特定的問題挑選合適的工具,本身也是一項技術能力。下面我們來看看Python處理大數據的劣勢和優勢是什么。
Python處理大數據的劣勢:
1、python線程有gil,通俗說就是多線程的時候只能在一個核上跑,浪費了多核服務器。在一種常見的場景下是要命的:并發單元之間有巨大的數據共享或者共用(例如大dict),多進程會導致內存吃緊,多線程則解決不了數據共享的問題,單獨的寫一個進程之間負責維護讀寫這個數據不僅效率不高而且麻煩
2、python執行效率不高,在處理大數據的時候,效率不高,這是真的,pypy(一個jit的python解釋器,可以理解成腳本語言加速執行的東西)能夠提高很大的速度,但是pypy不支持很多python經典的包,例如numpy(順便給pypy做做廣告,土豪可以捐贈一下PyPy - Call for donations)
3、絕大部分的大公司,用java處理大數據不管是環境也好,積累也好,都會好很多
Python處理數據的優勢(不是處理大數據):
1、異常快捷的開發速度,代碼量巨少
2、豐富的數據處理包,不管正則也好,html解析啦,xml解析啦,用起來非常方便
3、內部類型使用成本巨低,不需要額外怎么操作(java,c++用個map都很費勁)
4、公司中,很大量的數據處理工作是不需要面對非常大的數據的
5、巨大的數據不是語言所能解決的,需要處理數據的框架雖然小眾,但是python還是有處理大數據的框架的,或者一些框架也支持python
6、編碼問題處理起來太方便了
Python處理大數據的劣勢和優勢是什么?通過上面的介紹大家應該有所了解了,希望能給熱愛大數據開發的同學帶來幫助。
注:尊重原創文章,轉載請注明出處和鏈接 http://m.dedgn.cn/news-id-49859.html 違者必究!部分文章來源于網絡由培訓無憂網編輯部人員整理發布,內容真實性請自行核實或聯系我們,了解更多相關資訊請關注數據庫工程師頻道查看更多,了解相關專業課程信息您可在線咨詢也可免費申請試課。關注官方微信了解更多:150 3333 6050