宝贝腿开大点我添添你视频男男,中文字幕熟女人妻av一区二区三区,爱色成人网,大地资源高清播放在线观看在线电影在线观看 ,777米奇影视第四色

集團站切換校區(qū)

驗證碼已發(fā)送,請查收短信

復制成功
微信號:togogoi
添加微信好友, 詳細了解課程
已復制成功,如果自動跳轉(zhuǎn)微信失敗,請前往微信添加好友
打開微信
圖標

業(yè)界新聞

當前位置:首頁 > >業(yè)界新聞 > >

2017年最受歡迎的十三大Python庫

發(fā)布時間: 2017-07-26 13:28:14

近年來,Python 在數(shù)據(jù)科學行業(yè)扮演著越來越重要的角色。因此,騰科小編在本文中列出了對數(shù)據(jù)科學家、工程師們最有用的那些庫。

核心庫

1. NumPy 

當開始處理Python中的科學任務,Python的SciPy Stack肯定可以提供幫助,它是專門為Python中科學計算而設計的軟件集合。然而,SciPy Stack相當龐大,其中有十幾個庫,我們把焦點放在核心包上。關(guān)于建立科學計算棧,最基本的包是Numpy(Numerical Python)。它為Python中的n維數(shù)組和矩陣的操作提供了大量有用的功能。該庫提供了NumPy數(shù)組類型的數(shù)學運算向量化,可以改善性能,從而加快執(zhí)行速度。

2. SciPy

SciPy是一個工程和科學軟件庫。SciPy包含線性代數(shù),優(yōu)化,集成和統(tǒng)計的模塊。SciPy庫的主要功能是建立在NumPy上,從而它的數(shù)組大量的使用了NumPy的。它通過其特定子模塊提供有效的數(shù)值例程,并作為數(shù)字積分、優(yōu)化和其他例程。

3. Pandas

Pandas是一個Python包,旨在通過“標記”和“關(guān)系”數(shù)據(jù)進行工作,簡單直觀。Pandas是數(shù)據(jù)整理的完美工具。它設計用于快速簡單的數(shù)據(jù)操作,聚合和可視化。庫中有兩個主要的數(shù)據(jù)結(jié)構(gòu):

  • “系列”(Series),一維

  • “數(shù)據(jù)幀”(Data Frames),二維

例如,當你要從這兩種類型的結(jié)構(gòu)中接收到一個新的Dataframe時,通過傳遞一個Series,將收到一個單獨的行到DataFrame的DF:

這里稍微列出了你可以用Pandas做的事情:

  • 輕松刪除并添加數(shù)據(jù)幀(DataFrame)中的列
  • 將數(shù)據(jù)結(jié)構(gòu)轉(zhuǎn)換為數(shù)據(jù)幀(DataFrame)對象
  • 處理丟失的數(shù)據(jù),表示為NaN
  • 功能強大的分組


可視化

4.Matplotlib

又一個SciPy Stack核心軟件包以及 Python庫,Matplotlib為輕松生成簡單而強大的可視化而量身定制。它是一個頂尖的軟件,它使Python成為像MatLab或Mathematica這樣的科學工具的競爭對手。然而,這個庫是低層級的,這意味著你需要編寫更多的代碼才能達到高級的可視化效果,而且通常會比使用更多的高級工具付出更多的努力,但總體上這些努力是值得的。只要付出一點你就可以做任何可視化:

  • 線圖
  • 散點圖
  • 條形圖和直方圖
  • 餅狀圖;
  • 莖圖
  • 輪廓圖
  • 場圖
  • 頻譜圖

還有使用Matplotlib創(chuàng)建標簽,網(wǎng)格,圖例和許多其他格式化實體的功能?;旧希磺卸际强啥ㄖ频?。該庫由不同的平臺支持,并使用不同的GUI套件來描述所得到的可視化。不同的IDE(如IPython)都支持Matplotlib的功能。還有一些額外的庫可以使可視化變得更加容易。

?

5. Seaborn

Seaborn主要關(guān)注統(tǒng)計模型的可視化;這種可視化包括熱圖,這些熱圖總結(jié)數(shù)據(jù)但仍描繪整體分布。Seaborn基于Matplotlib,并高度依賴于此。

6. Bokeh

另一個很不錯的可視化庫是Bokeh,它針對交互式可視化。與以前的庫相比,它獨立于Matplotlib。正如我們提到的,Bokeh的主要焦點是交互性,它通過現(xiàn)代瀏覽器以數(shù)據(jù)驅(qū)動文檔(d3.js)的風格呈現(xiàn)。

7. Plotly

它是一個基于Web用于構(gòu)建可視化的工具箱,提供API給一些編程語言(Python在內(nèi))。在plot.ly網(wǎng)站上有一些強大的、上手即用的圖形。為了使用Plotly,你將需要設置API密鑰。圖形將在服務器端處理,并發(fā)布到互聯(lián)網(wǎng)。


機器學習

8. SciKit-Learn

Scikits是Scikits Stack額外的軟件包,專為像圖像處理和機器學習輔助等特定功能而設計。對于機器學習輔助,scikit-learn是所有軟件包里最突出的一個。它建立在SciPy之上,并大量利用它的數(shù)學運算。scikit-learn給常見的機器學習算法公開了一個簡潔、一致的接口,可簡單地將機器學習帶入生產(chǎn)系統(tǒng)中。該庫中集成了有質(zhì)量的代碼和良好的文檔、簡單易用并且十分高效,是使用Python進行機器學習的實際行業(yè)標準。

9.Theano

Theano是一個Python軟件包,它定義了與NumPy類似的多維數(shù)組,以及數(shù)學運算和表達式。此庫是被編譯的,可實現(xiàn)在所有架構(gòu)上的高效運行。最初由蒙特利爾大學機器學習組開發(fā),它主要用于滿足機器學習的需求。值得注意的是,Theano緊密結(jié)合了NumPy在低層次上的運算 。另外,該庫還優(yōu)化了GPU和CPU的使用,使數(shù)據(jù)密集型的計算平臺性能更佳。

10. TensorFlow

TensorFlow來自Google的開發(fā)人員,它是數(shù)據(jù)流圖計算的開源庫,為機器學習不斷打磨。它旨在滿足谷歌對訓練神經(jīng)網(wǎng)絡的高需求,并且是基于神經(jīng)網(wǎng)絡的機器學習系統(tǒng)DistBelief的繼任者。然而,TensorFlow并不限制于谷歌的科學應用范圍,它可以通用于多種多樣的現(xiàn)實應用中。

11. Keras

它是一個用Python編寫的開源的庫,用于在高層的接口上構(gòu)建神經(jīng)網(wǎng)絡。它簡單易懂,具有高級可擴展性。Keras使用Theano或TensorFlow作為后端,但微軟現(xiàn)在正努力整合CNTK(微軟的認知工具包)作為新的后端。Keras真的容易上手,并在持續(xù)完善它的快速原型能力。它完全用Python編寫,可被高度模塊化和擴展。盡管它以易上手、簡單和以高層次為導向,但是Keras足夠有深度并且足夠強大,去支持復雜的模型。


數(shù)據(jù)挖掘,統(tǒng)計學

12. Scrapy

Scrapy庫是用于從網(wǎng)絡結(jié)構(gòu)化檢索數(shù)據(jù)(如聯(lián)系人信息或URL),可以用來設計crawling程序(也稱為蜘蛛bots)。最開始只是如它的名字暗示的一樣,只用來做scraping,但是它現(xiàn)在已經(jīng)在完整的框架中發(fā)展,能夠從API采集數(shù)據(jù)并作為通用的crawlers了。該庫在界面設計中標榜著“不要重復自己” 它推薦用戶們編寫泛化得到、可被重復使用的通用代碼,從而構(gòu)建和擴展大型的crawlers。

13. Statsmodels

statsmodels使用戶能夠通過使用各種統(tǒng)計模型的估算方法進行數(shù)據(jù)挖掘,并執(zhí)行統(tǒng)計判斷和分析。許多有用的特征是可被描述的,并通過使用線性回歸模型、廣義線性模型、離散選擇模型、魯棒線性模型、時間序列分析模型,各種估計方法得出統(tǒng)計結(jié)果。這個庫還提供了廣泛的標定功能,專門用于大數(shù)據(jù)統(tǒng)計中的性能優(yōu)化工作。


當然,這不是完全詳盡的列表,還有許多其他的庫和框架同樣值得關(guān)注。

上一篇: 騰科快訊-四項技巧讓你的Java代碼更上一層樓

下一篇: 騰科快訊-2017年較強Web開發(fā)框架綜述

在線咨詢 ×

您好,請問有什么可以幫您?我們將竭誠提供最優(yōu)質(zhì)服務!