中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

機器學習數據集哪里找:最佳數據集來源盤點

2019-01-30    來源:raincent

容器云強勢上線!快速搭建集群,上萬Linux鏡像隨意使用

摘要:很難找到一個特定的數據集來解決對應的機器學習問題,這是非常痛苦的。下面的網址列表不僅包含用于實驗的大型數據集,還包含描述、使用示例等,在某些情況下還包含用于解決與該數據集相關的機器學習問題的算法代碼。

1 -Kaggle數據集

網址:https://www.kaggle.com/datasets

這是我最喜歡的數據集網站之一。每個數據集都有對應的一個小型社區(qū),你可以在其中討論數據、查找公共代碼或在內核中創(chuàng)建自己的項目。該網站包含大量形狀、大小、格式各異的真實數據集。你還可以看到與每個數據集相關的“內核”,其中許多不同的數據科學家提供了筆記來分析數據集。有時在某些特定的數據集中,你可以從筆記中找到相應的算法,解決預測問題。

2 -亞馬遜數據集

網址:https://registry.opendata.aws

該數據源包含多個不同領域的數據集,如:公共交通、生態(tài)資源、衛(wèi)星圖像等。它也有一個搜索框來幫助你找到你正在尋找的數據集,另外它還有數據集描述和使用示例,這是非常簡單、實用的!

3- UCI機器學習庫:

網址:https://archive.ics.uci.edu/ml/datasets.html

 

 

這是加州大學信息與計算機科學學院的一個數據庫,包含了100多個數據集。它根據機器學習問題的類型對數據集進行分類。你可以找到單變量、多變量、分類、回歸或者是推薦系統(tǒng)的數據集。UCI的某些數據集已經更新完畢并準備使用。

4-谷歌的數據集搜索引擎:

網址:https://toolbox.google.com/datasetsearch

 

 

在2018年末,谷歌做了他們最擅長的事情,推出了另一項偉大的服務。它是一個可以按名稱搜索數據集的工具箱。谷歌的目標是統(tǒng)一成千上萬個不同的數據集存儲庫,使這些數據能夠被發(fā)現。

5 -微軟數據集:

網址:https://msropendata.com

2018年7月,微軟與外部研究社區(qū)共同宣布推出“微軟研究開放數據”。

它在公共云中包含一個數據存儲庫,用于促進全球研究社區(qū)之間的協作。另外它還提供了一組在已發(fā)表的研究中使用的、經過整理的數據集。

6-Awesome公共數據集:

網址:https://github.com/awesomedata/awesome-public-datasets

這是一個按照主題分類的,由社區(qū)公開維護的一系列數據集清單,比如生物學、經濟學、教育學等。這里列出的大多數數據集都是免費的,但是在使用任何數據集之前,你應該檢查相應的許可要求。

7 -政府數據集:

政府的相關數據集也很容易找到。許多國家為了提高知名度,向公眾分享了各種數據集。例如:

歐盟開放數據門戶:歐洲政府數據集。 https://data.europa.eu/euodp/data/dataset

新西蘭政府數據集。https://catalogue.data.govt.nz/dataset

印度政府數據集。https://data.gov.in/

8-計算機視覺數據集:

網址:https://www.visualdata.io

如果你從事圖像處理、計算機視覺或者是深度學習,那么這應該是你的實驗獲取數據的重要來源之一。

該數據集包含一些可以用來構建計算機視覺(CV)模型的大型數據集。你可以通過特定的CV主題查找特定的數據集,如語義分割、圖像標題、圖像生成,甚至可以通過解決方案(自動駕駛汽車數據集)查找特定的數據集。

綜上所述,從我所觀察到的情況來看,越來越多的用于研究機器學習的各種數據集變得更容易獲取,維護這些新數據集的社區(qū),也將不斷地發(fā)展,使計算機科學社區(qū)能夠繼續(xù)快速創(chuàng)新,為生活帶來更多創(chuàng)造性的解決方案。

文章原標題《Top Sources For Machine Learning Datasets》,譯者:黃小

標簽: Google 代碼 谷歌 數據庫 搜索 搜索引擎

版權申明:本站文章部分自網絡,如有侵權,請聯系:west999com@outlook.com
特別注意:本站所有轉載文章言論不代表本站觀點!
本站所提供的圖片等素材,版權歸原作者所有,如需使用,請與原作者聯系。

上一篇:2019 年關于數據科學、機器學習和人工智能的五大預測

下一篇:區(qū)塊鏈,數字社會的可信連接