banner
andrewji8

Being towards death

Heed not to the tree-rustling and leaf-lashing rain, Why not stroll along, whistle and sing under its rein. Lighter and better suited than horses are straw sandals and a bamboo staff, Who's afraid? A palm-leaf plaited cape provides enough to misty weather in life sustain. A thorny spring breeze sobers up the spirit, I feel a slight chill, The setting sun over the mountain offers greetings still. Looking back over the bleak passage survived, The return in time Shall not be affected by windswept rain or shine.
telegram
twitter
github

機器學習資料集網址大全

image

1、Kaggle 數據集

連結:

https://www.kaggle.com/datasets

這是當前數據科學領域最熱門,也是最受歡迎的數據集之一。在 Kaggle 中,每個數據集都是對應一項比賽,參賽者可以在這個小社區裡討論數據,查找一些公共代碼或在 kernel 中創建自己的項目。Kaggle 中包含大量不同類型,不同大小以及多種不同格式的真實數據集。此外,參賽者還可以看到與每個數據集關聯的 kernel,其中許多數據科學家會上傳自己的 notebooks 來分析數據集,還能找到解決特定數據集問題的算法實現。

image

2、Amazon 數據集

連結:

https://registry.opendata.aws/

Amazon 數據庫包含不同領域的多種數據集,如公共交通,生態資源,衛星圖像等。在數據集官網還有一個搜索框,可以幫助使用者快速找到所需的數據集。每個數據集包含相應的數據集描述和使用示例,數據量非常豐富且易於使用。

此外,依托於 Amazon Web Services (AWS) 平台,如 Amazon S3,這些儲存在雲端的數據集都有高度的可擴展性服務,這對於那些使用 AWS 進行機器學習開發和實驗的用戶來說,將非常方便。因為在雲端,數據集的傳輸將非常快。

image

3、UCI 機器學習數據集

連結:

https://archive.ics.uci.edu/ml/datasets.html

這是由加州大學歐文分校(UCI)信息與計算機科學學院的研究者創建的一個包含 100 多種不同類型數據集的大型數據庫。該數據庫根據不同的機器學習問題來對數據集進行分類,在這裡,用戶可以找到單變量、多變量時間序列數據集,分類、回歸、推薦系統數據集等。此外,該數據庫中的部分數據集已經經過數據清洗過程,是可以直接為用戶使用。

image
4、Google 數據集搜尋引擎

連結:

https://toolbox.google.com/datasetsearch

2018 年 9 月,Google 推出了這項服務,它是一個可以按名稱搜索相應數據集的工具箱,其目標是集成數萬個不同的數據集,並對用戶開放使用。

image
5、Miscrosoft 數據集

連結:

https://msropendata.com/

2018 年 7 月,Miscrosoft 聯合其外部的研究社區聲明發布 Miscrosoft Research Open Data 服務。這項儲存在雲端的數據庫,包含了一系列在已發表研究中使用過的數據集,致力於促進全球研究社區的研究合作。

image
6、Awesome 公開數據集

連結:

A topic-centric list of HQ open datasets.

Awesome 是一個按不同主題分類的數據庫,其中涵蓋了如生物學,經濟學,教育等不同領域的重要數據集,其中列出的大多數數據集都可供用戶免費試用,但在使用任何數據集之前,用戶需要通過認證已獲得使用許可。

image
7、government 數據集

在這裡你可以找到那些與政府相關的數據集。為顯示政府工作的透明度,許多國家機構公開發布了其國家在一些領域的數據集,如下示例:

EU Open Data:歐洲政府數據集

連結:

https://data.europa.eu/euodp/data/dataset
US Gov Data:美國政府數據 (非政治問題上的數據集,但自特朗普政府上調以來,該網站數據集暫時無法使用)

連結:

https://www.data.gov/

New Zealand’s Government Dataset:新西蘭政府數據集

連結:

https://catalogue.data.govt.nz/dataset

Indian Government Dataset:印度政府數據集

連結:

https://data.gov.in/

image
8、Computer Vision 領域數據集

連結:

https://www.visualdata.io/

如果是從事圖像處理、計算機視覺或深度學習領域的工作,那麼該數據集會是最好的實驗資源。Visual Data 包含一些可用於構建計算機視覺(CV)模型的優秀數據集。使用者可以通過某個特定的 CV 任務來查找相應的數據集,如語義分割(semantic segmentation)、圖像生成標題(image captioning)、圖像生成(image generation),甚至是無人駕駛解決方案所需的數據集。

載入中......
此文章數據所有權由區塊鏈加密技術和智能合約保障僅歸創作者所有。