banner
andrewji8

Being towards death

Heed not to the tree-rustling and leaf-lashing rain, Why not stroll along, whistle and sing under its rein. Lighter and better suited than horses are straw sandals and a bamboo staff, Who's afraid? A palm-leaf plaited cape provides enough to misty weather in life sustain. A thorny spring breeze sobers up the spirit, I feel a slight chill, The setting sun over the mountain offers greetings still. Looking back over the bleak passage survived, The return in time Shall not be affected by windswept rain or shine.
telegram
twitter
github

機械学習データセットの完全なリスト

画像

1、Kaggle データセット

リンク:

https://www.kaggle.com/datasets

これは現在のデータサイエンスの分野で最も人気のあるデータセットの一つです。Kaggle では、各データセットがコンテストに対応しており、参加者はこのコミュニティでデータについて議論したり、共有コードを見つけたり、自分のプロジェクトをカーネルで作成したりすることができます。Kaggle には、さまざまなタイプ、サイズ、および形式の実際のデータセットが含まれています。さらに、参加者は各データセットに関連するカーネルを見ることができます。多くのデータサイエンティストがデータセットを分析するために自分のノートブックをアップロードし、特定のデータセットの問題を解決するためのアルゴリズムの実装を見つけることができます。

画像

2、Amazon データセット

リンク:

https://registry.opendata.aws/

Amazon データベースには、公共交通、生態資源、衛星画像など、さまざまな分野のデータセットが含まれています。データセットのウェブサイトには、使用者が必要なデータセットを迅速に見つけるのを助ける検索ボックスもあります。各データセットには、対応するデータセットの説明と使用例が含まれており、データ量は非常に豊富で使いやすいです。

さらに、Amazon Web Services(AWS)プラットフォーム(Amazon S3 など)を利用することで、クラウド上に保存されたこれらのデータセットは高いスケーラビリティのサービスを提供しており、機械学習の開発や実験に AWS を使用するユーザーにとって非常に便利です。クラウド上では、データセットの転送が非常に高速に行われます。

画像

3、UCI 機械学習データセット

リンク:

https://archive.ics.uci.edu/ml/datasets.html

これはカリフォルニア大学アーバイン校(UCI)の情報とコンピュータサイエンス学部の研究者によって作成された、100 以上の異なるタイプのデータセットを含む大規模なデータベースです。このデータベースは、さまざまな機械学習の問題に基づいてデータセットを分類しています。ここでは、単変量、多変量の時系列データセット、分類、回帰、レコメンデーションシステムデータセットなどを見つけることができます。さらに、データベースの一部のデータセットはすでにデータクリーニングが行われており、直接使用することができます。

画像

4、Google データセット検索エンジン

リンク:

https://toolbox.google.com/datasetsearch

2018 年 9 月、Google はこのサービスを開始しました。これはデータセットを名前で検索することができるツールボックスであり、数万もの異なるデータセットを統合し、ユーザーに利用を開放することを目指しています。

画像

5、Microsoft データセット

リンク:

https://msropendata.com/

2018 年 7 月、Microsoft は外部の研究コミュニティと共同で Microsoft Research Open Data サービスを発表しました。このクラウド上に保存されたデータベースには、公開された研究で使用されたデータセットが含まれており、グローバルな研究コミュニティの研究協力を促進することを目指しています。

画像

6、Awesome 公開データセット

リンク:

A topic-centric list of HQ open datasets.

Awesome は、さまざまなトピックで分類されたデータベースであり、生物学、経済学、教育などさまざまな分野の重要なデータセットが含まれています。リストされているほとんどのデータセットは無料で使用できますが、データセットを使用する前に、ユーザーは使用許可を取得するために認証を通過する必要があります。

画像

7、政府データセット

ここでは、政府に関連するデータセットを見つけることができます。多くの国の機関は、いくつかの領域での国のデータセットを公開して、政府の透明性を示しています。以下はいくつかの例です:

EU オープンデータ:欧州政府のデータセット

リンク:

https://data.europa.eu/euodp/data/dataset

US Gov Data:米国政府のデータ(政治問題以外のデータセットですが、トランプ政権の増税以来、このウェブサイトのデータセットは一時的に使用できません)

リンク:

https://www.data.gov/

ニュージーランド政府のデータセット

リンク:

https://catalogue.data.govt.nz/dataset

インド政府のデータセット

リンク:

https://data.gov.in/

画像

8、コンピュータビジョンデータセット

リンク:

https://www.visualdata.io/

画像処理、コンピュータビジョン、またはディープラーニングの分野で作業している場合、このデータセットは最高の実験リソースになります。Visual Data には、コンピュータビジョン(CV)モデルを構築するために使用できる優れたデータセットが含まれています。使用者は特定の CV タスクに基づいて対応するデータセットを見つけることができます。例えば、セマンティックセグメンテーション、画像キャプション生成、画像生成、さらには自動運転ソリューションに必要なデータセットなどです。

読み込み中...
文章は、創作者によって署名され、ブロックチェーンに安全に保存されています。