SIGNATE ワインの品種の予測に投稿しました
日本のデータサイエンス訓練サイトSIGNATEに投稿しました。ここでは、PJの内容についてとランキングをお知らせしたいと思います。
概要 今回投稿した概要 投稿リンク 暫定評価は1.0
ワインの化学成分から使用されているぶどうの品種を予測するモデルを作成していただきます
特別な日のディナーなど、多くの人が楽しむワイン。その種類は、赤、白、ロゼ、スパークリングなど様々ですが、原材料にはぶどうを使用します。
成熟した頃に収穫されたぶどうは、茎など余分な部分を取り除き、絞られた果汁をタンクに入れて発酵させます。その後、樽などで熟成させることで、美味しいワインが完成します。
さて、今回は、ワインの化学成分から、ぶどうの品種の予測にチャレンジしていただきます。
本コンペを活用して、SIGNATEでのデータ解析・モデル構築を体験してください。
データ概要
課題種別:分類
データ種別:多変量
学習データサンプル数:89
説明変数の数:13
欠損値:無し
データ説明
学習用データ(train.tsv)、評価用データ(test.tsv)
カラム | ヘッダ名称 | データ型 | 説明 |
---|---|---|---|
0 | id | int | インデックスとして使用 |
1 | Y | char | ワインの品種番号(1~3) |
2 | Alcohol | float | アルコール |
3 | Malic acid | float | リンゴ酸 |
4 | Alcalinity of ash | float | 灰のアルカリ性 |
5 | Ash | float | 灰 |
6 | Magnesium | int | マグネシウム |
7 | Total phenols | float | フェノール類全量 |
8 | Flavanoids | float | フラバノイド |
9 | Nonflavanoid phenols | float | 非フラバノイドフェノール類 |
10 | Proanthocyanins | float | プロアントシアニン |
11 | Color intensity | float | 色彩強度 |
12 | Hue | float | 色調 |
13 | OD280/OD315 of diluted wines | float | 蒸留ワインのOD280/OD315 |
14 | Proline | int | プロリン |
※黄色く色付けされた変数が目的変数です(評価用データには含まれません)
応募用サンプルファイル(sample_submit.csv)
1列目に評価用データの”id”を、2列目に予測した”Y”(=ワインの品種番号)を記入したファイルを、ヘッダ無しcsv形式で投稿ください。
カラム | ヘッダ名称 | データ型 | 説明 |
---|---|---|---|
0 | 無し | int | インデックスとして使用 |
1 | 無し | char | 予測したワインの品種番号(1~3) |
弊社では、データ分析依頼企業を募集しています。
お気軽にご相談ください。092-437-1110